AI News

MIT e Asari AI apresentam o EnCompass: Uma Mudança de Paradigma para Agentes de IA Confiáveis

O desenvolvimento de agentes de IA autónomos (autonomous AI agents) tem sido dificultado há muito tempo por um desafio persistente: o problema do erro composto (compounding error problem). À medida que os grandes modelos de linguagem (large language models - LLMs) executam fluxos de trabalho complexos e de várias etapas, uma única alucinação (hallucination) ou um erro lógico pode descarrilar um processo inteiro, tornando os agentes de longa execução pouco confiáveis para tarefas empresariais críticas. Num grande avanço anunciado esta semana, investigadores do Laboratório de Ciência da Computação e Inteligência Artificial do MIT (CSAIL) e da startup Asari AI revelaram o EnCompass, um novo framework concebido para resolver esta crise de fiabilidade ao reimaginar fundamentalmente a forma como os agentes executam código.

Apresentado na conferência NeurIPS 2025 e agora detalhado num artigo amplamente discutido, o EnCompass introduz o conceito de "pesquisa em tempo de inferência (inference-time search)" na programação de agentes. Ao dissociar a lógica central do agente das estratégias utilizadas para procurar resultados corretos, o framework permite que os desenvolvedores implementem mecanismos sofisticados de recuperação de erros — tais como retrocesso (backtracking) e exploração paralela — sem reescrever todo o seu código-base.

O Desafio: A Fragilidade dos Agentes "Program-in-Control"

Para compreender a importância do EnCompass, é necessário primeiro entender a arquitetura dos agentes de IA modernos. Muitos agentes de nível empresarial operam num modelo de "programa no controlo" (program-in-control), onde um desenvolvedor define um fluxo de trabalho específico (ex: "traduzir este código", "analisar este relatório financeiro", "gerar uma hipótese") e o LLM é chamado para realizar sub-tarefas específicas.

Embora poderosos, estes sistemas são frágeis. Os LLMs são não-determinísticos; podem fornecer uma resposta brilhante num momento e uma alucinação no momento seguinte. Num fluxo de trabalho que envolve dezenas de etapas, a probabilidade de um erro fatal aproxima-se da certeza. Tradicionalmente, os desenvolvedores tentaram mitigar isto escrevendo extenso "código de ligação" (glue code) — loops manuais, lógica de repetição e verificações condicionais para capturar erros. Esta abordagem, no entanto, resulta frequentemente em códigos-base inchados e ingovernáveis, onde a lógica de tratamento de erros eclipsa a lógica da tarefa real.

O EnCompass aborda isto tratando a execução de um agente não como um caminho linear, mas como um problema de pesquisa. Em vez de esperar que o modelo acerte em todos os passos, o framework reconhece que o caminho "correto" está escondido dentro de uma árvore de possibilidades e fornece as ferramentas para navegar nessa árvore de forma eficiente.

Dissociando a Lógica da Pesquisa: O Modelo PAN

No coração do EnCompass reside uma inovação teórica chamada Nondeterminismo Angélico Probabilístico (Probabilistic Angelic Nondeterminism) (PAN). Este modelo de programação permite aos desenvolvedores escrever o "quê" — a sequência de etapas que o agente deve realizar — separadamente do "como" — a estratégia utilizada para navegar nessas etapas.

Na prática, isto é alcançado através de um decorador Python, @encompass.compile. Quando um desenvolvedor envolve a função do seu agente com este decorador, o EnCompass compila o fluxo de trabalho num espaço de pesquisa. Os pontos no código onde o LLM é consultado são tratados como "pontos de ramificação" (branchpoints) — bifurcações na estrada onde a execução pode divergir.

Esta separação oferece benefícios profundos:

  • Modularidade: Os desenvolvedores podem alterar a estratégia de pesquisa (mudando de uma amostragem simples para pesquisas em árvore complexas) alterando um único parâmetro, sem tocar no código do fluxo de trabalho.
  • Limpeza: A lógica central permanece legível e focada na tarefa, despida de loops de repetição complexos.
  • Poder: Algoritmos de pesquisa avançados que anteriormente eram demasiado difíceis de implementar manualmente tornam-se acessíveis por defeito.

Mergulho Técnico: Retrocesso e Execução Paralela

O framework EnCompass capacita os agentes com capacidades que mimetizam a resolução de problemas humana. Quando um especialista humano atinge um beco sem saída, ele retrocede a uma suposição anterior e tenta uma abordagem diferente. O EnCompass permite que os agentes de IA façam o mesmo programaticamente.

O framework suporta múltiplas estratégias de pesquisa nativamente, permitindo que os desenvolvedores otimizem a velocidade, o custo ou a precisão, dependendo do caso de uso.

Tabela: Estratégias de Pesquisa Suportadas pelo EnCompass

Estratégia Descrição Melhor Caso de Uso
Beam Search Explora múltiplos caminhos promissores em paralelo, mantendo apenas os k melhores candidatos em cada etapa. Tarefas de alto risco que exigem um equilíbrio entre amplitude e velocidade.
Monte Carlo Tree Search (MCTS) Utiliza simulações para estimar o valor a longo prazo das escolhas atuais, focando os recursos nos ramos mais promissores. Tarefas de raciocínio complexas de várias etapas onde as decisões iniciais têm consequências tardias.
Best-of-N Sampling Gera múltiplas soluções independentes e seleciona a melhor com base numa pontuação de verificador. Tarefas com resultados facilmente verificáveis, como geração de código ou problemas matemáticos.
Backtracking (DFS) Explora um caminho profundamente e retorna a um estado anterior se uma condição de falha for encontrada. Ambientes com restrição de recursos onde encontrar uma solução válida é suficiente.

Ao padronizar estas estratégias, o EnCompass permite que um agente que tenta traduzir um código-base Java para Python explore múltiplas opções de tradução para uma função complexa simultaneamente. Se um caminho levar a um código que não compila, o agente pode descartá-lo e prosseguir com uma alternativa viável, tudo gerido automaticamente pelo motor de execução.

Desempenho Comprovado: O Caso de Estudo Java-para-Python

Os investigadores validaram o EnCompass através de benchmarking rigoroso, nomeadamente um caso de estudo envolvendo a tradução automatizada de repositórios Java para Python — uma tarefa notória por exigir elevada precisão e consciência do contexto.

Os resultados, conforme detalhados no anúncio do MIT CSAIL, foram impressionantes. Os agentes melhorados com o EnCompass mostraram uma melhoria de 15% a 40% na precisão da tradução em comparação com agentes padrão que não utilizaram pesquisa. Talvez ainda mais impressionante para a comunidade de desenvolvedores tenha sido a redução na complexidade do código. A implementação da lógica de pesquisa através do EnCompass exigiu aproximadamente 80% menos linhas de código do que a implementação manual da mesma funcionalidade.

Este ganho de eficiência sugere que o EnCompass poderia democratizar a criação de agentes de IA robustos. Equipas mais pequenas, anteriormente incapazes de suportar a sobrecarga de engenharia de construir algoritmos de pesquisa personalizados, podem agora implementar agentes que rivalizam com a fiabilidade daqueles construídos por gigantes tecnológicos.

Implicações para a Indústria: Fiabilidade em Escala

Para o setor empresarial, a chegada do EnCompass sinaliza uma maturação da engenharia de IA. Estamos a passar da era da "engenharia de prompts" (prompt engineering) — ajustar texto para convencer um modelo a funcionar — para a "engenharia de fluxo" (flow engineering) e "engenharia de pesquisa" (search engineering), onde a arquitetura sistémica garante a fiabilidade.

Zhening Li, o autor principal e investigador tanto no MIT CSAIL como na Asari AI, enfatizou que o EnCompass não é um substituto para frameworks como o LangChain, mas sim uma camada complementar. Enquanto o LangChain orquestra as ferramentas e os prompts, o EnCompass gere a trajetória de tomada de decisão.

Principais Implicações para a IA Empresarial:

  1. Previsibilidade: Ao validar múltiplos caminhos, os agentes têm menos probabilidade de retornar resultados "alucinados" ou não funcionais.
  2. Auditabilidade: A separação entre pesquisa e lógica torna mais fácil depurar por que razão um agente tomou uma decisão específica.
  3. Escalabilidade: À medida que os agentes abordam horizontes mais longos — como projetar plantas de hardware ou realizar experiências científicas — a capacidade de recuperar de erros sem reiniciar torna-se crítica.

Olhando para o Futuro: O Futuro da Pesquisa de Agentes

O lançamento do EnCompass alinha-se com uma tendência mais ampla na indústria da IA: a mudança para o "computação em tempo de inferência" (inference-time compute). Tal como os recentes modelos de raciocínio da OpenAI dedicam mais tempo a "pensar" antes de responder, frameworks como o EnCompass permitem que os desenvolvedores troquem recursos computacionais por uma maior fiabilidade na camada da aplicação.

A Asari AI e a equipa do MIT vislumbram um futuro onde o EnCompass permite que os agentes atuem como verdadeiros colaboradores na descoberta. Imagine um agente encarregado de projetar um novo composto químico. Usando MCTS via EnCompass, o agente poderia explorar milhares de potenciais estruturas moleculares, retroceder quando um caminho de síntese se revela impossível e apresentar ao cientista humano apenas os candidatos mais viáveis.

Ao resolver eficazmente o problema da acumulação de erros, o EnCompass pode muito bem ser a infraestrutura que faltava para levar os agentes de IA de brinquedos experimentais a sistemas de produção críticos.

Referências e Leituras Adicionais

  • MIT News: "Helping AI agents search to get best results from LLMs" (Fev 2026)
  • HPCWire: "New MIT Framework Uses Search to Handle LLM Errors in AI Agents"
  • Artificial Intelligence News: "How separating logic and search boosts AI agent scalability"
  • NeurIPS 2025 Proceedings: "ENCOMPASS: Enhancing Agent Programming with Search Over Program Execution Paths"
Em Destaque
ex ads 202603311112
1111111111111
BlazeGard
Blazeguard fornece segurança contra incêndios incomparável através de tecnologia de revestimento resistente ao fogo inovadora.
Test Face Swap
Test Face Swap Test Face Swap Test Face Swap Test Face Swap Test Face Swap Test Face Swap
Midjourney for Slack
Leve imagens geradas por IA diretamente para seu workspace Slack com Midjourney para Slack.
AI Bot Eye
Transforme sua segurança com tecnologia de vigilância impulsionada por IA.
amy
Amy é uma assistente abrangente de escritório que simplifica tarefas, agenda reuniões e gerencia projetos.
sharkfoto-20250108-quick
Remove background from the image with just one click and convert the image to or from 200+ formats.
test 2 face swap 2
test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face
Gptzero me
GPTZero é uma ferramenta para detectar texto gerado por AI com precisão e facilidade.
sharkfoto-20250108-free
AI-powered tool for background removal and image conversion in over 200 formats.
BGRemover
Remova facilmente os fundos de imagens online com o SharkFoto BGRemover.
sharkfoto agent test 202510111844
SharkFoto offers AI-powered free photo editing tools including background removal and colorization.
WorkViz
Workviz: Plataforma movida por IA que otimiza o desempenho da equipe através de análises abrangentes.
FreeAiKit
FreeAiKit oferece uma coleção de ferramentas de IA gratuitas para várias necessidades de criação de conteúdo.
TAROT ARCANA
Desvende seu futuro com o Tarot Arcana, um aplicativo de leitura de tarô alimentado por IA.
Skywork
Skywork transforma entradas simples em conteúdo multimodal, como relatórios e slides.
sharkfoto svip 20250715
BrowseGPTs
Diretório atualizado diariamente de diversos modelos ChatGPT.
blockbank
Aplicativo de neo-banco criptográfico tudo-em-um que combina tecnologias DeFi e CeFi.
Sharkfoto Quick 091801
SharkFoto offers free AI-powered image editing tools including background removal and photo colorization.
Neuronwriter
Ferramenta avançada para otimização de conteúdo usando modelos semânticos.
Novel
O Novel ajuda você a criar um perfil profissional abrangente.
AI Fortunist (AI-Powered Tarot Readings)
AI Fortunist fornece leitura de tarô personalizada, leitura de café e interpretações de sonhos usando IA avançada.
ParrotPDF
ParrotPDF permite que os usuários interajam com arquivos PDF de forma interativa.
Flove
Flove é um aplicativo de rastreamento de movimento minimalista com recursos inovadores.
Franklin AI
Ferramenta de IA para simplificar operações comerciais e melhorar a tomada de decisões.
Durable AI
Construtor de sites impulsionado por IA para colocar seu negócio online em 30 segundos.
JungGPT
Uma ferramenta de IA para reflexão emocional e insights psicológicos.
ChartX
Documentação médica potenciada por IA para cuidados eficientes e precisos com pacientes.
eztalks-20250226-0424003
Remova fundos de imagens e converta formatos de imagem sem esforço com o SharkFoto.
Udemy Summary with ChatGPT
Resuma vídeos do Udemy com ChatGPT e faça anotações sem esforço.
Astro Answer New Tab
Descubra a astrologia com horóscopos personalizados gerados por IA.
aiBot копирайтер
Melhore seu texto sem esforço com aiBot копирайтер.
PageSage
PageSage simplifica a navegação na web gerando perguntas e respostas instantaneamente.
GPU Finder
O GPU Finder ajuda a descobrir instâncias de GPU disponíveis de provedores de nuvem pública global.
Skyworker
Plataforma impulsionada por IA para candidatos a empregos em tecnologia e recrutadores.
Craft
Craft é uma ferramenta poderosa de criação e colaboração de documentos para equipes e indivíduos.
GottaMeme. AI Meme Generator
Crie memes hilários sem esforço com o gerador de IA do GottaMeme.
Recap
Resuma facilmente qualquer parte de uma página da web com o Recap, uma extensão de navegador de código aberto que utiliza o ChatGPT.
kimi quick test 20250417-121312223
Kimi é uma ferramenta de IA inovadora projetada para produtividade e suporte.
Magazine Luiza
Assistente de compras eficiente para usuários do Magazine Luiza.
sharkfoto svip test 202512241034
SharkFoto é uma plataforma com IA para criar e editar vídeos, imagens e músicas com facilidade.
Bigjpg AI
Bigjpg melhora a qualidade das imagens através de upscale avançado de IA.
kimi test 20250328-3
Aprimore, transforme e edite imagens com ferramentas alimentadas por IA gratuitamente.
viddo.ai
Veo3 by Viddo AI enables AI-powered text or image to high-quality video creation rapidly.
Simplifly
Resuma artigos longos facilmente com o Simplifly.
BearGPT - Chatgpt Enhancer
Aprimore sua experiência com o ChatGPT com o BearGPT para melhor navegação e personalização.
2026 Face Swap
2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Fac
TextPal
O TextPal utiliza IA para resumir e gerenciar textos de páginas da web sem esforço.
AlgoDocs
AlgoDocs: Extração de dados de documentos com inteligência artificial facilitada.
Audioread: Ultra-Realistic Text-to-Speech
Ouça artigos com vozes AI ultra-realistas.
GPTXtend
Melhore sua experiência com ChatGPT com poderosas ferramentas de compartilhamento.
Free Email Extractor from Website
Ferramenta gratuita de extração de e-mails para coletar e-mails, números de telefone e perfis sociais de sites.
Skypher
Agilize suas avaliações de segurança com a automação do Skypher.
AI PDF chatbot agent built with LangChain & LangGraph
SharkFoto oferece ferramentas gratuitas de edição de fotos com inteligência artificial para remoção de fundo, colorização, aprimoramento e redimensionamento de imagens.
Wan 2.2-test
Wan 2 AI offers fast, high-quality 1080p AI video generation with advanced motion control.
Tappy AI
Extensão de navegador AI para adicionar comentários reflexivos em posts do LinkedIn.
sharkfoto-svip-092202
SharkFoto offers free AI-powered image editing tools like background removal and coloring.
Letz DM
Automatize o marketing de influenciadores no TikTok sem complicações.
Belly Buddy
Acompanhe a ingestão de alimentos e sintomas digestivos com Belly Buddy.
sharkfoto svip test 202509221443
SharkFoto offers free AI-powered photo editing tools for automatic background removal and image enhancement.
sharkfoto-svip-0922-changename
SharkFoto oferece ferramentas fotográficas gratuitas com IA para remover fundos automaticamente e melhorar imagens.
Alltum
Organiza e-mails, tarefas e arquivos com gerenciamento de projetos impulsionado por IA.

MIT revela o framework EnCompass para otimizar o desempenho de agentes de IA por meio de busca

Pesquisadores do MIT CSAIL apresentam o EnCompass, um framework inovador que usa backtracking e busca paralela para melhorar dramaticamente a confiabilidade e a eficiência de agentes de IA.