AI News

MIT y Asari AI presentan EnCompass: un cambio de paradigma para agentes de IA fiables

El desarrollo de agentes de IA autónomos se ha visto obstaculizado durante mucho tiempo por un desafío persistente: el problema de la acumulación de errores. A medida que los modelos de lenguaje extensos (Large Language Models, LLMs) ejecutan flujos de trabajo complejos de varios pasos, una sola alucinación o un traspié lógico puede descarrilar un proceso completo, haciendo que los agentes de larga duración no sean fiables para tareas empresariales críticas. En un importante avance anunciado esta semana, investigadores del Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT (CSAIL) y la startup Asari AI han presentado EnCompass, un marco de trabajo novedoso diseñado para resolver esta crisis de fiabilidad reimaginando fundamentalmente cómo los agentes ejecutan el código.

Presentado en la conferencia NeurIPS 2025 y detallado ahora en un artículo ampliamente debatido, EnCompass introduce el concepto de "búsqueda en tiempo de inferencia (inference-time search)" en la programación de agentes. Al desacoplar la lógica central del agente de las estrategias utilizadas para buscar resultados correctos, el marco permite a los desarrolladores implementar mecanismos sofisticados de recuperación de errores, como el retroceso (backtracking) y la exploración paralela, sin tener que reescribir todo su código base.

El desafío: la fragilidad de los agentes "con programa al mando" (Program-in-Control)

Para comprender la importancia de EnCompass, primero se debe entender la arquitectura de los agentes de IA modernos. Muchos agentes de nivel empresarial operan bajo un modelo de "programa al mando" (program-in-control), donde un desarrollador define un flujo de trabajo específico (por ejemplo, "traducir este código", "analizar este informe financiero", "generar una hipótesis") y se recurre al LLM para realizar subtareas específicas.

Aunque son potentes, estos sistemas son frágiles. Los LLM no son deterministas; pueden proporcionar una respuesta brillante en un momento y una alucinación al siguiente. En un flujo de trabajo que implica docenas de pasos, la probabilidad de un error fatal se acerca a la certeza. Tradicionalmente, los desarrolladores han intentado mitigar esto escribiendo un extenso "código de pegamento" (glue code): bucles manuales, lógica de reintento y comprobaciones condicionales para detectar errores. Este enfoque, sin embargo, a menudo resulta en bases de código infladas e inmanejables donde la lógica de manejo de errores eclipsa la lógica de la tarea real.

EnCompass aborda esto tratando la ejecución de un agente no como un camino lineal, sino como un problema de búsqueda. En lugar de esperar que el modelo acierte en cada paso, el marco de trabajo reconoce que el camino "correcto" está oculto dentro de un árbol de posibilidades y proporciona las herramientas para navegar por ese árbol de manera eficiente.

Desacoplamiento de la lógica y la búsqueda: el modelo PAN

En el corazón de EnCompass se encuentra una innovación teórica llamada Nondeterminismo Angélico Probabilístico (Probabilistic Angelic Nondeterminism, PAN). Este modelo de programación permite a los desarrolladores escribir el "qué" —la secuencia de pasos que el agente debe realizar— de forma separada del "cómo" —la estrategia utilizada para navegar por esos pasos.

En la práctica, esto se logra a través de un decorador de Python, @encompass.compile. Cuando un desarrollador envuelve la función de su agente con este decorador, EnCompass compila el flujo de trabajo en un espacio de búsqueda. Los puntos en el código donde se consulta al LLM se tratan como "puntos de ramificación" (branchpoints), bifurcaciones en el camino donde la ejecución puede divergir.

Esta separación ofrece beneficios profundos:

  • Modularidad: los desarrolladores pueden cambiar la estrategia de búsqueda (pasando de un muestreo simple a búsquedas en árboles complejas) cambiando un solo parámetro, sin tocar el código del flujo de trabajo.
  • Limpieza: la lógica central permanece legible y centrada en la tarea, despojada de complejos bucles de reintento.
  • Potencia: los algoritmos de búsqueda avanzados que anteriormente eran demasiado difíciles de implementar manualmente se vuelven accesibles por defecto.

Profundización técnica: retroceso y ejecución paralela

El marco de trabajo EnCompass (EnCompass framework) dota a los agentes de capacidades que imitan la resolución de problemas humana. Cuando un experto humano llega a un callejón sin salida, retrocede a una suposición anterior e intenta un enfoque diferente. EnCompass permite que los agentes de IA hagan lo mismo mediante programación.

El marco de trabajo admite múltiples estrategias de búsqueda de forma nativa, lo que permite a los desarrolladores optimizar la velocidad, el costo o la precisión según el caso de uso.

Tabla: Estrategias de búsqueda admitidas por EnCompass

Estrategia Descripción Mejor caso de uso
Búsqueda de haz (Beam Search) Explora múltiples caminos prometedores en paralelo, manteniendo solo los k mejores candidatos en cada paso. Tareas de alto riesgo que requieren un equilibrio entre amplitud y velocidad.
Búsqueda en árboles de Monte Carlo (MCTS) Utiliza simulaciones para estimar el valor a largo plazo de las opciones actuales, centrando los recursos en las ramas más prometedoras. Tareas complejas de razonamiento de varios pasos donde las decisiones tempranas tienen consecuencias tardías.
Muestreo de lo mejor de N (Best-of-N Sampling) Genera múltiples soluciones independientes y selecciona la mejor basada en una puntuación de verificador. Tareas con resultados fácilmente verificables, como la generación de código o problemas matemáticos.
Retroceso (DFS) Explora un camino profundamente y regresa a un estado anterior si se cumple una condición de fallo. Entornos con recursos limitados donde encontrar una solución válida es suficiente.

Al estandarizar estas estrategias, EnCompass permite que un agente que intenta traducir una base de código Java a Python explore múltiples opciones de traducción para una función difícil simultáneamente. Si un camino conduce a un código que no se compila, el agente puede descartarlo y proceder con una alternativa viable, todo gestionado automáticamente por el motor de ejecución.

Rendimiento probado: el caso de estudio de Java a Python

Los investigadores validaron EnCompass a través de pruebas comparativas (benchmarking) rigurosas, destacando un caso de estudio que involucra la traducción automatizada de repositorios Java a Python, una tarea conocida por requerir alta precisión y conciencia del contexto.

Los resultados, según se detalla en el anuncio del MIT CSAIL, fueron sorprendentes. Los agentes mejorados con EnCompass mostraron una mejora del 15% al 40% en la precisión de la traducción en comparación con los agentes estándar que no utilizaban búsqueda. Quizás aún más impresionante para la comunidad de desarrolladores fue la reducción en la complejidad del código. La implementación de la lógica de búsqueda a través de EnCompass requirió aproximadamente un 80% menos de líneas de código que la implementación manual de la misma funcionalidad.

Esta ganancia de eficiencia sugiere que EnCompass podría democratizar la creación de agentes de IA robustos. Los equipos más pequeños, que anteriormente no podían permitirse la carga de ingeniería de construir algoritmos de búsqueda personalizados, ahora pueden desplegar agentes que rivalizan con la fiabilidad de los construidos por los gigantes tecnológicos.

Implicaciones para la industria: fiabilidad a escala

Para el sector empresarial, la llegada de EnCompass señala una maduración de la ingeniería de IA. Estamos pasando de la era de la "ingeniería de prompts" (prompt engineering) —ajustar texto para engatusar a un modelo para que funcione— a la "ingeniería de flujos" (flow engineering) y la "ingeniería de búsqueda" (search engineering), donde la arquitectura sistémica garantiza la fiabilidad.

Zhening Li, autor principal e investigador tanto en el MIT CSAIL como en Asari AI, enfatizó que EnCompass no es un reemplazo para marcos como LangChain, sino una capa complementaria. Mientras que LangChain orquesta las herramientas y los prompts, EnCompass gestiona la trayectoria de toma de decisiones.

Implicaciones clave para la IA empresarial:

  1. Previsibilidad: al validar múltiples caminos, es menos probable que los agentes devuelvan resultados "alucinados" o no funcionales.
  2. Auditabilidad: la separación de la búsqueda y la lógica hace que sea más fácil depurar por qué un agente tomó una decisión específica.
  3. Escalabilidad: a medida que los agentes abordan horizontes más largos —como diseñar planos de hardware o realizar experimentos científicos— la capacidad de recuperarse de errores sin reiniciar se vuelve crítica.

Mirando hacia el futuro: el futuro de la búsqueda agéntica

El lanzamiento de EnCompass se alinea con una tendencia más amplia en la industria de la IA: el cambio hacia el "cómputo en tiempo de inferencia" (inference-time compute). Al igual que los recientes modelos de razonamiento de OpenAI dedican más tiempo a "pensar" antes de responder, los marcos de trabajo como EnCompass permiten a los desarrolladores intercambiar recursos computacionales por una mayor fiabilidad en la capa de aplicación.

Asari AI y el equipo del MIT vislumbran un futuro en el que EnCompass permita a los agentes actuar como verdaderos colaboradores en el descubrimiento. Imagine un agente encargado de diseñar un nuevo compuesto químico. Utilizando MCTS a través de EnCompass, el agente podría explorar miles de estructuras moleculares potenciales, retroceder cuando un camino de síntesis resulte imposible y presentar al científico humano solo los candidatos más viables.

Al resolver eficazmente el problema de la acumulación de errores, EnCompass bien podría ser la infraestructura que faltaba para llevar a los agentes de IA de ser juguetes experimentales a sistemas de producción críticos.

Referencias y lecturas adicionales

  • MIT News: "Helping AI agents search to get best results from LLMs" (Feb 2026)
  • HPCWire: "New MIT Framework Uses Search to Handle LLM Errors in AI Agents"
  • Artificial Intelligence News: "How separating logic and search boosts AI agent scalability"
  • NeurIPS 2025 Proceedings: "ENCOMPASS: Enhancing Agent Programming with Search Over Program Execution Paths"
Destacados
ex ads 202603311112
1111111111111
BlazeGard
Blazeguard brinda una seguridad contra incendios inigualable a través de tecnología innovadora de revestimiento resistente al fuego.
Test Face Swap
Test Face Swap Test Face Swap Test Face Swap Test Face Swap Test Face Swap Test Face Swap
Midjourney for Slack
Lleve imágenes generadas por IA directamente a su espacio de trabajo de Slack con Midjourney para Slack.
AI Bot Eye
Transforma tu seguridad con tecnología de vigilancia impulsada por IA.
amy
Amy es un asistente integral en el lugar de trabajo que simplifica tareas, programa reuniones y gestiona proyectos.
sharkfoto-20250108-quick
Remove background from the image with just one click and convert the image to or from 200+ formats.
test 2 face swap 2
test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face
Gptzero me
GPTZero es una herramienta para detectar texto generado por IA de manera precisa y fácil.
sharkfoto-20250108-free
AI-powered tool for background removal and image conversion in over 200 formats.
BGRemover
Elimina fácilmente los fondos de imágenes en línea con SharkFoto BGRemover.
sharkfoto agent test 202510111844
SharkFoto offers AI-powered free photo editing tools including background removal and colorization.
WorkViz
Workviz: Una plataforma impulsada por IA que optimiza el rendimiento del equipo a través de análisis completos.
FreeAiKit
FreeAiKit ofrece una colección de herramientas de IA gratuitas para diversas necesidades de creación de contenido.
TAROT ARCANA
Descubre tu futuro con Tarot Arcana, una aplicación de lectura de tarot impulsada por IA.
Skywork
Skywork transforma entradas simples en contenido multimodal como informes y diapositivas.
sharkfoto svip 20250715
BrowseGPTs
Directorio actualizado diariamente para diversos modelos de ChatGPT.
blockbank
Aplicación de nuevo banco criptográfico todo-en-uno que combina tecnologías DeFi y CeFi.
Sharkfoto Quick 091801
SharkFoto offers free AI-powered image editing tools including background removal and photo colorization.
Neuronwriter
Herramienta avanzada para la optimización de contenido utilizando modelos semánticos.
Novel
Novel te ayuda a crear un perfil profesional integral.
AI Fortunist (AI-Powered Tarot Readings)
AI Fortunist proporciona lecturas de tarot personalizadas, lecturas de café e interpretaciones de sueños utilizando IA avanzada.
ParrotPDF
ParrotPDF permite a los usuarios interactuar de manera interactiva con archivos PDF.
Flove
Flove es una aplicación de seguimiento de movimientos minimalista con características innovadoras.
Franklin AI
Herramienta de IA para simplificar las operaciones comerciales y mejorar la toma de decisiones.
Durable AI
Constructor de sitios web impulsado por IA para poner su negocio en línea en 30 segundos.
JungGPT
Una herramienta de IA para la reflexión emocional y la comprensión psicológica.
ChartX
Documentación médica impulsada por IA para un cuidado de pacientes eficiente y preciso.
eztalks-20250226-0424003
Elimina fondos de imágenes y convierte formatos de imagen sin esfuerzo con SharkFoto.
Udemy Summary with ChatGPT
Resume los videos de Udemy con ChatGPT y toma notas sin esfuerzo.
Astro Answer New Tab
Descubre la astrología con horóscopos personalizados generados por IA.
aiBot копирайтер
Mejora tu texto sin esfuerzo con aiBot копирайтер.
PageSage
PageSage simplifica la navegación web generando preguntas y respuestas al instante.
GPU Finder
GPU Finder ayuda a descubrir instancias de GPU disponibles de proveedores de nube pública global.
Skyworker
Plataforma impulsada por IA para buscadores de empleo en tecnología y reclutadores.
Craft
Craft es una poderosa herramienta de creación de documentos y colaboración para equipos e individuos.
GottaMeme. AI Meme Generator
Crea memes hilarantes sin esfuerzo con el generador impulsado por IA de GottaMeme.
Recap
Resume fácilmente cualquier parte de una página web con Recap, una extensión de navegador de código abierto que utiliza ChatGPT.
kimi quick test 20250417-121312223
Kimi es una herramienta de IA innovadora diseñada para aumentar la productividad y el apoyo.
Magazine Luiza
Asistente de compras eficiente para usuarios de Magazine Luiza.
sharkfoto svip test 202512241034
SharkFoto es una plataforma impulsada por IA para crear y editar videos, imágenes y música sin esfuerzo.
Bigjpg AI
Bigjpg mejora la calidad de las imágenes mediante escalado avanzado por IA.
kimi test 20250328-3
Mejora, transforma y edita imágenes con herramientas impulsadas por IA de forma gratuita.
viddo.ai
Veo3 by Viddo AI enables AI-powered text or image to high-quality video creation rapidly.
Simplifly
Resume artículos largos fácilmente con Simplifly.
BearGPT - Chatgpt Enhancer
Mejore su experiencia con ChatGPT con BearGPT para una mejor navegación y personalización.
2026 Face Swap
2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Fac
TextPal
TextPal utiliza IA para resumir y gestionar textos de páginas web sin esfuerzo.
AlgoDocs
AlgoDocs: extracción de datos de documentos impulsada por IA hecha fácil.
Audioread: Ultra-Realistic Text-to-Speech
Escucha artículos con voces AI ultra-realistas.
GPTXtend
Mejore su experiencia con ChatGPT con potentes herramientas de compartición.
Free Email Extractor from Website
Herramienta gratuita de extracción de correos electrónicos para raspar correos electrónicos, números de teléfono y perfiles sociales de sitios web.
Skypher
Agiliza tus revisiones de seguridad con la automatización de Skypher.
AI PDF chatbot agent built with LangChain & LangGraph
SharkFoto ofrece herramientas gratuitas de edición de fotos con inteligencia artificial para eliminar fondos, colorear, mejorar y cambiar el tamaño de imágenes.
Wan 2.2-test
Wan 2 AI offers fast, high-quality 1080p AI video generation with advanced motion control.
Tappy AI
Extensión de navegador AI para añadir comentarios reflexivos a publicaciones de LinkedIn.
sharkfoto-svip-092202
SharkFoto offers free AI-powered image editing tools like background removal and coloring.
Letz DM
Automatiza el marketing de influencers en TikTok sin complicaciones.
Belly Buddy
Realiza un seguimiento de la ingesta de alimentos y los síntomas digestivos con Belly Buddy.
sharkfoto svip test 202509221443
SharkFoto offers free AI-powered photo editing tools for automatic background removal and image enhancement.
sharkfoto-svip-0922-changename
SharkFoto ofrece herramientas fotográficas gratuitas con tecnología de IA para eliminar fondos automáticamente y mejorar imágenes.
Alltum
Organiza correos electrónicos, tareas y archivos con gestión de proyectos impulsada por IA.

MIT presenta EnCompass, un framework para optimizar el rendimiento de agentes de IA mediante búsqueda

Investigadores del MIT CSAIL presentan EnCompass, un framework innovador que utiliza backtracking y búsqueda paralela para mejorar drásticamente la fiabilidad y la eficiencia de los agentes de IA.