AI News

MITとAsari AIがEnCompassを発表:信頼性の高いAIエージェントに向けたパラダイムシフト

自律型AIエージェントの開発は、長い間「累積誤差問題(compounding error problem)」という根強い課題によって妨げられてきました。大規模言語モデル(LLM)が複雑で多段階のワークフローを実行する際、たった一つのハルシネーション(幻覚)や論理的なミスがプロセス全体を脱線させてしまい、長時間実行されるエージェントを重要な企業タスクにおいて信頼できないものにしてしまいます。今週発表された大きな進展として、MIT計算機科学・人工知能研究所(CSAIL)とスタートアップ企業のAsari AIの研究者たちは、エージェントによるコード実行の方法を根本的に再考することで、この信頼性の危機を解決するために設計された新しいフレームワーク、EnCompassを公開しました。

NeurIPS 2025カンファレンスで発表され、現在広く議論されている論文で詳細が記されているEnCompassは、エージェントプログラミングに「推論時探索(inference-time search)」という概念を導入します。エージェントのコアロジックを、正しい結果を探索するために使用される戦略から切り離すことで、このフレームワークは、コードベース全体を書き換えることなく、バックトラッキング(後戻り)や並列探索といった洗練されたエラー回復メカニズムを開発者が実装することを可能にします。

課題:「プログラム制御型」エージェントの脆弱性

EnCompassの重要性を理解するには、まず現代のAIエージェントのアーキテクチャを理解する必要があります。多くのエンタープライズ級のエージェントは「プログラム制御(program-in-control)」モデルで動作しており、開発者が特定のワークフロー(例:「このコードを翻訳する」「この財務報告書を分析する」「仮説を生成する」)を定義し、LLMが特定のサブタスクを実行するために呼び出されます。

これらのシステムは強力ですが、脆弱です。LLMは非決定論的であり、ある瞬間には素晴らしい回答を提供しても、次の瞬間にはハルシネーションを起こす可能性があります。数十のステップが含まれるワークフローでは、致命的なエラーが発生する確率は確実性に近づきます。従来、開発者は膨大な「グルーコード(glue code)」、つまりエラーをキャッチするための手動のループ、リトライロジック、条件チェックを記述することで、これを軽減しようとしてきました。しかし、このアプローチは、エラー処理ロジックが実際のタスクロジックを凌駕してしまうような、肥大化して管理不能なコードベースを招くことがよくあります。

EnCompassは、エージェントの実行を線形な経路としてではなく、探索問題(search problem)として扱うことでこれに対処します。 モデルがすべてのステップを正しく実行することを期待する代わりに、このフレームワークは「正しい」経路が可能性のツリーの中に隠されていることを認め、そのツリーを効率的にナビゲートするためのツールを提供します。

ロジックと探索の分離:PANモデル

EnCompassの核心には、**確率的天使的非決定性(Probabilistic Angelic Nondeterminism / PAN)**と呼ばれる理論的な革新があります。このプログラミングモデルにより、開発者はエージェントが実行すべき「何(what)」、つまりステップのシーケンスを、それらのステップをナビゲートするために使用される戦略である「いかに(how)」から切り離して記述することができます。

実際には、これはPythonのデコレータ @encompass.compile を通じて実現されます。開発者がエージェントの関数をこのデコレータでラップすると、EnCompassはワークフローを探索空間へとコンパイルします。LLMがクエリされるコード内のポイントは「分岐点(branchpoints)」、つまり実行が分岐する可能性のある分かれ道として扱われます。

この分離には、次のような大きな利点があります。

  • モジュール性: ワークフローのコードに触れることなく、単一のパラメータを変更するだけで、開発者は探索戦略を変更(単純なサンプリングから複雑なツリー探索への切り替えなど)できます。
  • クリーンさ: コアロジックは読みやすいままで、複雑なリトライループを取り除き、タスクに集中した状態を維持できます。
  • パワー: 以前は手動で実装するのが困難すぎた高度な探索アルゴリズムが、デフォルトで利用可能になります。

技術的な深掘り:バックトラッキングと並列実行

EnCompassフレームワークは、人間の問題解決を模倣した機能をエージェントに与えます。人間の専門家が行き止まりに突き当たったとき、彼らは以前の仮定に立ち戻り(バックトラック)、別の方法を試します。EnCompassは、AIエージェントがプログラム的に同じことを行うことを可能にします。

このフレームワークは、複数の探索戦略を標準でサポートしており、開発者はユースケースに応じて速度、コスト、または精度を最適化できます。

表:EnCompassがサポートする探索戦略

戦略 説明 最適なユースケース
ビーム探索(Beam Search) 各ステップで上位 k 個の候補のみを保持しながら、複数の有望な経路を並行して探索する。 広範さと速度のバランスが必要な、リスクの高いタスク。
モンテカルロ木探索(MCTS) シミュレーションを使用して現在の選択の長期的な価値を推定し、最も有望なブランチにリソースを集中させる。 初期の決定が後に影響を及ぼす、複雑で多段階の推論タスク。
Best-of-Nサンプリング 複数の独立した解決策を生成し、検証スコアに基づいて最適なものを選択する。 コード生成や数学の問題など、出力の検証が容易なタスク。
バックトラッキング(DFS) 経路を深く探索し、失敗条件が満たされた場合に以前の状態に戻る。 1つの有効な解決策を見つければ十分な、リソースに制約のある環境。

これらの戦略を標準化することで、EnCompassは、JavaのコードベースをPythonに翻訳しようとするエージェントが、トリッキーな関数に対して複数の翻訳オプションを同時に探索することを可能にします。ある経路がコンパイルに失敗するコードにつながった場合、エージェントはそれを破棄して実行可能な代替案を進めることができ、これらはすべてランタイムエンジンによって自動的に処理されます。

実証されたパフォーマンス:JavaからPythonへのケーススタディ

研究者たちは、厳格なベンチマークを通じてEnCompassを検証しました。特に注目すべきは、JavaのリポジトリをPythonに自動翻訳するケーススタディです。これは、高い精度とコンテキストの認識が要求されることで知られるタスクです。

MIT CSAILの発表で詳述されている通り、その結果は驚くべきものでした。EnCompassで強化されたエージェントは、探索を使用しない標準的なエージェントと比較して、翻訳精度が15%から40%向上しました。開発者コミュニティにとってさらにおそらく印象的だったのは、コードの複雑さの軽減です。EnCompassを介して探索ロジックを実装する場合、同じ機能を手動で実装するよりもコード行数が約80%少なくて済みました

この効率性の向上は、EnCompassが堅牢なAIエージェントの作成を民主化できる可能性を示唆しています。以前はカスタム探索アルゴリズムを構築するためのエンジニアリングのオーバーヘッドを賄えなかった小規模なチームでも、テクノロジー大手が構築したものに匹敵する信頼性を持つエージェントをデプロイできるようになります。

業界への影響:大規模な信頼性

エンタープライズ部門にとって、EnCompassの登場はAIエンジニアリングの成熟を象徴しています。私たちは、モデルを動かすためにテキストを調整する「プロンプトエンジニアリング(prompt engineering)」の時代から、システムアーキテクチャが信頼性を保証する「フローエンジニアリング(flow engineering)」や「探索エンジニアリング(search engineering)」の時代へと移行しつつあります。

MIT CSAILおよびAsari AIの研究者であり、主著者であるZhening Li氏は、EnCompassはLangChainのようなフレームワークの代わりではなく、補完的なレイヤーであると強調しました。LangChainがツールやプロンプトをオーケストレートする一方で、EnCompassは意思決定の軌道を管理します。

エンタープライズAIへの主な影響:

  1. 予測可能性: 複数の経路を検証することで、エージェントが「ハルシネーション」を起こしたり、機能しない結果を返したりする可能性が低くなります。
  2. 監査可能性: 探索とロジックが分離されているため、エージェントがなぜ特定の決定を下したのかをデバッグしやすくなります。
  3. スケーラビリティ: ハードウェアの設計図作成や科学実験の実施など、エージェントがより長期的な展望に取り組むようになると、再起動せずにエラーから回復する能力が不可欠になります。

今後の展望:エージェント探索の未来

EnCompassのリリースは、AI業界のより広範なトレンドである「推論時計算(inference-time compute)」へのシフトと一致しています。OpenAIの最近の推論モデルが回答前に「思考」するためにより多くの時間を割くのと同様に、EnCompassのようなフレームワークにより、開発者はアプリケーションレイヤーで計算リソースをより高い信頼性と引き換えにすることができます。

Asari AIとMITのチームは、EnCompassによってエージェントが発見における真の協力者として行動できる未来を構想しています。新しい化合物の設計を任されたエージェントを想像してみてください。EnCompassを介したMCTSを使用することで、エージェントは何千もの潜在的な分子構造を探索し、合成経路が不可能であると判明した場合にはバックトラックし、最も実行可能な候補のみを人間の科学者に提示することができます。

誤差蓄積問題を効果的に解決することで、EnCompassはAIエージェントを実験的な玩具から重要なプロダクションシステムへと進化させるために必要な、ミッシングリンク(欠けていたインフラ)となるかもしれません。

参考文献およびさらなる読み物

  • MIT News: "Helping AI agents search to get best results from LLMs" (Feb 2026)
  • HPCWire: "New MIT Framework Uses Search to Handle LLM Errors in AI Agents"
  • Artificial Intelligence News: "How separating logic and search boosts AI agent scalability"
  • NeurIPS 2025 Proceedings: "ENCOMPASS: Enhancing Agent Programming with Search Over Program Execution Paths"
フィーチャー
ex ads 202603311112
1111111111111
BlazeGard
Blazeguardは、革新的な耐火性被覆技術を通じて比類のない火災安全を提供します。
Test Face Swap
Test Face Swap Test Face Swap Test Face Swap Test Face Swap Test Face Swap Test Face Swap
Midjourney for Slack
Midjourney for Slackを使用して、AI生成画像を直接Slackワークスペースに取り込むことができます。
AI Bot Eye
AI駆動の監視技術でセキュリティを変革します。
amy
Amyは、タスクを合理化し、会議をスケジュールし、プロジェクトを管理する総合的な職場アシスタントです。
sharkfoto-20250108-quick
Remove background from the image with just one click and convert the image to or from 200+ formats.
test 2 face swap 2
test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face
Gptzero me
GPTZeroは、AI生成テキストを正確かつ簡単に検出するツールです。
sharkfoto-20250108-free
AI-powered tool for background removal and image conversion in over 200 formats.
BGRemover
SharkFoto BGRemoverでオンラインで簡単に画像の背景を削除できます。
sharkfoto agent test 202510111844
SharkFoto offers AI-powered free photo editing tools including background removal and colorization.
WorkViz
Workviz:包括包括された分析を通じてチーム成績を最適化するAI駆動プラットフォーム。
FreeAiKit
FreeAiKitは、さまざまなコンテンツ作成ニーズに対応する無料のAIツールのコレクションを提供します。
TAROT ARCANA
タロット・アルカナであなたの未来を明らかにしましょう。AI搭載のタロットカードリーディングアプリです。
Skywork
Skyworkは、シンプルな入力をレポートやスライドのようなマルチモーダルコンテンツに変換します。
sharkfoto svip 20250715
BrowseGPTs
多様なChatGPTモデルの毎日更新されるディレクトリ。
blockbank
DeFiとCeFi技術を組み合わせたオールインワン暗号通貨ネオバンキングアプリ。
Sharkfoto Quick 091801
SharkFoto offers free AI-powered image editing tools including background removal and photo colorization.
Neuronwriter
意味論モデルを使用したコンテンツ最適化のための高度なツール。
Novel
Novelは、包括的なプロフェッショナルプロフィールを作成するのに役立ちます。
AI Fortunist (AI-Powered Tarot Readings)
AIフォーチュニストは、先進的なAIを使用して、パーソナライズされたタロットリーディング、コーヒーリーディング、夢の解釈を提供します。
ParrotPDF
ParrotPDFは、ユーザーがPDFファイルと対話的に関わることを可能にします。
Flove
Floveは革新的な機能を備えたミニマリストの動き追跡アプリです。
Franklin AI
ビジネス運営を効率化し、意思決定を強化するためのAIツール。
Durable AI
AI搭載のウェブサイトビルダーで、30秒でビジネスをオンラインにします。
JungGPT
感情の反映と心理的洞察のためのAIツール。
ChartX
効率的で正確な患者ケアのためのAI駆動の医療文書。
eztalks-20250226-0424003
SharkFotoで、画像から背景を簡単に削除し、画像形式を変換します。
Udemy Summary with ChatGPT
ChatGPTを使ってUdemy動画を要約し、簡単にノートを取る。
Astro Answer New Tab
パーソナライズされたAI生成のホロスコープで占星術を発見しましょう。
aiBot копирайтер
aiBot копирайтер を使って、簡単にテキストを強化しましょう。
PageSage
PageSage は、ウェブブラウジングを簡素化し、即座に質問と答えを生成します。
GPU Finder
GPU Finderは、グローバルなパブリッククラウドプロバイダーから利用可能なGPUインスタンスを発見するのを助けます。
Skyworker
テクノロジーの求職者とリクルーターのためのAI駆動プラットフォーム。
Craft
Craftは、チームや個人向けの強力な文書作成およびコラボレーションツールです。
GottaMeme. AI Meme Generator
GottaMemeのAI駆動のジェネレーターで手軽に面白いミームを作成しましょう。
Recap
Recapを使って、ChatGPTを活用したオープンソースのブラウザ拡張機能で任意のウェブページの部分を簡単に要約します。
kimi quick test 20250417-121312223
個人の生産性を向上させるための革新的なプラットフォーム。
Magazine Luiza
Magazine Luizaユーザーのための効率的なショッピングアシスタント。
sharkfoto svip test 202512241034
SharkFotoは、動画、画像、音楽を手軽に作成・編集できるAI搭載プラットフォームです。
Bigjpg AI
Bigjpgは、高度なAIアップスケーリング技術を通じて画像品質を向上させます。
kimi test 20250328-3
シームレスなコラボレーションと生産性を実現する革新的なプラットフォーム。
viddo.ai
Veo3 by Viddo AI enables AI-powered text or image to high-quality video creation rapidly.
Simplifly
Simpliflyで長い記事を簡単に要約します。
BearGPT - Chatgpt Enhancer
BearGPTでチャットGPT体験を向上させ、より良いナビゲーションとカスタマイズを実現しましょう。
2026 Face Swap
2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Fac
TextPal
TextPalはAIを活用して、ウェブページのテキストを簡単に要約し管理します。
AlgoDocs
AlgoDocs:AI駆動のドキュメントデータ抽出が簡単に。
Audioread: Ultra-Realistic Text-to-Speech
超リアルなAI音声で記事を聴いてください。
GPTXtend
強力な共有ツールであなたのChatGPT体験を向上させましょう。
Free Email Extractor from Website
ウェブサイトからメール、電話番号、ソーシャルプロファイルをスクレイピングするための無料のメール抽出ツール。
Skypher
Skypherの自動化でセキュリティレビューを効率化します。
AI PDF chatbot agent built with LangChain & LangGraph
SharkFotoは、背景除去、カラー化、強調、画像サイズ変更のための無料のAI搭載写真編集ツールを提供します。
Wan 2.2-test
Wan 2 AI offers fast, high-quality 1080p AI video generation with advanced motion control.
Tappy AI
LinkedInの投稿に思慮深いコメントを追加するためのAIブラウザ拡張。
sharkfoto-svip-092202
SharkFoto offers free AI-powered image editing tools like background removal and coloring.
Letz DM
手間をかけずにTikTokインフルエンサーのマーケティングを自動化します。
Belly Buddy
Belly Buddyを使用して食事の摂取と消化症状を追跡します。
sharkfoto svip test 202509221443
SharkFoto offers free AI-powered photo editing tools for automatic background removal and image enhancement.
sharkfoto-svip-0922-changename
SharkFotoは無料のAI搭載の写真ツールを提供しており、背景の自動削除や画像の強化を行います。
Alltum
AI駆動のプロジェクト管理を使って、メール、タスク、ファイルを整理します。

MIT、探索によってAIエージェントの性能を最適化するフレームワーク「EnCompass」を公開

MIT CSAILの研究者たちはEnCompassを発表しました。これはバックトラッキングと並列探索を用いて、AIエージェントの信頼性と効率を飛躍的に向上させる画期的なフレームワークです。