Signal Snapshot
agent architecture は model novelty よりも重要な比較軸になっていく
積み上がっている一次情報を見ると、agent の比較軸は model の新しさより architecture の厚みへ移っている。protocol、SDK、runtime、workflow surface、evals、approval をどう束ねるかが、coding、analysis、support、approval-heavy workflow のすべてに効く共通論点になっている。
8件
公開根拠
architecture 比較に直結する papers と official launches を掲載。
52件
調査母集団
公開日までに確認できる一次情報のみを候補にした。
5層
比較される層
protocol、SDK、runtime、workflow、eval / approval が主要レイヤーになった。
What Stood Out
主要シグナル
protocol と SDK だけでは architecture を語れなくなった
A2A、MCP、Agent SDK、Agent Framework が重要なのは確かだが、それだけでは production architecture にならない。workflow surface、trace、approval、evaluation が揃って初めて導入の比較軸として機能するようになった。
workflow surface が model 差を吸収する領域を広げた
Foundry workflows や AgentKit のような builder / eval / versioning を持つ面が厚くなると、model difference だけで成果差を説明しにくくなる。実務では architecture quality の寄与が大きくなる。
approval と governance は後付けではなく中心設計になった
2025年を通じて見えたのは、approval chain と policy boundary を早く定義した team のほうが narrow workflow を前に進めやすいということだった。governance は innovation brake ではなく delivery enabler に近い。
Use Cases
architecture 比較が効きやすいユースケース
browser / ops workflow
- 複数 step、外部 system、approval が絡むため runtime と review surface の質が重要になる。
- single model の性能差より orchestration quality が効きやすい。
coding + data + document workflow
- code change、analysis、document drafting をまたぐ task では protocol と control plane の一貫性が必要になる。
- architecture が弱いと evidence と review が分断しやすい。
Concrete Scenarios
公開根拠から見えた architecture 差の具体像
browser-oriented workflow では approval と trace が architecture quality を左右する
browser task は model が多少良くても、途中状態が見えず、irreversible action を止められないと production で使いにくい。ここでは protocol の美しさより runtime と review surface の設計が効く。
coding / analysis workflow では evidence と review の一貫性が重要になる
Agent Framework、AgentKit、GPT-5 for developers の流れを合わせると、code diff、metric access、analysis memo が同じ control plane に載るかどうかで運用品質が変わる。architecture comparison は抽象論ではなく release quality の差になる。
approval-heavy workflow では governance が rollout speed を決める
financial approvals や document review のような flow では、review node、policy boundary、regression eval が整っている architecture のほうが narrow workflow を速く出せる。強い model だけではここを代替できない。
Operating Implications
設計・評価・運用で先に決めるべきこと
観測点
比較軸は、どの model を積むかより、protocol から approval までを一貫した architecture として保てるかに移っている。
- protocol、SDK、runtime、workflow、eval / approval を別々の比較表にしない。
- workflow architecture を model benchmark と同じくらい重要な選定項目にする。
- review surface と observability を early architecture に組み込む。
- narrow workflow ごとに architecture fit を評価し、万能 platform 期待を避ける。
Key Takeaway
結論
agent 導入の現実的な比較軸は、model novelty ではなく、protocol・runtime・workflow・approval を一体で扱える architecture の質になっている。