なぜAIはチームを組み始めたのか?
ChatGPTは賢い。しかし一人では足りなくなった。人類が分業と組織化によって文明を築いたように、AIもまた同じ方向へ進み始めている。マルチエージェントシステムが生まれた背景を探る。
はじめに
ChatGPTは賢い。
Claudeも賢い。
Geminiも賢い。
ここ数年で登場した大規模言語モデルは、多くの人々の予想を超える能力を示してきた。
文章を書く。コードを書く。翻訳する。要約する。議論する。計画を立てる。時には専門家レベルに近い回答を返すことさえある。
2022年末にChatGPTが公開されたとき、多くの人々はこう考えた。
「これで人工知能の問題はほぼ解決したのではないか」
しかし実際にはそうならなかった。
モデルは大きくなった。性能も向上した。コンテキストウィンドウも拡大した。
GPT-3からGPT-4へ。Claude 2からClaude 3へ。Gemini 1.5は100万トークンという巨大なコンテキストを実現した。
それでもなお、多くの問題は残り続けた。
複雑なプロジェクトを最後まで遂行できない。長期間の計画を維持できない。複数の専門分野を横断する作業が苦手である。大規模なタスクになるほど性能が不安定になる。
そして何より、一つのAIが全てを担当しようとしていた。
人間社会を見れば分かる。
私たちは一人で文明を築いたわけではない。一人で飛行機を作ったわけでもない。一人でインターネットを構築したわけでもない。一人で会社を運営しているわけでもない。
人類の発展を支えたのは知能だけではなかった。協力だった。分業だった。組織だった。
そして興味深いことに、AIもまた同じ方向へ進み始めている。
近年注目されているマルチエージェントシステムは、単なる技術的な流行ではない。それは、人間社会が数千年かけて発見した原理を、AIの世界が再発見し始めた過程とも言える。
なぜAIはチームを組み始めたのだろうか。なぜ単独のAIでは足りなくなったのだろうか。そして、人間の組織と同じような構造がAIの世界にも現れ始めたのはなぜなのだろうか。
本記事では、AutoGenやCrewAIといった具体的なフレームワークの説明に入る前に、その背景にあるより本質的な問いを考えてみたい。
なぜAIは協力し始めたのか。それは単なる技術の進歩ではなく、知能そのものが直面する普遍的な問題なのかもしれない。
第1章 人間はなぜ組織を作ったのか
AIの話をする前に、人間の歴史を振り返ってみたい。
なぜなら、現在AIの世界で起きていることは、人類が何度も経験してきた問題と驚くほどよく似ているからである。
現代社会では組織は当たり前の存在である。
会社。大学。病院。政府。研究機関。
私たちは日常的に組織の中で生活している。
しかし、人類の歴史の大部分において、そのような大規模組織は存在しなかった。
狩猟採集時代の人類は小規模な集団で生活していた。数十人程度の共同体である。その環境では、一人ひとりが多くの役割を兼任していた。
食料を探す。住居を作る。道具を修理する。子供を育てる。敵から身を守る。
専門家という概念はほとんど存在しなかった。
しかし文明が発展するにつれて状況は変わっていく。
農業が始まる。定住が始まる。人口が増える。都市が形成される。
すると、一人ですべてをこなすことが難しくなった。
農業に特化した人々が現れる。建築に特化した人々が現れる。商業に特化した人々が現れる。専門化が始まったのである。
この変化を最も有名な形で説明した人物の一人が、経済学者アダム・スミスだった。
『国富論』の中で彼はピン工場の例を紹介している。
一人の職人が最初から最後までピンを作る場合、生産量は非常に限られる。しかし作業を細分化し、それぞれの工程を専門の作業者が担当すると、生産性は劇的に向上する。
針金を伸ばす人。切断する人。先端を尖らせる人。包装する人。
それぞれが特定の作業に集中することで、全体としての効率は飛躍的に高まる。
この考え方は後に産業革命の基礎となった。現代企業の基礎にもなった。そして科学研究の基礎にもなった。
重要なのは、個人の能力が突然向上したわけではないということである。一人ひとりの知能が劇的に変化したわけではない。変わったのは組織の構造だった。分業によって集団全体の能力が向上したのである。
この考え方は認知科学や社会学にも大きな影響を与えている。
私たちはしばしば知識を個人の中に存在するものとして考える。しかし実際には、多くの知識は社会全体に分散して存在している。
スマートフォンがどのように動作するのかを完全に理解している人はほとんどいない。
CPU設計者がいる。OS開発者がいる。通信技術者がいる。半導体研究者がいる。それぞれが一部を理解している。全体は組織の中に存在している。
人類は個人の知能だけで発展したのではない。組織化された知能によって発展したのである。
そしてこれは、後にAIが直面する問題を考える上で極めて重要な視点になる。
第2章 単独知能の限界
私たちはしばしばAIを個人として考える。
ChatGPT。Claude。Gemini。一つのモデル。一つの人格。一つの知能。
しかし、この見方にはある種の思い込みが含まれている。
それは、高性能な知能は単独で存在するものだという思い込みである。
人間社会を見れば、それが必ずしも正しくないことは明らかだ。
どれほど優秀な研究者でも、一人で現代のスマートフォンを開発することはできない。どれほど優秀な経営者でも、一人で巨大企業を運営することはできない。どれほど優秀な科学者でも、一人で全ての学問を理解することはできない。
能力には限界がある。注意力には限界がある。記憶には限界がある。時間には限界がある。
AIも同じ問題を抱えている。
近年のモデルは驚異的な能力を示しているが、それでも万能ではない。むしろ能力が高まるにつれて、新しい限界が見え始めたとも言える。
例えばソフトウェア開発を考えてみよう。
数百行のプログラムであれば、一つのモデルでも十分対応できる。しかし数十万行規模のプロジェクトになると事情は変わる。
設計が必要になる。実装が必要になる。テストが必要になる。レビューが必要になる。運用が必要になる。それぞれ異なる視点が求められる。
一つのモデルに全てを同時に担当させることは可能かもしれない。しかし効率的とは言えない。
実際、多くの開発者が経験しているように、巨大なタスクを一つの会話に詰め込むと性能は不安定になる。途中で文脈を見失う。過去の決定を忘れる。矛盾した設計を提案する。
以前の記事で紹介した「Lost in the Middle」問題も、その一例だった。
コンテキストが大きくなれば全て解決すると思われていた。しかし実際にはそうならなかった。情報量が増えるほど、どの情報に注意を向けるべきかという問題が発生する。
これは単なる技術的な制約ではない。むしろ知能そのものが抱える構造的な問題に近い。
人間も同じだからである。
第3章 AIは能力を獲得し続けた
単独知能の限界が見え始めたとはいえ、それはAIの進化が止まったことを意味しなかった。むしろ逆だった。
2022年から2025年にかけて、AIは驚異的な速度で新しい能力を獲得していった。文章生成だけだったモデルは、次第に行動できる存在へと変化していった。
これは現在のAgent革命を理解する上で非常に重要な変化だった。
初期の大規模言語モデルは、本質的には次の単語を予測するシステムだった。質問に答える。文章を書く。翻訳する。要約する。こうした作業は得意だった。しかし外部世界に働きかけることはできなかった。モデルの内部に閉じ込められた知能だったのである。
状況を変えたのは、言語モデルと外部環境を接続する研究の登場だった。
ReActはその代表例だった。ReActはReasoningとActingを統合した。考えるだけではなく行動する。検索する。情報を取得する。結果を観察する。そして再び考える。
それまでのAIは、内部で推論を完結させていた。しかしReAct以降のAIは、環境との相互作用を前提とするようになった。
これは単なる性能向上ではなかった。知能のあり方そのものを変える変化だった。
人間もまた、頭の中だけで問題を解決しているわけではない。本を読む。人に聞く。実験する。観察する。環境から情報を取得しながら思考している。ReActはその構造をAIにも導入した。
続いてToolformerが登場した。
Toolformerの重要性は、ツール利用を学習可能な能力として扱った点にある。計算機を使う。検索エンジンを使う。翻訳システムを使う。外部知識ベースを使う。
従来のモデルは、すべてを内部知識で解決しようとしていた。しかしToolformerは、必要に応じて外部ツールを呼び出す方が合理的であることを示した。
これは人間社会と非常によく似ている。私たちは暗算で巨大な数値計算を行わない。電卓を使う。百科事典を暗記しない。検索する。地図を全て記憶しない。GPSを使う。
知能とは必ずしも全てを内部に保持することではない。必要なときに適切な外部資源へアクセスする能力でもある。Toolformerはその考え方をAIの世界に持ち込んだ。
さらにReflexionは別の能力を追加した。反省である。
以前の記事で詳しく扱ったように、Reflexionの革新的な点は重み更新を行わずに性能を改善したことである。失敗を振り返る。教訓を抽出する。次回の行動に反映する。
このサイクルによって、モデルは試行錯誤を通じて改善できるようになった。
人間社会においても学習の大部分は反省から生まれる。失敗する。原因を考える。改善する。再挑戦する。ReflexionはそのプロセスをAIへ導入した。
その後、Voyagerはさらに興味深い方向へ進んだ。
VoyagerはMinecraftの世界で継続的なスキル獲得を実現した。木を切る。道具を作る。資源を集める。新しいスキルを獲得する。そしてそれらをライブラリとして蓄積する。
重要なのは、一回限りの成功ではなかったことだった。経験が未来の行動に利用される。過去が蓄積される。成長が発生する。
この構造は、人間が人生を通じて経験を蓄積していく過程によく似ていた。
さらにBabyAGIはタスク管理という問題へ取り組んだ。
大きな目標を設定する。サブタスクへ分解する。優先順位を付ける。結果を評価する。新しいタスクを生成する。
これによってAIは単発の質問応答システムから、継続的な問題解決システムへ近づいていった。
ここまでの流れを振り返ると興味深いことが分かる。AIは少しずつ人間社会の機能を獲得していた。
ReActは行動を獲得した。Toolformerは道具利用を獲得した。Reflexionは反省を獲得した。Voyagerは成長を獲得した。BabyAGIは計画を獲得した。
一つひとつは独立した研究だった。しかし全体として見ると、一つの方向へ進んでいた。
AIを単なる文章生成システムから、自律的な問題解決システムへ変化させる流れだった。
しかし、この進化にも限界が存在した。それは意外なほど人間的な問題だった。
第4章 なぜ単独Agentでは足りなかったのか
Agent研究が進むにつれ、研究者たちはある事実に気付き始めた。
能力を追加するだけでは十分ではなかった。
行動できるようになった。ツールも使えるようになった。反省もできるようになった。計画も立てられるようになった。
それでも複雑な問題は依然として難しかった。
理由は単純だった。一人で全部やろうとしていたからである。
例えば研究プロジェクトを考えてみよう。あるテーマについて論文を書くとする。
まず先行研究を調査しなければならない。関連論文を読む。重要な研究を整理する。歴史的背景を理解する。次に仮説を構築する。実験を設計する。結果を分析する。論文を書く。査読者の視点でレビューする。修正する。
現実の研究では、一人で全てを行うことは珍しい。研究室が存在する。共同研究者が存在する。査読者が存在する。学会コミュニティが存在する。
知識も作業も分散されている。
ソフトウェア開発でも同じである。設計者がいる。実装者がいる。テスターがいる。セキュリティ専門家がいる。運用担当者がいる。
大規模プロジェクトほど役割分担が必要になる。なぜなら認知負荷が増大するからである。
人間の脳には限界がある。AIもまた限界を持っている。しかも興味深いことに、その限界は人間と似た性質を示していた。
コンテキストが増えるほど注意は分散する。タスクが増えるほど精度は低下する。役割が増えるほど意思決定は不安定になる。
以前の記事で扱ったLost in the Middle問題も、ある意味ではこの現象の一種だった。情報が多ければ良いわけではない。重要な情報へ適切に注意を向けなければならない。しかし一つのモデルが全てを同時に処理しようとすると、その負荷は急激に増大する。
当初、多くの人々はモデルサイズの拡大が解決策になると考えていた。
より大きなモデル。より長いコンテキスト。より多くの計算資源。
しかし実際には、それだけでは十分ではなかった。
巨大なコンテキストは新たな複雑性を生む。巨大なタスクは新たな管理コストを生む。巨大な推論は新たなエラーを生む。
これは企業経営と似ている。会社の社員数を増やせば問題が解決するわけではない。組織構造が必要になる。役割分担が必要になる。情報共有の仕組みが必要になる。責任範囲の定義が必要になる。
知能が大きくなるほど、組織化の重要性が増していく。
そして研究者たちは次第に気付き始めた。
問題はモデルの能力不足ではない。問題は構造だった。
単独Agentという発想そのものに限界があるのではないか。人間が個人から組織へ進化したように、AIもまた組織へ進化する必要があるのではないか。
この発想が後のマルチエージェント研究へ繋がっていく。それは単なる技術的改良ではなかった。知能の単位そのものを見直す試みだったのである。
人類史において、文明を作ったのは単独の天才ではなかった。組織化された知能だった。そしてAIもまた、同じ方向へ歩み始めていた。
第5章 AIはチームになった
単独Agentの限界が見え始めたとき、研究者たちは自然な問いにたどり着いた。
もし一つのAIですべてを行うことが難しいのであれば、複数のAIで協力すればよいのではないか。
現在では当たり前のように聞こえるかもしれない。しかし当時の視点で考えると、これは決して自明な発想ではなかった。
長い間、人工知能研究はより優れた単一知能を作ることを目指してきた。
より大きなモデル。より多くのデータ。より高い性能。
知能を一つの存在として捉える考え方である。
しかし人間社会を振り返れば、それは必ずしも唯一の道ではないことが分かる。
現代社会を支えているのは、一人の超天才ではない。無数の専門家の協力である。
飛行機を作る人。エンジンを設計する人。材料を研究する人。安全性を検証する人。整備を担当する人。
それぞれが異なる知識を持ち、それぞれが異なる役割を果たしている。誰も飛行機のすべてを理解していない。しかし組織全体としては飛行機を作ることができる。
認知科学者エドウィン・ハッチンスは、このような現象を「分散認知(Distributed Cognition)」として説明した。
知能は必ずしも個人の脳の中だけに存在するわけではない。
人間。道具。文書。組織。コミュニケーション。
それらが相互作用することで、個人を超える認知能力が生まれる。
これはAIにとっても重要な示唆だった。知能を一つの巨大なモデルに閉じ込める必要はないかもしれない。複数のモデルが協力することで、より高い能力を実現できるかもしれない。
実際、この発想にはいくつかの利点があった。
第一に、認知負荷を分散できる。
一つのAgentが全てを担当する代わりに、それぞれが特定の役割に集中できる。
研究担当。執筆担当。レビュー担当。計画担当。情報収集担当。
役割が限定されることで、各Agentはより明確な目的を持つことができる。
第二に、専門化が可能になる。
人間社会では専門化が生産性向上の重要な要因だった。AIでも同じである。
コードレビューが得意なAgent。調査が得意なAgent。文章作成が得意なAgent。批判的検証が得意なAgent。
役割ごとに異なる行動パターンを持たせることで、単独Agentでは実現しにくい能力が生まれる。
第三に、相互検証が可能になる。
これは非常に重要な点だった。
以前の記事で見てきたように、AIは幻覚を起こす。誤った推論を行う。誤った情報を自信満々に提示する。
単独Agentの場合、その誤りを検出する仕組みが存在しない。しかし複数のAgentが存在すれば話は変わる。
あるAgentの提案を別のAgentが検証できる。批判できる。改善できる。
人間社会における査読制度やレビュー制度と同じ発想である。
もちろん、複数のAIがいれば常に正しくなるわけではない。後で見るように、新しい問題も生まれる。しかし少なくとも、単独Agentでは不可能だった構造が実現できるようになった。
こうしてAI研究は少しずつ新しい段階へ進み始める。
単独知能の追求から、組織化された知能の探求へ。
それはある意味で、人類が経験した歴史を再び辿る過程でもあった。
第6章 組織が生む新たな問題
しかし組織化には代償がある。
これは人間社会の歴史を見れば明らかである。
組織は強力だ。だが同時に複雑でもある。
社員が一人しかいない会社では会議は不要である。しかし社員が増えると状況は変わる。
情報共有が必要になる。意思決定が必要になる。責任分担が必要になる。コミュニケーションが必要になる。
組織は能力を高める一方で、新たなコストを生み出す。
AIの世界でも同じ問題が現れた。
複数のAgentを用意しただけでは不十分だった。
彼らはどのように会話するのか。どのように情報を共有するのか。誰が意思決定を行うのか。役割はどのように決めるのか。あるAgentが誤った場合、誰が修正するのか。
こうした問題は、単独Agentの時代には存在しなかった。
人間社会では何千年もかけて組織運営の仕組みが発展してきた。
階層構造。管理職。会議。報告書。監査。レビュー。
これらは単なる事務作業ではない。組織を機能させるための認知的インフラである。
AIもまた同じ問題に直面することになった。
さらに興味深いのは、人間組織の欠陥まで再現し始める可能性があることである。
グループシンク。責任の分散。情報の歪み。コミュニケーションエラー。過剰な合意形成。
以前の記事で見たように、人間の欠陥はしばしば組織によって増幅される。AI組織も例外ではないかもしれない。
実際、複数のAgentが互いに誤りを強化する可能性もある。
誤った前提を共有する。誤った結論へ向かう。互いに誤りを検証できずに同意する。
これは人間社会でも頻繁に見られる現象である。
つまり、組織化は万能薬ではなかった。
単独Agentの問題を解決する代わりに、新しい問題を生み出す。
それでもなお、多くの研究者は組織化の方向を選んだ。
なぜなら、それは避けられない進化のように見えたからである。
人類が組織を捨てられなかったように。企業が組織を捨てられなかったように。科学が共同研究を捨てられなかったように。
AIもまた協力を避けることができなかった。複雑な問題を解くためには、それが必要だったからである。
結論
AIの歴史は、より優れた個体を作る歴史として始まった。
より大きなモデル。より高い性能。より長いコンテキスト。より優れた推論能力。
その流れは現在も続いている。
しかし近年の研究は、別の可能性も示し始めている。
知能は必ずしも単独で存在する必要はない。協力できる。分業できる。組織化できる。
人類の歴史を振り返れば、それは決して驚くべきことではない。
文明を作ったのは一人の天才ではなかった。知識を共有する社会だった。役割を分担する組織だった。専門家同士の協力だった。
そして今、AIもまた同じ方向へ進み始めている。
これは単なる技術トレンドではない。知能が複雑な問題へ向き合うときに現れる、より普遍的な現象なのかもしれない。
以前の記事で見てきたように、AIは人間の欠陥を受け継いだ。
認知バイアス。迎合。推論の限界。社会的適応。
しかし同時に、AIは人間の強みも受け継ぎ始めている。
協力である。分業である。組織化である。
そしてその最初の大きな一歩が、マルチエージェントシステムの誕生だった。
次回予告
AIがチームを組み始めると、新しい問題が生まれた。
彼らはどのように会話するのだろうか。どのように役割を分担するのだろうか。そして複数のAIが議論するとき、本当により良い答えへ近づけるのだろうか。
単独Agentからマルチエージェントへの進化は、まず「会話」から始まった。
次回は、「なぜAIは会話を始めたのか?」 をテーマに、AutoGenの登場とマルチエージェント時代の幕開けを見ていく。
参考文献
Smith, A. (1776). An Inquiry into the Nature and Causes of the Wealth of Nations.
Hutchins, E. (1995). Cognition in the Wild. MIT Press.
Yao, S., Zhao, J., Yu, D., Du, N., Shafran, I., Narasimhan, K., & Cao, Y. (2023). ReAct: Synergizing Reasoning and Acting in Language Models. arXiv:2210.03629
Schick, T., Dwivedi-Yu, J., Dessì, R., Raileanu, R., Lomeli, M., Hambro, E., Zettlemoyer, L., Cancedda, N., & Scialom, T. (2023). Toolformer: Language Models Can Teach Themselves to Use Tools. arXiv:2302.04761
Shinn, N., Cassano, F., Labash, B., & Gopinath, A. (2023). Reflexion: Language Agents with Verbal Reinforcement Learning. arXiv:2303.11366
Wang, G., Xie, Y., Jiang, Z., Liu, A., Mandlekar, A., et al. (2023). Voyager: An Open-Ended Embodied Agent with Large Language Models. arXiv:2305.16291
Nakajima, Y. (2023). BabyAGI. GitHub
Russell, S., & Norvig, P. (2021). Artificial Intelligence: A Modern Approach (4th ed.).
Wooldridge, M. (2009). An Introduction to MultiAgent Systems (2nd ed.).