AIエージェントに必要な「4種類のメモリ」とは? IBMの解説で学ぶ情シス新常識:「同じ説明を何度もする」を防ぐ
AIエージェントの導入で継続的に成果を上げるには、AIモデルだけでなく4種のメモリをどのように設計するかが重要になるとIBMのマーティン・キーン氏は指摘する。
生成AIやAIエージェントの導入が進む中、「同じことを何度も説明しなければならない」「前回のやりとりを覚えていない」「毎回同じミスを繰り返す」と感じたことはないだろうか。
こうした問題は、AIモデルの性能不足だけが原因ではない。AIエージェントが長期的に成果を出すためには、メモリの設計が重要になる。
人間が短期記憶や長期記憶、経験から学習するように、AIエージェントにも複数種類の記憶が必要だと考えられている。IBMのマーティン・キーン氏(マネジャー兼IBMテクニカルトレーニングコンテンツクリエイター)によると、米プリンストン大学の研究チームが提唱するフレームワーク「CoALA」(Cognitive Architectures for Language Agents)では、このエージェントに必要な記憶を4つの種類に分類しているという(注)。
※注:人間の認知プロセスを参考に、言語モデルが自律的に考え、計画し、行動し、必要に応じて記憶や外部ツールを活用してタスクを遂行するAIエージェントを設計するための体系的なフレームワーク
本稿では4種類のメモリと、情報システム部門(情シス)がAIエージェントを導入・設計する際に注目すべきポイントを、キーン氏の説明に基づいて整理する。
情シスが知るべき「4種類のメモリ」とは
併せて読みたいお薦め記事
AIエージェントの関連記事
メモリ1.ワーキングメモリ(Working Memory) AIが「今」見えている情報
メモリの最も基本となるのがワーキングメモリだ。ワーキングメモリは、現在の会話、システムからの指示、読み込まれたファイルなど、AIがその瞬間に参照できる情報を保持する領域だ。コンピュータで言えばRAM(主記憶)に相当する。
例えばChatGPTへ資料をアップロードすると、その資料や会話内容はワーキングメモリに読み込まれる。しかし、この記憶は一時的なものであり、セッションが終了すると基本的には失われる。
また、ワーキングメモリの容量には限界がある。近年は100万トークン級のコンテキストウィンドウを持つモデルも登場しているが、それでも情報を詰め込みすぎると、AIエージェントは重要な情報を見失いやすくなる。つまりワーキングメモリは、「今考えるための作業スペース」であり、永続的な知識を保存する場所ではない。
2.セマンティックメモリ(Semantic Memory) 企業のルールや知識を覚える
AIエージェントが業務を遂行するためには、「AIエージェントを運用する企業固有の知識」を持っている必要がある。その役割を担うのがセマンティックメモリだ。
セマンティックメモリには以下をはじめとする情報が保存される。
- システム構成
- コーディング規約
- セキュリティポリシー
- 社内ルール
- プロジェクトの設計方針
キーン氏によると、企業においては、プロジェクト直下に配置したMarkdownファイルとして管理されるケースも少なくない。この知識ベースが存在しない場合、AIエージェントは毎回ゼロから判断を下すことになり、同じ間違いを何度も繰り返すことになる。
3.プロシージャルメモリ(Procedural Memory) 「やり方」を覚える
知識があるだけでは、AIエージェントは業務を遂行できない。そこで、「業務のやり方」を覚える仕組みも必要になる。それがプロシージャルメモリだ。
例えば以下の手順をスキルとして保持する。
- PowerPointを使って資料を作成する
- コードレビューを実施する
- パスワードをリセットする
- インシデント報告書を作成する
しかし、全てのスキルを常にワーキングメモリへ読み込むと、限られたコンテキストを大量に消費してしまう。
そのため、多くのAIエージェントでは“必要な場面で必要な分だけスキルを開示する”「段階的開示」という仕組みを採用する。普段は「利用可能なスキル一覧」だけを保持し、必要なタスクが発生した瞬間だけ詳細な手順やスクリプトを読み込む仕様だ。
この動きは、人間が辞書を丸暗記するのではなく、ある知識を確認する場面になったときだけ参考書を開くことに近い。
4.エピソディックメモリ(Episodic Memory) 経験から学習する
AIエージェントをAIチャットbotと区別するのが、エピソディックメモリだ。エピソディックメモリは、過去のやり取りや意思決定、そこから得られた学びを保存する仕組みだ。ただし、単純に全ての会話ログを保存する訳ではない。
例えば、エラーが発生した場面でやりとりしたチャットのログを丸ごと保存するのではなく、「前回このエラーが起きたときは、ミドルウェア層に原因があった」というように、将来役立つ形で体験を要約、圧縮して保持する。この仕組みによって、AIは過去の経験を活用し、時間とともにより適切な判断ができるようになる。
一方で、AIエージェントが蓄積した経験の中から、将来の判断に役立つものだけを長期的に保持し、不要になった情報や価値の低い情報を削除する、要約する、優先度を下げる仕組みをどう設計するかはエピソディックメモリのこれからの課題だとキーン氏は説明する。
用途によって必要なメモリは異なる
キーン氏によると、全てのAIエージェントが4種類のメモリを必要とする訳ではない。
例えば、「温度を制御する装置」や「パスワードを忘れたユーザーにパスワード再設定ページを案内する」といった、キーワードやルールに基づいて単純作業をこなすエージェントであれば、ワーキングメモリだけで十分な場合がある。
一方、パスワードリセットを実施するカスタマーサポートAIエージェントには、ワーキングメモリに加え、リセット手順を保持するためのプロシージャルメモリが必要になる。
さらに、高度なコーディングを実施するAIエージェントであれば、「今進んでいるチャット」だけでなく、「製品知識を保持するメモリ」「開発スキルを保持するメモリ」「過去のデバッグ経験を蓄積するメモリ」など、4種類全てのメモリを組み合わせて初めて十分な性能を発揮する。
情シスが設計すべきなのは「AIモデル」ではなく「AIの記憶」
生成AIの進化によって、どの大規模言語モデル(LLM)を採用するかに注目が集まっている。しかし、実際のAIエージェントの使い勝手を左右するのは、「どのLLMを選ぶか」だけではない。
社内知識をどのように保持するのか、業務手順をどう再利用するのか、過去の経験を何を残し何を忘れるのか――。こうしたメモリ設計によって、AIエージェントは単なるAIチャットbotから、継続的に成長する業務支援システムへと進化する。
今後、情シスに求められる役割は、高性能なAIモデルを選定することだけではない。AIエージェントが「何を覚え、何を忘れ、どう学ぶか」を設計することが、AI活用の成果を左右する重要なポイントになりそうだ。
本稿は、IBM Technologyが2026年5月26日に公開した動画「The Four Types of Memory Every AI Agent Needs」を基に作成しました。
Copyright © ITmedia, Inc. All Rights Reserved.