記憶のバス停 〜AI エージェントのメモリー戦略〜

-- Views

March 25, 26

スライド概要

忘れてしまった記憶、もしも、取り戻せるなら
取り戻したいですか? 忘れたままでいたいですか?

AIエージェントのメモリー戦略を話しています。

profile-image

SIerのデータサイエンティスト 2025 Japan AWS Jr.Champions

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

各ページのテキスト
1.

記憶のバス停 〜 AI エージェントのメモリー戦略 〜

2.

自己紹介 やぎ バスの運転手

3.

Question 忘れてしまった記憶、もしも、 取り戻せるなら 取り戻したい 忘れたままでいたい 3

4.

3人の幼馴染の物語

5.

Chapter1 選んだ記憶

6.

私は、楽しかったことだけ持っていく

7.

私は、楽しかったことだけ持っていく 記憶を選んだ

8.

新情報 線形 代数 既存の概念と連結(linkage) 特徴量 することで記憶に定着する 深層 学習 機械 学習 escorla, R. A., & Wagner, A. R. (1972) A theory of Pavlovian conditioning: Variations in the effectiveness of reinforcement and nonreinforcement. 【認知心理学】 連合学習とスキーマ 新しい情報は、既存の概念との連結(linkage)を形成することで記憶に定着する。連合学習と呼 ぶ。(Bower & Hilgard, 1981)。その連結先となる構造化された知識の枠組みをスキーマと呼ぶ (Bartlett, 1932; Piaget, 1976)。スキーマが精緻であるほど、新たな知識の獲得は容易になる。 R 【経営学】 吸収能力(Absorptive Capacity) 吸収能力とは、外部の新しい知識の価値を認識し、同化し、商業的目的に応用する能力である。 中核的前提は、新しい知識の吸収には事前の関連知識が不可欠という点にある。 吸収能力は累積的かつ経路依存的であり、投資を怠れば知識吸収の能力自体が失われる、ロック アウトが生じる。 Cohen, W. M., & Levinthal, D. A. (1990). Absorptive capacity: A new perspective on learning and innovation 既 存 知 識 が あ る ほ ど 記 憶 しや す い

9.

MEM-α 3 つ の 記 憶 に 対 して 3 つ の 操 作 が あ る コア記憶 意味記憶 エピソード記憶 最重要情報を凝縮した要約文 最大512トークンであり、 常にエージェントのコンテキストに入る 更新するときは全体を丸ごと書き換え、 部分的な編集はできない。 update のみ対応している。 事実や知識を1件ずつ格納するリスト 個別の知識片を独立して保持する エントリ数に上限はなく、 必要に応じて増やることができる。 タイムスタンプ付きのリスト いつ何が起きたかを時系列で記録する エントリ数に上限はない。 insert(追加) update(更新) delete(削除) 意味・エピソード記憶に新規エントリを 1件追加する。コア記憶には使えない。 既存のエントリを書き換える。 コアは全文書き換え。意味・エピソード は個別エントリを修正する。 既存のエントリを削除する。 コア記憶には使えない。 過 去 の 記 憶 を 参 照 して ど の 記 憶 に ど の 操 作 を す る か を 決 め る 。 ど の 操 作 を す る かは 、 強 化 学 習 ( G R P O ) で パ ラメ ー タ 学 習 す る 。

10.

私は、楽しかったことだけ持っていく

11.

Chapter2 知恵にした記憶

12.

僕は、あの日があったから今がある

13.

僕は、あの日があったから今がある 記憶を知恵にした

14.

エピソード記憶 gist化 意味記憶 Winocur, G., & Moscovitch, M. (2011). Memory transformation and systems consolidation 【認知心理学】 痕跡変換理論(Trace Transformation Theory) 個別の経験はまず文脈に富んだエピソード記憶として海馬に貯蔵される。 時間経過と記憶の固定化(consolidation)を通じて、Context は失われ、経験の要点であるgist が抽出されて、意味記憶へと変換される(Winocur & Moscovitch, 2011)。 個別の経験が繰り返し想起・再固定化されることで、汎用的な知識へと昇華される。 【経営学】 SECIモデル(SECI Model of Knowledge Creation) Nonaka(1994)が提唱した、組織における知識創造の動的プロセスモデルのこと。 暗黙知と形式知の間で、4つの変換モード(共同化・表出化・連結化・内面化)をサイクルする ことで、個人の経験知が組織的に活用できる形式知に変換される。さらに、実践を通じて新たな 暗黙知となり、経験知を言語化し再び実践に戻ることで、知識が創造される。 内面化・共同化・表出化によって、経験が知識へと昇華されている。 Nonaka, I. (1994). A dynamic theory of organizational knowledge creation. 記憶(経験)を知恵にする

15.

Reasoning Bank Retrieval Extraction タスクをクエリにして、ReasoningBankから
 埋め込みベースの類似度検索を行い、上位k件を エージェントのsystem instructionに入れる。 タスク完了の軌跡からメモリ候補を抽出する。 ①成功/失敗の自己判定 正解ラベルなしに、LLM-as-a-Judgeがクエリと軌 跡だけで、タスクの成功/失敗を判定する。 抽出されたメモリアイテムをReasoningBankに追 加操作で統合する。 これで、ReasoningBankは更新が終わる。 ②推論戦略の抽出 成功軌跡から「なぜうまくいったか」を 失敗軌跡からは「なぜ失敗したか」を分析し、有 効な戦略や回避すべき点を抽出する。 各アイテムは、title, description, contentを持つ 論文ではシンプルな操作しかしてないが、改善の 余地は大きい。 例えば、MEM-αなども組み合わせられる。 つまり、事前知識として、過去の経験から蒸留さ れた推論戦略を与える。 Consolidation MaTTS MaTTS(Memory-aware Test-Time Scaling)とは 1タスクに対し複数の探索軌跡を生成し、結果同士を対 比して蒸留の質を向上させる手法。 ①並列スケーリング 複数軌跡の成功/失敗を比べ教訓を抽出する。 ②逐次スケーリング 逐次で繰り返し、その過程も教訓の材料にする。  例:なぜ間違えたか、どうしてうまくいったか Ouyang et al. (2025). ReasoningBank: Launching a Bank to Reason with Evolving Memory.

16.

僕は、あの日があったから今がある

17.

Chapter3 忘れた記憶

18.

私は、忘れていたんだ

19.

私は、忘れていたんだ 記憶を忘れていた

20.

貯蔵強度 学習によって蓄積され、基本的に は減少しない 検索強度 記 憶 へ の 現 在 の ア ク セ ス し や す さ 使用されないと自然に低下する Bjork, R. A., & Bjork, E. L. (1992). A new theory of disuse and an old theory of stimulus fluctuation. 【認知心理学】 適応的忘却(Adaptive Forgetting) Bjork(1989)は、忘却現象を適応的メカニズムとして再解釈した。使用されない情報へのアク セスが低下することで、環境に合う情報が相対的に優先される。Bjork & Bjork(1992)は新不 使用理論(New Theory of Disuse)において、記憶には、「貯蔵強度」と「検索強度」の2つの ある。貯蔵強度は学習で蓄積され減少しない。検索強度は使用されないと自然に低下する。 【経営学】 組織的忘却(Organizational Forgetting) de Holan & Phillips(2004)は組織的忘却を、忘却の対象(既存知識/新規知識)と意図性(偶 発的/意図的)の2軸で4類型に分類した。 ①記憶減衰(Memory Decay) ②獲得失敗(Failure to Capture) ③アンラーニング(Unlearning)④悪習回避(Avoiding Bad Habits)である。 経営学では、①記憶減衰 がはリスクであり、③アンラーニング の方が研究対象となっている。 de Holan, P.M.& Phillips,N. (2004). Remembrance of things past? The dynamics of organizational forgetting. 忘 却 に よって 最 新 情 報 に 適 応 で きる

21.

FadeMem ①入力と重要度スコアリング ②2層記憶への振り分け ③適応的指数減衰 新しい記憶が入力されると、 ・意味的関連性(semantic relevance) ・アクセス頻度(access frequency) ・時間的新しさ(recency) の3要素から重要度スコアを算出する。 重要度スコアに基づき、長期記憶層(LML)と 短期記憶 層(SML)に配置する。記憶の整理は2段階ある。 ①競合解消:既存記憶には、4つの処理をsする
 ・Compatible(互換)・Contradictory(矛盾)
 ・Subsumes(包含)・Subsumed(被包含) ②適応的記憶融合 意味的類似度と時間近傍でクラスタリングし、圧縮する。 各記憶の強度をエビングハウス忘却曲線に基づき指数関数 で時間減衰する。重要な記憶ほど半減期が長い。 アクセスされた記憶は強化され、間隔効果も含む。 閾値以下の記憶は自動的に剪定される。 Wei et al. (2026), FADEMEM: BIOLOGICALLY-INSPIRED FORGETTING FOR EFFICIENT AGENT MEMORY

22.

私は、忘れていたんだ

23.

Epilogue

25.

AIエージェントのメモリー戦略 AWS AgentCore Memory Mem - α 発展方向 ①抽出 3つのMemory Strategy(Semantic /User Preference / Summary)にしたがって情報を抽出する。 ②統合 ADD / UPDATE / NO-OP の処理を実行する。 ①抽出 既存の記憶を参照しながら、Core / Semantic / Episode 3つの記憶に振り分ける。 ②統合 insert / update / delete を実行し、強化学習で ポリシーを更新する。 ① ポリシーの学習 「何を覚えるべきか」の判断基準を強化学習する。 ② スキーマの学習
 記憶層の体系もエージェントが発見する。 自律化した記憶の選択 ReasoningBank 発展方向 Summary Strategyをはじめとして事実の整理・圧縮にと どまる。 あくまで、個別の事実整理を行っているだけで、再利用 できる推論戦略を抽出はできない。 「なぜうまくいったか」「なぜうまくいかないか」を分 析して教訓を記憶する。 エピソード記憶(個別の経験)を、再利用可能な推論パ ターン(知恵)として蓄積している。 記憶は保存されたままではなく、状況に合わせて再 構成されること。 MemGen(Zhang et al., 2025)が潜在表現からの文 脈依存的な記憶合成を実証したことを起点に、潜在 空間での再生成が2026年も注目されている。 推論戦略の蒸留 文脈に応じた動的な再構成 AWS AgentCore FadeMem 発展方向 短期記憶に最大365日の有効期限を設定できる。 期限が来ると削除される。セッションTTLは30日。 重要 / 不要にかかわらず、同じ期限で削除される。 手動で削除することはできる。 重要度を「意味・頻度・時間」で決め、エビングハウ ス忘却曲線に合わせて記憶を減衰させる。 使われない記憶は自然に薄れ、アクセスされた記憶は 強化されることで、自然な忘却を再現している。 Agentic Unlearning(Wang et al., 2026)をはじめとする 意図的な記憶除去が注目を浴びている。「何をいつ忘れ るか」自体を設計し、どう自律化させるかは今後の注目 ポイント。 TTLによる期限切れ削除 忘却 記憶を参照した選択 AWS AgentCore 要約・統合による事実整理 知恵化 今後の発展方向 AWS AgentCore Memory Strategy による静的な選択 選択 代表研究 忘却曲線に基づく適応的減衰 アンラーニングへの拡張

26.

久しぶり・・・

27.

Question 忘れてしまった記憶、もしも、 取り戻せるなら 取り戻したい 忘れたままでいたい 3

28.

Fin