記憶のバス停　〜AI エージェントのメモリー戦略〜

521 Views

March 25, 26

#AIエージェント #記憶 #機械学習 #認知心理学 #知識創造

スライド概要

忘れてしまった記憶、もしも、取り戻せるなら
取り戻したいですか？　忘れたままでいたいですか？

AIエージェントのメモリー戦略を話しています。

やぎ

@7707589

スライド一覧

SIerのデータサイエンティスト 2025 Japan AWS Jr.Champions

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

ベクトルサーチをやめる

やぎ 2.8K

失われたCDK王国の旗を、今こそ掲げよう

やぎ 2.3K

プロンプトエンジニアクビになる

やぎ 1.8K

井の中の蛙〜AIエージェントの内省〜

やぎ 283

猫でも分かるUnreal Engineの学び方 - 超初心者向け編 - 2023 v1.0

ue4 ue5 ue-beginner

エピックゲームズジャパン 1.7M

Unreal Engine5 Lumenの仕組みと肝心なところ

ue5 ue-rendering ue-lumen

エピックゲームズジャパン 1.5M

各ページのテキスト

記憶のバス停〜 AI エージェントのメモリー戦略〜

自己紹介やぎバスの運転手

Question 忘れてしまった記憶、もしも、取り戻せるなら取り戻したい忘れたままでいたい 3

3人の幼馴染の物語

Chapter1 選んだ記憶

私は、楽しかったことだけ持っていく

私は、楽しかったことだけ持っていく記憶を選んだ

新情報線形代数既存の概念と連結（linkage）特徴量することで記憶に定着する深層学習機械学習 escorla, R. A., & Wagner, A. R. (1972) A theory of Pavlovian conditioning: Variations in the effectiveness of reinforcement and nonreinforcement. 【認知心理学】連合学習とスキーマ新しい情報は、既存の概念との連結（linkage）を形成することで記憶に定着する。連合学習と呼ぶ。（Bower & Hilgard, 1981）。その連結先となる構造化された知識の枠組みをスキーマと呼ぶ（Bartlett, 1932; Piaget, 1976）。スキーマが精緻であるほど、新たな知識の獲得は容易になる。 R 【経営学】吸収能力（Absorptive Capacity）吸収能力とは、外部の新しい知識の価値を認識し、同化し、商業的目的に応用する能力である。中核的前提は、新しい知識の吸収には事前の関連知識が不可欠という点にある。吸収能力は累積的かつ経路依存的であり、投資を怠れば知識吸収の能力自体が失われる、ロックアウトが生じる。 Cohen, W. M., & Levinthal, D. A. (1990). Absorptive capacity: A new perspective on learning and innovation 既存知識があるほど記憶しやすい

MEM-α 3 つの記憶に対して 3 つの操作があるコア記憶意味記憶エピソード記憶最重要情報を凝縮した要約文最大512トークンであり、常にエージェントのコンテキストに入る更新するときは全体を丸ごと書き換え、部分的な編集はできない。 update のみ対応している。事実や知識を1件ずつ格納するリスト個別の知識片を独立して保持するエントリ数に上限はなく、必要に応じて増やることができる。タイムスタンプ付きのリストいつ何が起きたかを時系列で記録するエントリ数に上限はない。 insert（追加） update（更新） delete（削除）意味・エピソード記憶に新規エントリを 1件追加する。コア記憶には使えない。既存のエントリを書き換える。コアは全文書き換え。意味・エピソードは個別エントリを修正する。既存のエントリを削除する。コア記憶には使えない。過去の記憶を参照してどの記憶にどの操作をするかを決める。どの操作をするかは、強化学習（ G R P O ）でパラメータ学習する。

10.

私は、楽しかったことだけ持っていく

11.

Chapter2 知恵にした記憶

12.

僕は、あの日があったから今がある

13.

僕は、あの日があったから今がある記憶を知恵にした

14.

エピソード記憶 gist化意味記憶 Winocur, G., & Moscovitch, M. (2011). Memory transformation and systems consolidation 【認知心理学】痕跡変換理論（Trace Transformation Theory）個別の経験はまず文脈に富んだエピソード記憶として海馬に貯蔵される。時間経過と記憶の固定化（consolidation）を通じて、Context は失われ、経験の要点であるgist が抽出されて、意味記憶へと変換される（Winocur & Moscovitch, 2011）。個別の経験が繰り返し想起・再固定化されることで、汎用的な知識へと昇華される。【経営学】 SECIモデル（SECI Model of Knowledge Creation） Nonaka（1994）が提唱した、組織における知識創造の動的プロセスモデルのこと。暗黙知と形式知の間で、4つの変換モード（共同化・表出化・連結化・内面化）をサイクルすることで、個人の経験知が組織的に活用できる形式知に変換される。さらに、実践を通じて新たな暗黙知となり、経験知を言語化し再び実践に戻ることで、知識が創造される。内面化・共同化・表出化によって、経験が知識へと昇華されている。 Nonaka, I. (1994). A dynamic theory of organizational knowledge creation. 記憶（経験）を知恵にする

15.

Reasoning Bank Retrieval Extraction タスクをクエリにして、ReasoningBankから  埋め込みベースの類似度検索を行い、上位k件をエージェントのsystem instructionに入れる。タスク完了の軌跡からメモリ候補を抽出する。 ①成功/失敗の自己判定正解ラベルなしに、LLM-as-a-Judgeがクエリと軌跡だけで、タスクの成功/失敗を判定する。抽出されたメモリアイテムをReasoningBankに追加操作で統合する。これで、ReasoningBankは更新が終わる。 ②推論戦略の抽出成功軌跡から「なぜうまくいったか」を失敗軌跡からは「なぜ失敗したか」を分析し、有効な戦略や回避すべき点を抽出する。各アイテムは、title, description, contentを持つ論文ではシンプルな操作しかしてないが、改善の余地は大きい。例えば、MEM-αなども組み合わせられる。つまり、事前知識として、過去の経験から蒸留された推論戦略を与える。 Consolidation MaTTS MaTTS（Memory-aware Test-Time Scaling）とは 1タスクに対し複数の探索軌跡を生成し、結果同士を対比して蒸留の質を向上させる手法。 ①並列スケーリング複数軌跡の成功/失敗を比べ教訓を抽出する。 ②逐次スケーリング逐次で繰り返し、その過程も教訓の材料にする。　例：なぜ間違えたか、どうしてうまくいったか Ouyang et al. (2025). ReasoningBank: Launching a Bank to Reason with Evolving Memory.

16.

僕は、あの日があったから今がある

17.

Chapter3 忘れた記憶

18.

私は、忘れていたんだ

19.

私は、忘れていたんだ記憶を忘れていた

20.

貯蔵強度学習によって蓄積され、基本的には減少しない検索強度記憶への現在のアクセスしやすさ使用されないと自然に低下する Bjork, R. A., & Bjork, E. L. (1992). A new theory of disuse and an old theory of stimulus fluctuation. 【認知心理学】適応的忘却（Adaptive Forgetting） Bjork（1989）は、忘却現象を適応的メカニズムとして再解釈した。使用されない情報へのアクセスが低下することで、環境に合う情報が相対的に優先される。Bjork & Bjork（1992）は新不使用理論（New Theory of Disuse）において、記憶には、「貯蔵強度」と「検索強度」の2つのある。貯蔵強度は学習で蓄積され減少しない。検索強度は使用されないと自然に低下する。【経営学】組織的忘却（Organizational Forgetting） de Holan & Phillips（2004）は組織的忘却を、忘却の対象（既存知識／新規知識）と意図性（偶発的／意図的）の2軸で4類型に分類した。 ①記憶減衰（Memory Decay） ②獲得失敗（Failure to Capture） ③アンラーニング（Unlearning）④悪習回避（Avoiding Bad Habits）である。経営学では、①記憶減衰がはリスクであり、③アンラーニングの方が研究対象となっている。 de Holan, P.M.& Phillips,N. (2004). Remembrance of things past? The dynamics of organizational forgetting. 忘却によって最新情報に適応できる

21.

FadeMem ①入力と重要度スコアリング ②2層記憶への振り分け ③適応的指数減衰新しい記憶が入力されると、・意味的関連性（semantic relevance）・アクセス頻度（access frequency）・時間的新しさ（recency）の3要素から重要度スコアを算出する。重要度スコアに基づき、長期記憶層（LML）と短期記憶層（SML）に配置する。記憶の整理は2段階ある。 ①競合解消：既存記憶には、4つの処理をsする  ・Compatible（互換）・Contradictory（矛盾）  ・Subsumes（包含）・Subsumed（被包含） ②適応的記憶融合意味的類似度と時間近傍でクラスタリングし、圧縮する。各記憶の強度をエビングハウス忘却曲線に基づき指数関数で時間減衰する。重要な記憶ほど半減期が長い。アクセスされた記憶は強化され、間隔効果も含む。閾値以下の記憶は自動的に剪定される。 Wei et al. (2026), FADEMEM: BIOLOGICALLY-INSPIRED FORGETTING FOR EFFICIENT AGENT MEMORY

22.

私は、忘れていたんだ

23.

Epilogue

24.

25.

AIエージェントのメモリー戦略 AWS AgentCore Memory Mem - α 発展方向 ①抽出 3つのMemory Strategy（Semantic /User Preference / Summary）にしたがって情報を抽出する。 ②統合 ADD / UPDATE / NO-OP の処理を実行する。 ①抽出既存の記憶を参照しながら、Core / Semantic / Episode 3つの記憶に振り分ける。 ②統合 insert / update / delete を実行し、強化学習でポリシーを更新する。 ① ポリシーの学習「何を覚えるべきか」の判断基準を強化学習する。 ② スキーマの学習  記憶層の体系もエージェントが発見する。自律化した記憶の選択 ReasoningBank 発展方向 Summary Strategyをはじめとして事実の整理・圧縮にとどまる。あくまで、個別の事実整理を行っているだけで、再利用できる推論戦略を抽出はできない。「なぜうまくいったか」「なぜうまくいかないか」を分析して教訓を記憶する。エピソード記憶（個別の経験）を、再利用可能な推論パターン（知恵）として蓄積している。記憶は保存されたままではなく、状況に合わせて再構成されること。 MemGen（Zhang et al., 2025）が潜在表現からの文脈依存的な記憶合成を実証したことを起点に、潜在空間での再生成が2026年も注目されている。推論戦略の蒸留文脈に応じた動的な再構成 AWS AgentCore FadeMem 発展方向短期記憶に最大365日の有効期限を設定できる。期限が来ると削除される。セッションTTLは30日。重要 / 不要にかかわらず、同じ期限で削除される。手動で削除することはできる。重要度を「意味・頻度・時間」で決め、エビングハウス忘却曲線に合わせて記憶を減衰させる。使われない記憶は自然に薄れ、アクセスされた記憶は強化されることで、自然な忘却を再現している。 Agentic Unlearning（Wang et al., 2026）をはじめとする意図的な記憶除去が注目を浴びている。「何をいつ忘れるか」自体を設計し、どう自律化させるかは今後の注目ポイント。 TTLによる期限切れ削除忘却記憶を参照した選択 AWS AgentCore 要約・統合による事実整理知恵化今後の発展方向 AWS AgentCore Memory Strategy による静的な選択選択代表研究忘却曲線に基づく適応的減衰アンラーニングへの拡張

26.

久しぶり・・・

27.

Question 忘れてしまった記憶、もしも、取り戻せるなら取り戻したい忘れたままでいたい 3

28.

Fin

記憶のバス停 〜AI エージェントのメモリー戦略〜

やぎ

関連スライド

ベクトルサーチをやめる

失われたCDK王国の旗を、今こそ掲げよう

プロンプトエンジニアクビになる

井の中の蛙〜AIエージェントの内省〜

猫でも分かるUnreal Engineの学び方 - 超初心者向け編 - 2023 v1.0

Unreal Engine5 Lumenの仕組みと肝心なところ

各ページのテキスト

記憶のバス停　〜AI エージェントのメモリー戦略〜