対話型AIの記憶管理〜ライブラリ調査を通して〜

1.

AI Talks #7 - 対話型AIの記憶管理対話型AIの記憶管理〜ライブラリ調査を通して〜 Tomoki Yoshida (birder) DeNA AI技術開発部AIイノベーショングループ 2026-03-24 Tomoki Yoshida (birder) - DeNA

2.

AI Talks #7 - 対話型AIの記憶管理自己紹介吉田知貴（birder） Tomoki Yoshida (birder) - DeNA 学生時代機械学習凸最適化の高速化 (KDD2018, KDD2019) 2018年 DeNAサマーインターン社会人 2020年 DeNA新卒入社エネルギー事業（組み合わせ最適化）ライブ配信Pococha（CS審査効率化、レコメンド）新規AIプロダクト開発 Qiita: @birdwatcher X: @birdwatcherYT 1 / 19

3.

AI Talks #7 - 対話型AIの記憶管理対話型AIの記憶管理こういう体験を実現したい↓ （1ヶ月前）人間「パソコンが壊れた」（今日）人間「パソコンを買ったよ」 → AI「前壊れたって言ってたもんね！」 1ヶ月間の対話を全部LLMに入れるわけにもいかないがどうすればいい...？ Tomoki Yoshida (birder) - DeNA

4.

AI Talks #7 - 対話型AIの記憶管理コンテキスト管理をしよう LLMの限界コンテキストウィンドウ（入力上限）がある（小説8冊分とか入る）詰め込みすぎると指示を無視したり、遅くなったり、性能劣化する ↓ LLMに与える情報を管理してあげる必要があるコンテキストエンジニアリング無数に増えていく会話履歴やユーザー情報をどう保存するか（そのまま？ラベル付け？集計？圧縮？）どう検索するか（最新N件？関連度？重要度？） Tomoki Yoshida (birder) - DeNA 2 / 19

https://ai.google.dev/gemini-api/docs/long-context?hl=ja

5.

AI Talks #7 - 対話型AIの記憶管理コンテキスト管理で意識することデータ取得時⼊⼒ LLM 検索クエリ加⼯処理 USER 検索結果データ保存時データ発⽣応答 DB データ取得時の検索クエリとデータ保存時の加工処理が設計ポイント！レイテンシを気にする会話では取得時の処理の重さを気にすることになる保存処理は非同期（バックグラウンド）でやれることが多いので重くてもOK 保存時期と量: セッション単位（履歴をまとめて） or 毎ターン（直近1-2ターン） Tomoki Yoshida (birder) - DeNA 3 / 19

6.

AI Talks #7 - 対話型AIの記憶管理記憶管理のノウハウを持ったいろんなライブラリ Vec: ベクトル検索 KG: ナレッジグラフ Prof: 抽出済みプロフィール QE: クエリ拡張 Rerank: リランキング Agent: Agentic検索分類 Vec KG Prof QE Rerank Agent 記憶管理 Mem0 ○ ○ ○ Zep, Graphiti ○ ○ ○ ○ Letta (旧MemGPT) ○ ○ ○ ○ SimpleMem ○ ○ ○ MemOS ○ ※ ○ ○ ○ MemoryOS ○ ○ Memary ○ ○ GraphRAG ○ ○ ○ 汎用FW LangChain, LangGraph ○ ○ ○ ADK ○ ○ ○ LlamaIndex ○ ○ ○ ○ ○ 汎用Agent OpenCode ○ ※ グラフDBで記憶を構造化管理するが、検索時のグ OpenClaw ○ ○ ○ ラフ走査はなし Tomoki Yoshida (birder) - DeNA 4 / 19

7.

AI Talks #7 - 対話型AIの記憶管理取得時の手法とレイテンシ手法速度感抽出済み情報（プロフィール等）即座（検索不要）全文検索, ベクトル検索, ハイブリッド検索高速（数十〜数百ms）リランキング（CrossEncoder等）やや重い（手法に依る）クエリ拡張やや重い（LLM呼び出し）ナレッジグラフ（Graph RAG）重い Agentic検索重い（複数回LLM呼び出し）ライブラリを使えばOKというより、プロダクトの性質に合わせて設計する必要がある → 自分で作れるように、各手法や工夫を紹介していく Tomoki Yoshida (birder) - DeNA 5 / 19

8.

AI Talks #7 - 対話型AIの記憶管理短期記憶長期記憶の前に... Tomoki Yoshida (birder) - DeNA

9.

AI Talks #7 - 対話型AIの記憶管理短期記憶: セッション内メモリシステム的に扱いやすい小さい単位（セッション）があれば会話履歴をそのまま扱う [ ] {"role": "user", "content": "こんにちは！"}, {"role": "assistant", "content": "こんにちは！どうしましたか？"}, {"role": "user", "content": "この前、〇〇したんだよね〜"} 基本、会話するたびにappendするだけ（コンテキストキャッシュが効く）長い会話やセッション概念がない場合はスライドウィンドウや圧縮が入るスライドウィンドウ: 古い履歴を削除 or 古い履歴を要約して圧縮（LangChain, Letta, ADK, Gemini Live API等）直近N件は保護し、古いツール出力の削除(OpenCode, OpenClaw, LangChain) Tomoki Yoshida (birder) - DeNA 6 / 19

https://docs.cloud.google.com/vertex-ai/generative-ai/docs/live-api/start-manage-session?hl=ja#configure_the_context_window_of_the_session

10.

AI Talks #7 - 対話型AIの記憶管理短期記憶: 直近セッションの情報セッションまたいだら記憶が失われる対策前回セッションの会話履歴（の一部）直近N回のセッションの会話履歴の要約保存時: 要約は非同期で行えば良い取得時: 直近N件取ってくるだけ ChatGPTは直近15セッションの要約と噂がある（非公式） SimpleMemでは、セッション開始時にサマリー（~5件）→過去セッションの知見（~20件）→ セマンティック検索（~10件）の優先度順で指定トークン上限まで入れる Tomoki Yoshida (birder) - DeNA 7 / 19

https://manthanguptaa.in/posts/chatgpt_memory/

11.

AI Talks #7 - 対話型AIの記憶管理長期記憶 Tomoki Yoshida (birder) - DeNA

12.

AI Talks #7 - 対話型AIの記憶管理長期記憶: 抽出済み情報（プロフィール）毎回必ずコンテキストに含めたいユーザーの情報を定義して抽出例: 名前、生年月日、趣味、家族、重要イベントなどサービスで重要なこと MemoryOSでは性格・嗜好傾向を51項目で構造化抽出保存時: 会話から情報抽出、取得時: 全部入れるだけ 💬 セッション内の会話 📋 現在のプロフィール input 🤖 LLM 会話から情報抽出 input output 📝 新しいプロフィール { "ニックネーム": "birder", "趣味": ["⿃⾒", "散歩"], "⼝調": "カジュアル"} ChatGPTもこれに似た噂があり、わかっているフリならこれでOK （私は最近ChatGPTにメモリを整理しろと言われてますが、UI上からも抽出している情報が見えますね） Tomoki Yoshida (birder) - DeNA 8 / 19

https://manthanguptaa.in/posts/chatgpt_memory/

13.

AI Talks #7 - 対話型AIの記憶管理長期記憶: ベクトル検索（典型的なRAG）ベクトル検索で現在の会話内容に関連した過去の情報を取得利⽤時 1. 👤 ユーザー⼊⼒（クエリ）クエリ拡張 (option) 検索⽂字列を作るスキップ可：⼊⼒そのまま or 直近N会話丸ごと 2. Embedding 3. ベクトルへ〜程度 100ms 200ms 全⽂検索 / ベクトル検索（Hybrid Search） 4. 数⼗msの単位で⾼速検索実⾏ & 候補取得 Embedding 保存リランキング (option) 重いケースもある 📋 関連する記憶上位k件保存時 💬 セッション内の会話すべてデータ変換話題ごとに分割 / 要約等 🗄 ベクトルストア（インデックス付き）保存時: ファクト抽出 or 要約 or 話題分割など一般的なRAGテクニックも使える Mem0は、会話から事実をLLMで抽出し7カテゴリ（嗜好、個人情報、計画等）に分類 SimpleMemは、代名詞解決・相対時間の絶対化・アトミックな事実文への分解 Tomoki Yoshida (birder) - DeNA 9 / 19

https://github.com/NirDiamant/RAG_Techniques

14.

AI Talks #7 - 対話型AIの記憶管理検索精度を上げる工夫ハイブリッド検索: ベクトルと全文検索などの組み合わせ OpenClaw: ベクトルスコア×0.7 + BM25スコア×0.3 の重み付き合算 MemOS: グラフ、ベクトル、BM25、全文検索の4手法の並列後リランククエリ拡張: 指示語解決や文脈補完、言い換えなどで検索用文字列を生成 MemOS: LLMでサブクエリに分解→各embeddingで並列検索リランキング: 検索結果をモデルで並べ替え Mem0: Cohere、SentenceTransformer等 Zep: RRF、MMR、CrossEncoder等5種のリランカー BM25: 全文検索のスコア, RRF: 順位の逆数のスコア, MMR: 多様性確保の指標, CrossEncoder: 質問と文書から関連スコアを出すモデル, Cohere: リランキングAPI（企業名） Tomoki Yoshida (birder) - DeNA 10 / 19

15.

AI Talks #7 - 対話型AIの記憶管理長期記憶: Graph RAG Entity（ノード）とRelation（エッジ）をナレッジグラフに保存し、構造的に検索ナレッジグラフ好き sentence ---------------------- 私は⿃が好きで、チノとグラという名で飼っています LLM 変換私飼育チノ is 飼育グラ is ⿃保存時: LLMでEntity&Relation抽出 → 既存ノードと類似度マッチで重複判定検索時: Entity抽出 → 表記ゆれ吸収 → Cypherテンプレ走査 → BM25リランク補足: 上記はMem0の実装。MS GraphRAGはグラフをクラスタ化し、コミュニティ単位で要約レポートを生成。検索はEntity周辺・要約集約などモード選択が必要。これらのライブラリではLLMでCypherクエリ生成が難しい点をテンプレで解決している。（LangChain Neo4jはLLMで生成しているが困難）課題: 対策しても表記ゆれは起きる、遅い、 LLM依存度が高く不安定（個人の感想） 11 / 19 Tomoki Yoshida (birder) - DeNA

https://github.com/langchain-ai/langchain-neo4j

16.

AI Talks #7 - 対話型AIの記憶管理記憶整理（忘却、更新、重複排除）古い記憶を使いたくない（忘却）フィルター: ベクトル検索時にタイムスタンプで絞る時間減衰: スコアに減衰関数を掛けて古い記憶の優先度を下げるベクトル検索のインデックスが効かなくなるのでリランキングで対応記憶のアップデートをしたい（重複判定含む）保存時にベクトル検索で既存記憶を取得→LLMが比較して判定（Mem0）例: 「ペットを飼っている」+「嘘でした」→ 削除例: 「ペットを1匹」+「もう一匹飼った」→ 「ペットを2匹飼っている」記憶の変化を追跡したい（例: 「独身」→「結婚した」→「離婚した」など）タイムスタンプや有効期間を付与し検索後に推移を追跡可能に（Zep） Tomoki Yoshida (birder) - DeNA 12 / 19

https://milvus.io/docs/ja/decay-ranker-overview.md

17.

AI Talks #7 - 対話型AIの記憶管理長期記憶: Agentic検索 Agentがコンテキスト取得ツールを何度も呼び出し、目的のコンテキストを探す OpenCode: grep, glob, read等のツールを持つexplore専用サブエージェントへ依頼（Claude Code, Cursorなども同様と推測） Letta: 記憶の読み書きツールをエージェントが自分で判断して呼び出す MemOS: クエリ分析→検索→十分性Reflection→再検索のループ一般会話での難しさについて経験談: ツール呼び出し判定がシビア（毎回調べるか全く調べないかになってしまう）いつ調べるべきなのかわからないし、情報の十分性の基準もわからない LLMを取り巻くループ構造、ツール、環境、停止条件の設計 → ハーネスエンジニアリングが重要レスポンス速度が遅い（自然な会話は500ms~1s程度で返さないと不自然） Tomoki Yoshida (birder) - DeNA 13 / 19

https://blog.langchain.com/the-anatomy-of-an-agent-harness/

18.

AI Talks #7 - 対話型AIの記憶管理その他の工夫ラベル付け: メタデータ付与でSQLフィルタ検索を可能に（SimpleMem, Letta）階層型管理: 短期→中期→長期へ自動昇格（MemoryOS: deque溢れ→LLM要約でセッション化→ヒートスコア超で長期へ）参照カウント: エンティティ参照回数の上位N件を優先注入（Memary）重要度スコア: 記憶にスコアを持たせてメンテナンスに活用 MemoryOS: ヒートスコア=訪問回数・対話長・時間減衰の重み付き和 SimpleMem: 時間減衰・重複マージ判定・低スコア刈り込みに使用レスポンス高速化並列処理、Streaming、Thinkingを切る、フィラー（「えーと」等）時間稼ぎ今までの会話情報から事前に検索しておく、予測して準備しておく Tomoki Yoshida (birder) - DeNA 14 / 19

19.

AI Talks #7 - 対話型AIの記憶管理ここまでの知識を使って設計してみよう！ Tomoki Yoshida (birder) - DeNA

20.

AI Talks #7 - 対話型AIの記憶管理設計例1: セッション単位で処理応答時現在セッションの会話履歴 answer 関連する会話履歴プロフィール対話LLM human sentence sentence クエリ拡張 LLM 拡張query Embedding embedding 保存時 session human sentence 会話履歴テーマ分割 LLM テーマごとの会話履歴 DB embedding, Embedding テーマごとの会話履歴 vector table sentence 対話LLM 会話履歴プロフィール抽出 LLM プロフィール table セッション終了後にテーマ分割・プロフィール抽出で一括保存し、応答時は現在セッション＋検索でコンテキストを組み立てる Tomoki Yoshida (birder) - DeNA 15 / 19

21.

AI Talks #7 - 対話型AIの記憶管理設計例2: ファクト抽出とリアルタイム更新直近の対話履歴保存時：リアルタイム更新抽出データラベル付け& 要素抽出LLM 抽出データ Embedding 応答時直近の対話履歴 human answer 対話LLM 類似情報常時参照データ (ラベルフィルタ) 類似判定兼マージLLM 類似あり: マージ結果再Embedding DB Embedding sentence 類似する既存データ類似なし: embedding, 抽出データ類似検索類似検索 vector table embedding, マージ結果対話のたびに抽出・類似判定でDBを更新し、応答時は類似検索とラベルで取得する Tomoki Yoshida (birder) - DeNA 16 / 19

22.

AI Talks #7 - 対話型AIの記憶管理設計例3: Agenticサーチサブエージェント（ReAct 型） Explore コンテキスト探索指⽰ + これまでの探索履歴 ----------------------------Observation (Thought / Action / Observation) ツール選択・実⾏ベクトル検索全⽂検索 KG 検索要約検索プロフィール取得 Thought: Action: ⼊⼒ LLM 推論) ( ⼗分な情報が集まった収集した関連コンテキスト返却親エージェント次にどこを探すかツール呼び出し探索を委任ループして適応的に記憶検索ツールを使いこなし、必要なコンテキストを収集する（簡易実装ではLangChainの creat_agent 、ADKの LlmAgent 、Mastraの Agent 等の tools に与えるだけ）余談: 会話履歴をファイルに置いて汎用Coding Agentに任せるパターンもありうるが、OpenCodeでは list/globは100ファイル、grepは100マッチ、readは2000行と50KB、1行2000文字で打ち切りされる。ファイル数や1ファイルの容量が増えるとtruncate後に、クエリ変えつつgrepやoffset変えつつreadするなど探索が必要で、探索回数が増えて、性能が落ちる可能性がある。 17 / 19 Tomoki Yoshida (birder) - DeNA

23.

AI Talks #7 - 対話型AIの記憶管理手法と改善イメージ 1年前:「文鳥チノを飼っている」「文鳥がペレットを食べない」 1ヶ月前:「パソコンが壊れちゃった」「来月登壇イベントがあるんだ」 1週間前:「文鳥の雛にグラって名付けた」一昨日:「明後日キャンプ行くんだ」手法人間の入力 AIの応答解説 ️どんなパソコンを買ったの？当然覚えてないベースラインパソコンを買ったよ今日めちゃめちゃ暑い ️そうだね！適当に合わせた応答をする現在日時付与今日めちゃめちゃ暑い 3月なのになんかあった？重要体験。記憶との時間関係でも必須プロフィールペットショップに行かなきゃチノのエサが切れちゃった？ペットのような関係性を抽出し保持直近サマリー今日は楽しかったなーお、今日キャンプだった？直近情報を常に入れておけば可能パソコンを買ったよ前壊れたって言ってたもんね！類似度高い会話を検索成功ベクトル検索そろそろ登壇がある → 前その話した？ ️初めて聞いたよ「前その話した？」では検索失敗今日は緊張したよ ️お疲れ様。なんかあった？「緊張」で類似検索しても無理 → 前その話した？先月言ってた登壇イベントだね文脈から「登壇」を検索クエリ拡張そろそろ登壇があるパソコンで登壇資料作らなきゃ PC直ったの？そろそろ登壇だね「PC」「登壇」に複数クエリ分割全文検索グラが飛べるようになった文鳥の成長は早いねベクトル検索で弱い固有名詞対策保存時クエリ予測今日は緊張したよもしかして登壇今日だった？保存時に「緊張」が来ると予想 Agentic検索チノのご飯買わなきゃ文鳥チノちゃんにはシードだねチノ→文鳥、文鳥→ペレット嫌い発見 Tomoki Yoshida (birder) - DeNA 18 / 19

24.

AI Talks #7 - 対話型AIの記憶管理まとめ設計の軸は保存時の加工と取得時の検索短期〜長期記憶、細かい工夫まで手法が多彩 → 要件に応じた設計が必要 OSSの実装を参考に、プロダクトに合った組み合わせを探ろう前回の資料今回の資料 Tomoki Yoshida (birder) - DeNA 19 / 19

25.

AI Talks #7 - 対話型AIの記憶管理 Appendix 各ライブラリ調査レポート（読み物） AIと壁打ちしながらレポジトリを理解したメモ。一部実際に触ってみた感想。 Tomoki Yoshida (birder) - DeNA

26.

AI Talks #7 - 対話型AIの記憶管理調査対象バージョンライブラリバージョン最終コミット日 Mem0 v1.0.5 2026-03-09 Zep v1.0.2 2026-02-14 Graphiti v0.28.2 2026-03-11 Letta 0.16.6 2026-03-03 SimpleMem v0.1.0 2026-02-26 MemOS v2.0.8 2026-03-09 MemoryOS V1.2 2026-03-03 Memary v0.1.5 2024-10-18 GraphRAG v3.0.5 2026-03-06 Tomoki Yoshida (birder) - DeNA ライブラリバージョン最終コミット日 LangChain 1.2.11 2026-03-10 LangGraph 1.1.1 2026-03-11 ADK v1.25.0 2026-03-10 LlamaIndex v0.14.16 2026-03-10 OpenCode v1.2.24 2026-03-11 OpenClaw v2026.3.8 2026-03-11

27.

AI Talks #7 - 対話型AIの記憶管理 Mem0（1/2） AIアシスタントやエージェントに長期記憶レイヤーを提供するライブラリ短期記憶は持たない基本的にシンプルなベクトル検索という印象（グラフはデフォルトでOFF） user_idごとの会話を保存できる LLMでファクト（事実文）抽出 → ベクトルストアに保存抽出カテゴリは7種（嗜好、個人情報、計画、健康、職業…） ️「元気？」は保存されたので、追加プロンプトでチューニングは必要 → custom_fact_extraction_prompt で抽出処理をカスタマイズ可能ベクトルストア20種以上サポート（Qdrant, Chroma, PGVector, Milvus, FAISS…） ️常にコンテキストに含めたい情報（名前等）を管理する仕組はがない検索結果に含まれる保証がないので、重要情報を毎回確実に渡せない Tomoki Yoshida (birder) - DeNA

28.

AI Talks #7 - 対話型AIの記憶管理 Mem0（2/2）記憶更新: 新ファクトと既存記憶をLLMに比較させ ADD, UPDATE, DELETE, NONE を自動判定関連する既存記憶の上位5件だけを取ってきて比較している ️軽く試した感じ重複しやすい・修正がイマイチなことも（強いモデルと明確な指示が必要かも）リランキング対応（Cohere, SentenceTransformer, HuggingFace, ZeroEntropy, LLM Reranker） ️クエリ拡張は無い（単純にクエリ文字列をそのままembedding）単体の会話を投げると失敗する可能性あり → 前処理やコンテキストをまとめて検索が必要ナレッジグラフにも対応（Neo4j, Memgraph, Neptune, Kuzu） LLMでエンティティ抽出 → リレーション抽出 → embedding類似度で既存ノードと意味的マッチ表記ゆれ対策: 文字列正規化 + embedding類似度でノードの同一性判定 ️グラフは不安定＆遅くて実用性に課題 Tomoki Yoshida (birder) - DeNA

29.

AI Talks #7 - 対話型AIの記憶管理 Zep, Graphiti（1/2） Graphitiベースの時系列ナレッジグラフを活用するコンテキストエンジニアリングプラットフォーム短期記憶 PostgreSQLにメッセージ保存、 lastN （デフォルト4〜6件）で直近N件を取得 OSS版に明示的な要約・圧縮はない（Cloud版の"summary"モードで対応） Graphiti: 時系列ナレッジグラフ検索: 4種: Node（エンティティ）, Edge（ファクト）, Episode（エピソード）, Community（クラスタ）アルゴリズム: BM25 + コサイン類似性 + BFSの組み合わせ保存: エンティティ抽出、関係性抽出、重複除去が行われる Tomoki Yoshida (birder) - DeNA

30.

AI Talks #7 - 対話型AIの記憶管理 Zep, Graphiti（2/2）長期記憶取得時は直近4メッセージでGraphitiを検索し、関連Fact（最大5件）を取得 Node, Edge, Episode の3つを並列検索各Factに valid_at , invalid_at で事実の時間的変遷を追跡 PydanticでKGのスキーマ（ノード型・エッジ型）をドメインごとにカスタム定義可能デフォルト9種: User, Assistant, Preference, Location, Event, Object, Topic, Organization, Document 5種のリランカー: RRF（逆順位和）, MMR（多様性確保）, node_distance（グラフ距離）, episode_mentions（頻度）, cross_encoder ソフトデリート + 定期パージ方式（ deleted_at → purgeDeleted で物理削除） Tomoki Yoshida (birder) - DeNA

31.

AI Talks #7 - 対話型AIの記憶管理 Letta（1/3）旧MemGPT。OSの仮想メモリ管理に着想を得たステートフルAIエージェントプラットフォーム短期記憶: コアメモリ（ブロック）+ メッセージ要約「ブロック」をシステムプロンプトに埋め込み、エージェント自身がツール呼び出しで読み書きブロック: デフォルトは persona （AIの性格）と human （ユーザー情報）の2つ。任意追加可能追記・置換・行挿入・全書き換え等の編集ツールを5種提供多彩なコンパクション戦略（ CompactionSettings で切り替え） Static Buffer: 固定件数（デフォルト60件）超過で古いメッセージを削除、最小15件保持 Partial Evict: メッセージの30%を削除し、LLMで要約してindex 1に挿入（同期） Sliding Window: スライディングウィンドウ式の部分要約（自身のLLMで行うモードも選択可能）多段フォールバック: 自身のLLMで要約 → 専用処理で要約 → ツール出力切り詰め → 中間部削除トリガー: コンテキストウィンドウの90%超過時、またはLLMがコンテキスト超過エラーを返した時要約プロンプトは7項目（目標、経緯、重要詳細、エラー修正、現状、次ステップ、検索ヒント） Tomoki Yoshida (birder) - DeNA

32.

AI Talks #7 - 対話型AIの記憶管理 Letta（2/3）長期記憶: アーカイバルメモリ + 会話検索エージェントが重要と判断した情報をツール呼び出しで長期記憶に保存・検索（ベクトル検索） 3つのベクトルDBバックエンド: PostgreSQL pgvector（デフォルト）, Turbopuffer, Pinecone Turbopuffer: ハイブリッド検索（ANN + BM25 → RRF統合）、タグ・日付範囲フィルタ Pinecone: リランキング対応（ bge-reranker-v2-m3 ）会話検索: conversation_search ツールで過去メッセージをハイブリッド検索（同じ仕組み）ソフトデリート（ is_deleted フラグ）。タグの自動重複排除 ️TTL・時間減衰は未実装 Tomoki Yoshida (birder) - DeNA

33.

AI Talks #7 - 対話型AIの記憶管理 Letta（3/3）工夫メインとは別に、バックグラウンドで動作するSleeptimeエージェントが会話後に記憶を整理メイン応答完了後、Nターンに1回バックグラウンドタスクを発行 Sleeptimeエージェントは会話トランスクリプトを受け取り、共有コアメモリブロックを更新役割分担: メインは応答と検索に専念し、コアメモリの編集はSleeptimeに委任 Git-backedコアメモリ: ブロックをgitリポジトリに保存し変更履歴をコミット単位で追跡コアメモリに行番号を付与し、エージェントが行単位で挿入・編集可能にツール呼び出しにルール制約（終了条件、呼び出し順序、回数上限等）を設定可能 ReActスタイルのエージェントループ（最大50ステップ） Tomoki Yoshida (birder) - DeNA

34.

AI Talks #7 - 対話型AIの記憶管理 SimpleMem（1/2）対話エージェント向けの長期記憶フレームワークリアルタイムな保存処理対話をLLMで構造化された記憶ユニット（MemoryEntry）に変換代名詞の排除、相対時間→ISO 8601絶対化、アトミックな事実文への変換、Embedding 前ウィンドウの記憶エントリ（最大3件）を参照コンテキストとしてLLMに渡し重複を抑制 Provenance Tracking: 記憶エントリとソースエビデンスの紐付けを維持検索 3層ハイブリッド検索: 意味検索（embedding）+ キーワード検索（BM25）+ メタデータフィルタ（日時・場所・人名等）を並列実行 LLMが情報要件分析 → ターゲットクエリ生成（最大4件）→ 3層並列検索 → Reflection（十分性判定、最大2ラウンド） Tomoki Yoshida (birder) - DeNA

35.

AI Talks #7 - 対話型AIの記憶管理 SimpleMem（2/2）セッション間の記憶保存時: セッション終了時にサマリー: セッションのLLM要約 Observation: ツール使用やファイル変更等のイベントからヒューリスティック抽出取得時: セッション開始時に「サマリー（最大5件）→過去セッションの知見（最大20件）→セマンティック検索（最大10件）」の優先度順で指定トークン上限（デフォルト2000トークン）まで入れる記憶整理: Consolidation Worker（Decay→Merge→Prune の3フェーズ） Decay: 90日超のエントリに importance × 0.9 の減衰 Merge: cosine類似度 0.95超のペアで importance が低い方をソフト削除 Prune: importance 0.05未満のエントリを論理削除 Tomoki Yoshida (birder) - DeNA

36.

AI Talks #7 - 対話型AIの記憶管理 MemOS（1/2）汎用AIエージェント向けのMemory Operating System 保存: メッセージ追加時に全メモリタイプを同時生成メッセージ追加API呼び出し時にリアルタイムで記憶抽出（同期/非同期どちらも対応）二段階処理: LLM不要で即保存 → 非同期でLLMが構造化抽出・タイプ振り分け（レイテンシ隠蔽）記憶抽出時の入力は1024トークンのスライドウィンドウで分割（200トークンオーバーラップ） WorkingMemoryは上限20件のFIFO管理（80%到達時に古いものから事前削除） embedding類似度（≥0.8）でLLMが矛盾, 冗長, 独立を判定 → 融合 or タイムスタンプで新しい方を残す幻覚フィルタリング: LLM抽出後の記憶を原文対話と照合して根拠のない記憶を除外 GraphStructureReorganizer: バックグラウンドでKMeans+LLMによるクラスタリング→要約親ノード→関係エッジの自動生成 MemFeedback: 自然言語による記憶の修正（キーワード置換、セマンティック更新）ステータス管理: activated, resolving, archived, deleted Tomoki Yoshida (birder) - DeNA

37.

AI Talks #7 - 対話型AIの記憶管理 MemOS（2/2）検索メモリタイプ別に以下を並列検索し、リランカーで統合: WorkingMemory: 直近の記憶（上限小さいので全件取得） LongTermMemory: 会話から抽出された長期的な知識 UserMemory: ユーザーの属性・嗜好（16項目の客観情報+9項目の主観情報） ToolMemory: ツールのスキーマや過去の実行履歴 SkillMemory: エージェントが習得したスキル PreferenceMemory: ユーザーの好み・設定 LongTermMemory+UserMemoryはグラフ検索+ベクトル検索+BM25+全文検索の4手法を併用 CoTクエリ拡張: 複雑なクエリをLLMでサブクエリに分解→各embeddingで並列検索 Agentic検索: QueryRewriter → メモリ検索 → ReflectionAgent（十分性判定）→ 不足なら再検索ループ Tomoki Yoshida (birder) - DeNA

38.

AI Talks #7 - 対話型AIの記憶管理 MemoryOS（1/2）パーソナライズ対話AI向け。OSのメモリ管理メタファーを徹底した3層階層型アーキテクチャ短期記憶（deque） deque(maxlen=10) で生の会話ペアを保持。要約・圧縮なし満杯になると最古の会話ペアが中期記憶へ追い出し中期記憶（セッション + FAISS + ヒープ）追い出された会話ペアをLLMでマルチトピック要約（最大2テーマ）→ テーマ別にセッション化セッションマージ判定: 意味的類似度 + キーワードJaccard類似度の合算スコア 2段階検索: FAISSでセッション絞り込み → 会話ペア単位で類似度フィルタ → 全体からtop-N選出ヒートスコア: 検索ヒット回数 + 蓄積会話ペア数 + 直近アクセス度（時間減衰）の重み付き合算ページ間の双方向リンクで会話連鎖を保持 LFU追い出し（セッション数がmax_capacityを超えた場合） Tomoki Yoshida (birder) - DeNA

39.

AI Talks #7 - 対話型AIの記憶管理 MemoryOS（2/2）長期記憶（プロフィール + ナレッジ）ヒートスコアが閾値を超えると昇格トリガー → LLMで並列に以下を実行パーソナリティ分析（プロンプト上は「90次元」だが実装は51次元: Big Five+Needs 16、AI Alignment 8、コンテンツ興味タグ 27）知識抽出（ユーザー私的データ + アシスタント知識を分離管理）ナレッジは deque(maxlen=100) で容量管理。FAISSで検索検索は3並列実行（中期記憶、ユーザー知識、アシスタント知識） Embeddingキャッシュ（10,000エントリ超で古い1,000件を削除） Tomoki Yoshida (birder) - DeNA

40.

AI Talks #7 - 対話型AIの記憶管理 Memary（1/2）ツール呼び出し型パーソナルエージェント向けのKGベース記憶管理ライブラリ短期記憶 Context （role+content）のリストで会話履歴を保持（JSONファイルに永続化）先頭2件と末尾5件は保護。中間メッセージをLLMで50語に要約（約2867トークン超過で発火）長期記憶: ナレッジグラフ + Memory Module の二層構造ナレッジグラフ: エージェントの応答を自動的にトリプレットとしてKGに書き戻し（自己成長型）検索はキーワードモード + LLMによる動的同義語展開 + 深さ1〜2のサブグラフ取得 KGにヒットなければPerplexity APIで外部検索にフォールバック Memory Stream: エンティティ名+タイムスタンプのログ（知識の幅=breadth） Entity Knowledge Store: エンティティごとの参照回数+最新日時（知識の深さ=depth）参照回数上位20エンティティをコンテキストに注入してパーソナライズ ️実装にバグの疑いあり（上位ではなく下位が選択されている可能性） Tomoki Yoshida (birder) - DeNA

41.

AI Talks #7 - 対話型AIの記憶管理 Memary（2/2）記憶整理による日数ベース削除はあるが自動発火なし Entity Knowledge Store レベルで同名エンティティは1件に統合（参照回数は加算） ️TTL・時間減衰・矛盾検出は未実装アーキテクチャモノリシック構成。LlamaIndex ReActエージェントによる Thought→Action→Observation ループペルソナファイル（system, user）を手動作成し、エージェントの性格・ユーザー属性を常駐 ️ベクトル検索を使わずKGのキーワード検索に依存 → セマンティックなあいまい検索に弱い remove_old_memory(days) Tomoki Yoshida (birder) - DeNA

42.

AI Talks #7 - 対話型AIの記憶管理 GraphRAG（1/2） Microsoft GraphRAG。非構造テキストからLLMでナレッジグラフを構築するバッチ型パイプライン保存時: ナレッジグラフ構築テキストチャンク → LLMでエンティティ・リレーションシップ抽出 → 説明文のLLM要約 → Hierarchical Leidenで階層コミュニティ構築 → コミュニティレポート生成 Gleanings: 「多くのエンティティが見落とされている」とLLMに追加抽出を繰り返し促す増分インデックス: 差分ドキュメントのみ処理→旧インデックスとマージ検索時: 4つの戦略 Local Search: エンティティ中心。ベクトル類似度でエンティティ特定 → コミュニティレポート+テキストチャンク+エンティティテーブルをトークン予算に配分 Global Search: コミュニティレポートのMap-Reduce。並列LLMでスコア付き要点抽出→集約 DRIFT Search: HyDE（仮説文書embedding）→ フォローアップクエリで反復的にLocal Search深堀り Basic Search: テキストユニットへの直接ベクトル検索（標準RAG） Tomoki Yoshida (birder) - DeNA

43.

AI Talks #7 - 対話型AIの記憶管理 GraphRAG（2/2）工夫 Dynamic Community Selection（Global Searchのオプション）: ルートから階層的にLLMで関連度評価（0-5）→ 閾値以上のコミュニティだけ再帰探索リレーションシップの優先順位: in-network（選択エンティティ間）を最優先、out-networkは共有リンク数でソートコンテキスト枠の厳密管理: 各セクション（会話履歴、コミュニティ、エンティティ等）にトークン上限を個別配分全検索モードでストリーミング対応タイムスタンプ自動管理（年月日時を分解してフィルタ可能なフィールドとして保存） ️TTLや時間減衰スコアリングは未実装 Tomoki Yoshida (birder) - DeNA

44.

AI Talks #7 - 対話型AIの記憶管理 LangChain, LangGraph（1/2） LLMアプリケーション構築フレームワーク + ステートフルエージェント基盤短期記憶 SummarizationMiddleware: トークン超過時に古いメッセージをLLMで構造化要約に置換ユーザーの目的・意思決定・変更ファイル・残タスクの4セクション ContextEditingMiddleware: トークン超過時に古いツール出力を [cleared] に置換（直近N件保護） Checkpoint: thread_id単位で実行状態をステップごとにスナップショット → 同一thread_idで会話継続タイムトラベル: checkpoint_id指定で過去の任意の状態に巻き戻し可能 pre_model_hook, post_model_hook: LLM呼び出し前後にカスタムロジックを差し込む拡張点ノード出力キャッシュ: 同一入力に対するノード再実行をスキップ（TTL付き） Classic Memory（deprecated）: Buffer, Window, Summary, SummaryBuffer 等 Tomoki Yoshida (birder) - DeNA

45.

AI Talks #7 - 対話型AIの記憶管理 LangChain, LangGraph（2/2）長期記憶スレッド横断の汎用KVストア（階層パスでユーザーやプロジェクト別に分離可能）記憶の抽出・保存ロジックは組み込まれず、開発者がノード内で実装する「インフラ」ベクトル検索・フィルタ検索に対応 TTL: 読み書き時にリフレッシュ（頻繁にアクセスされるアイテムは期限切れにならない） Classic Memory（deprecated）: VectorStoreRetrieverMemory, EntityMemory, KGMemory 等 LangChain Community にKGメモリ（NetworkX）、LangChain Neo4j にグラフDB連携あり Tomoki Yoshida (birder) - DeNA

46.

AI Talks #7 - 対話型AIの記憶管理 ADK（1/2） Google Agent Development Kit。エージェント構築フレームワーク。記憶管理はフレームワークの一機能短期記憶: 多彩なコンテキスト制御 2つの圧縮戦略トークン閾値ベース: token_threshold 超過時にLLMで要約（直近N件は非圧縮で保持）スライディングウィンドウ: N回の呼び出しごとにトリガー（overlap_sizeで文脈連続性を維持）コンテキストキャッシュ（ ContextCacheConfig ）: キャッシュ再利用回数上限、TTL、最小トークン数を設定可能 static_instruction で静的システムインストラクションを分離 → Gemini APIのキャッシュの恩恵サブエージェント間のコンテキスト分離ツール呼び出し/応答ペアが分断されないよう安全な分割位置を算出 Tomoki Yoshida (birder) - DeNA

47.

AI Talks #7 - 対話型AIの記憶管理 ADK（2/2）長期記憶: 3層のメモリサービス実装 InMemoryMemoryService: キーワードマッチング（プロトタイプ用） VertexAiRagMemoryService: Vertex AI RAGコーパスにアップロード → ベクトル検索 VertexAiMemoryBankService: マネージドサービス（統合・リビジョン・TTL対応、非同期メモリ生成）メモリ取得の2パターンユーザー入力で即検索（通常RAG）か LLMが判断して検索（Agentic RAG）を選択可能 Tomoki Yoshida (birder) - DeNA

48.

AI Talks #7 - 対話型AIの記憶管理 LlamaIndex（1/2） LLMアプリケーション構築のためのデータフレームワーク短期記憶会話メッセージを毎ターンDBに保存（デフォルトSQLite、PostgreSQL等に切替可能）トークン超過時、古いメッセージを排出 → 長期記憶ブロックに自動転送（会話ペア単位で安全に分割）ツール呼び出しループ中はメモリ書き込みを遅延し、完了後にまとめて保存 ChatMemoryBuffer（スライディングウィンドウ）、ChatSummaryMemoryBuffer（要約）はdeprecated Tomoki Yoshida (birder) - DeNA

49.

AI Talks #7 - 対話型AIの記憶管理 LlamaIndex（2/2）長期記憶 VectorMemoryBlock: 排出メッセージバッチをベクトルストアに格納 → 直近N件からクエリ構築して検索 node_postprocessors でリランキング・フィルタリング可能 TimeWeightedPostprocessor: (1-decay)^hours の時間減衰スコアリング FactExtractionMemoryBlock: LLMでファクト抽出（重複排除あり）→ max_facts 超過時にLLMで凝縮 StaticMemoryBlock: 開発者が設定した固定テキストを毎回注入するだけ PropertyGraphIndex: LLMでエンティティ・リレーション抽出しグラフ構築（Neo4j等7種対応）検索はLLM同義語展開、ベクトル、Cypher生成、テンプレートの4種を組合せ可能トークン超過時はメモリブロック単位で低優先度から順に切り詰め（優先度は開発者が設定） Tomoki Yoshida (birder) - DeNA

50.

AI Talks #7 - 対話型AIの記憶管理 OpenCode（1/3）オープンソースのAIコーディングエージェント短期記憶: Compaction + Pruning の二段構成 Compactionエージェントが会話全体を要約要約テンプレート: Goal, Instructions, Discoveries, Accomplished, Relevant files オーバーフロー時、ユーザーの最後の質問を退避→要約完了後に再投入（メッセージリプレイ） Pruning: 古いツール出力を選択的に [Old tool result content cleared] に置換直近2ターン+直近40,000トークン分のツール出力は保護 skill ツールの出力は保護対象プロバイダ横断のコンテキストキャッシュ最適化 Anthropic（ephemeral cacheControl）、OpenAI（promptCacheKey=sessionID）、Bedrock等に対応システムプロンプトを「安定部分」と「可変部分」の2パートに分割しキャッシュヒット率最大化 Doom Loop検出: 同一ツール+同一入力が3回連続で呼ばれたらユーザーに確認 Tomoki Yoshida (birder) - DeNA

51.

AI Talks #7 - 対話型AIの記憶管理 OpenCode（2/3）長期記憶 ️ベクトル検索やナレッジグラフ等の長期記憶機構は実装されていないセッション間の知識共有は AGENTS.md 等のファイルベースの設定に限定ソースコード等のファイル自体が「記憶」として機能するという思想探索サブエージェント exploreサブエージェントにコードベース探索を委譲 grep（正規表現でファイル内容検索）、glob（パターンでファイル検索）、list（ディレクトリ一覧）、 read（ファイル読み取り）、codesearch（Exa AI MCPでコードスニペット/ドキュメント検索）、 webfetch（URL取得）、bash（読み取り専用シェルコマンド）等のツールを使えるメインエージェントとコンテキストが分離 → 探索結果のうち必要な情報だけを返す list/globは100ファイル、grepは100マッチ、readは2000行と50KB、1行2000文字で打ち切り。 truncate後されると、クエリ変えつつgrepやoffset変えつつreadするなど探索へ切り替わる Tomoki Yoshida (birder) - DeNA

52.

AI Talks #7 - 対話型AIの記憶管理 OpenCode（3/3） Skills ディレクトリ内のskill定義がSkillToolとして登録。呼び出し時にコンテキストをプロンプトに注入（実質コンテキストを返すToolCalling） skillsの一覧は毎回コンテキストに含まれる MCP MCPも実質ToolCallingと同じアーキテクチャ 7種のエージェント構成（build, plan, general, explore, compaction, title, summary） Tomoki Yoshida (birder) - DeNA

53.

AI Talks #7 - 対話型AIの記憶管理 OpenClaw（1/2）ローカルファーストのパーソナルAIアシスタント短期記憶: 段階的なコンテキスト削減 Compaction（LLM要約圧縮）: /compact コマンドまたはオーバーフロー時に自動実行自動メモリフラッシュ: Compaction直前に重要な記憶をファイルに書き出してから圧縮 Context Pruning（ツール結果の段階的枝刈り）: Soft Trim（30%超）→ 4000文字超のツール結果の先頭1500+末尾1500文字を保持 Hard Clear（50%超）→ ツール結果を [Old tool result content cleared] に完全置換直近3回のアシスタント応答に紐づくツール結果は保護 Cache TTLモード: Anthropicのprompt cachingと協調し、TTL期間内（デフォルト5分）はプルーニングを抑制してキャッシュヒット率を維持 History Turns制限、ツール結果トランケーション（30%上限）、画像データ置換 Tomoki Yoshida (birder) - DeNA

54.

AI Talks #7 - 対話型AIの記憶管理 OpenClaw（2/2）長期記憶: SQLite + sqlite-vec によるローカル完結型 memory/ ディレクトリのMarkdownファイルをインデックス化 memory/YYYY-MM-DD.md : AGENTS.md でエージェントに当日・前日分の読み込みを指示する運用ハイブリッド検索（デフォルト有効）: ベクトルスコア×0.7 + FTS5(BM25)スコア×0.3 SQLite + sqlite-vec でベクトルインデックス（外部DBサービス不要）チャンク分割: 400トークン、80トークンオーバーラップ親エージェントがハイブリッド検索ツールを呼ぶ形（ある意味Agentic検索）多言語クエリ拡張（英, 中, 日, 韓, 西, 葡, アラビア語のストップワード辞書+言語固有トークナイズ） MMRリランキングはオプション（デフォルト無効）指数関数的時間減衰（半減期30日）: デフォルト無効。 MEMORY.md 等の日付なしファイル（常に有効な知識）は減衰対象外ファイルハッシュベースの差分sync + embeddingキャッシュで再計算回避 Tomoki Yoshida (birder) - DeNA

対話型AIの記憶管理〜ライブラリ調査を通して〜

DeNA_Tech

関連スライド

Roslynアナライザー_ Unityでの開発環境を改善するための静的解析の仕組みの構築

ディメンショナルモデルの実導入と実装について

Difyによる全社LLMプラットフォーム運用とv1アップデート

【DeNA TechCon 2025】 DeNAがマスタデータ管理にOyakataを使う理由

GraphQLやるならDataloaderを使おう

【DeNA × AI Day】DeNAスポーツ事業戦略とベイスターズAI強化プロジェクト

各ページのテキスト

対話型AIの記憶管理 〜ライブラリ調査を通して〜

DeNA_Tech

関連スライド

Roslynアナライザー_ Unityでの開発環境を改善するための静的解析の仕組みの構築

ディメンショナルモデルの実導入と実装について

Difyによる全社LLMプラットフォーム運用とv1アップデート

【DeNA TechCon 2025】 DeNAがマスタデータ管理にOyakataを使う理由

GraphQLやるならDataloaderを使おう

【DeNA × AI Day】DeNAスポーツ事業戦略とベイスターズAI強化プロジェクト

各ページのテキスト

対話型AIの記憶管理〜ライブラリ調査を通して〜