【人工知能・深層学習】論文紹介：Heterogeneous Graph Transfer Learning for Cross-Domain Sequential Recommendation

526 Views

June 01, 26

#deeplearning #論文紹介 #深層学習 #人工知能 #推薦システム #クロスドメイン推薦 #異種グラフ #知識転移 #対照学習

スライド概要

M2の李さんが、論文「Heterogeneous Graph Transfer Learning for Cross-Domain Sequential Recommendation」の内容について発表を行いました。本論文では、クロスドメイン逐次推薦（CDSR）におけるデータスパース性と知識転移の課題に対し、異種グラフおよびメタパスを活用した転移学習フレームワークが提案されています。従来の手法が異なるドメイン間の「重複ユーザー」に依存していたのに対し、本手法はアイテムのカテゴリ情報をドメイン間のブリッジとして利用し、エッジ拡張によってスパース性の緩和を図っています。評価実験では、重複ユーザーが存在しない環境下においても高い推薦精度を維持し、既存の最先端手法を最大21.05%上回る性能を示しました。

Taki lab.

@8328889256

スライド一覧

立教大学大学院人工知能科学研究科における瀧雅人准教授が主催する研究室で2020年度からスタートしているまだ若い組織です。最先端の深層学習について、高度化・説明性向上などをテーマに深く幅広く研究しています。また医療や神経科学・物理学におけるデータ分析や、産業への社会実装にも携わっています。研究室内のPaper Reading活動の記録として、研究室学生の発表資料を公開しています。ご興味をお持ちの方は、HPをご確認ください。

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

【人工知能・深層学習】レビュー：モダリティギャップの研究紹介

論文紹介 deeplearning 深層学習人工知能マルチモーダルモダリティギャップ

Taki lab. 8.4K

【人工知能・深層学習】論文紹介：Vision-Language Models Create Cross-Modal Task Representations

deeplearning 論文紹介深層学習人工知能 llm in-context learning task vector vlm

Taki lab. 7.1K

【人工知能・深層学習】論文紹介：Nested Learning: The Illusion of Deep Learning Architectures

deeplearning 論文紹介深層学習人工知能 optimizer llm in-context learning

Taki lab. 2.9K

【人工知能・深層学習】論文紹介：DecomCAM: Advancing Beyond Saliency Maps through Decomposition and Integration

論文紹介 deeplearning 人工知能深層学習 vlm

Taki lab. 2.7K

【人工知能・深層学習】論文紹介：Towards Modular LLMs by Building and Reusing a Library of LoRAs

論文紹介 deeplearning 人工知能深層学習 lora

Taki lab. 2.5K

【人工知能・深層学習】論文紹介：You Only Need Less Attention at Each Stage in Vision Transformers

論文紹介 deeplearning 人工知能深層学習 vision transformer

Taki lab. 2.2K

各ページのテキスト

Journal Club Heterogeneous Graph Transfer Learning for Cross-Domain Sequential Recommendation Zitao Xu, Xiaoqing Chen, Weike Pan, Zhong Ming 2026/5/30 瀧研究室李其融

推薦システムに伴う課題——①コールドスタートシステムを導入した直後や、新規ユーザー・新規商品が追加された際、過去の行動履歴データが一切ない状態 ↓ 「データが全くない」問題トントゥ：フィンランドの妖精をモチーフにした、サウナに稀にみる置き物。温泉に行く人はサウナに入る傾向がある！宿泊予約サイトから温泉旅館の愛用者を抽出して、トントゥを売るビジネスを始めるぞ！誰もトントゥを知らなすぎて薦め方がわからん…… ● ＋ ● － 1

推薦システムに伴う課題——②スパース性 ※希薄性組み合わせに対して実際に発生した行動（購入や評価）が非常に少なく、データ行列がスカスカ（疎）な状態 ↓ 「データがスカスカで偏っている」問題リーグ内対戦、Dense Matrix 交流戦、Sparse Matrix ● ＋ ● － ● ＋ ● －？ ● ＋ ● ＋？？ ● ＋ ● ＋ ● ＋ ● －？ ● －？？ ● ＋ ● － ● ＋ ● ＋ ● － ● ＋？？？ ● ＋？ ● － ● － ● － ● ＋ ● ＋ ● － ● ＋？？ ● ＋？？？？？ ● ＋ ● ＋ 2

この論文のポイント・クロスドメイン逐次推薦（CDSR）におけるデータスパース性と知識転移の課題を解決手法 “Heterogeneous Graph Transfer Learning ”を提案既存手法：重複ユーザーに依存提案手法：アイテムの「カテゴリ情報」をドメイン間のブリッジとして活用 →異種グラフ(Heterogeneous Graph)とメタパス（Meta Path）を用いた対照学習（Contrastive Learning）により、重複ユーザーが全く存在しない環境でも高い推薦精度を維持貢献・重複ユーザーに依存しない、異種グラフベースの知識転移フレームワークの構築・粗粒度（カテゴリ）と細粒度（アイテム）の双方向から逐次試行を抽出するアテンション機構・マルチドメインシナリオへの拡張性（HGTL-Multi）の実証 4

従来のクロスドメイン逐次推薦（CDSR）の課題・逐次推薦が「次に何を選ぶか」を扱う一方で、単一ドメインではデータスパース性が厳しい→別ドメインの履歴を活用して自然な拡張を行うのがCDSR ・しかし、従来のCDSRは以下の課題を抱えている ①ドメイン間のアイテム遷移が十分に表現されない ②重複ユーザーが少ないと知識転移が難しい ③カテゴリ情報、とくにマルチカテゴリ構造をうまく活用できていない →本研究は、カテゴリを使った関連付け手法、 category-aware cross-domain sequential recommendation (CCDSR)を使用 5

アイテムIDだけでは異なるドメインの嗜好を結び付けない既存のCDSR：アイテムIDベースのみドメインA：映画コメディ ID:item_a01 ドメインB：書籍サスペンス ID:item_b01 IDが異なるため関連付け不可サスペンス ID:item_a02 スリリング ID:item_b02 ユーザーの「サスペンス嗜好」がドメイン間で伝達されない 6

アイテムIDだけでは異なるドメインの嗜好を結び付けない既存のCDSR ドメインA：映画コメディ ID:item_a01 本研究のCCDSR：カテゴリを介した関連付けドメインB：書籍サスペンス ID:item_b01 コメディ映画カテゴリサスペンス IDが異なるため関連付け不可サスペンス ID:item_a02 スリリング ID:item_b02 ユーザーの「サスペンス嗜好」がドメイン間で伝達されないサスペンス書籍サスペンス映画スリリング書籍 “カテゴリ:サスペンス”でドメイン間嗜好が連結 →重複ユーザーがいなくても転移学習できる 7

CCDSRモデル設定：カテゴリで異ドメイン間の橋渡し Category-aware Cross-Domain Sequential Recommendation 入力データ：ユーザー集合 𝒰 ，ユーザー u ∈ 𝒰 ・ドメインAの履歴 SA = { A1, A2, …, AL } ・ドメインBの履歴 SB = { B1, B2, …, BL } ・各アイテム Ai はIDに加えカテゴリ集合 { ci(1), …, ci(l) } を持つ従来のCDSR：アイテムIDの系列のみを入力 ID埋め込みでユーザーの嗜好を学習予測タスク：両ドメインの履歴 SA, SB を入力として、同時に次のアイテムを予測：ドメインA の次 vAi+1 ドメインB の次 vBi+1 本論文のCCDSR： IDとカテゴリの集合を同時に入力カテゴリ嗜好をドメイン横断で転移 8

10.

HGTLの全体アーキテクチャ HGTL の4つのモジュール入力（ユーザー履歴＋カテゴリ） ↓ (a)異種グラフ構築 ↓ (b)メタパス誘導型ノード表現学習 ↓ (c)カテゴリ認識型逐次嗜好学習 ↓ (d)転移ユニット ↓ 出力（アイテム予測） 9

11.

紹介：異種グラフの定義通常のグラフのノードは1種類のに対して、異種グラフでは複数種類のノード（User, Item, Category）、複数種類のエッジ(購入関係、所属関係)が混在する。例：ノード＝ SNSのユーザーエッジ＝ユーザー間のフォロー例：ノード＝ユーザー、商品、商品カテゴリエッジ＝ユーザーが商品を買う／レビューを書く、10 ある商品があるカテゴリに所属する

12.

異種グラフの構築とエッジ拡張・User(u) / Item(i) / Category(c) という3種のノードと2種のエッジで構成実線：観測される関係性破線：未観測の関係性（BERT類似度・遷移確率で関連を補強）拡張手法： ①意味的類似度（BERT）カテゴリ名をBERTでベクトル化 → コサイン類似度で関連カテゴリを発見 ②行動の遷移確率履歴上で ci → cJが連続出現した頻度から推定（閾値 =1の時に新規エッジをつなぐ） 11

13.

メタパスが表す潜在的意味、関係性メタパス意味する関係性例 I-U-I 同じユーザーが利用したアイテム同士は似ているこの人が買った他の商品 I-C-I 同じカテゴリに属するアイテム同士は似ている同じジャンルの作品 U-I-C-I-U 同じカテゴリの作品を好むユーザー同士は趣味が似ているホラー好き同士 C-I-U-I-C 同じユーザーに好まれるカテゴリ同士は関連しているサスペンス好きはホラーも好む 12

14.

メタパス誘導型ノード表現学習——異なる表現を獲得 2系統のメタパスを使用：協調系メタパス I-U-I 同じユーザーに消費された2つのアイテム（協調フィルタリング的なユーザー類似性）カテゴリ系メタパス I-C-I 同じカテゴリを共有する2つのアイテム（ドメイン横断可能な意味的類似性） 13

15.

メタパス誘導型ノード表現学習——対照学習で2系統を整合協調系メタパスとカテゴリ系メタパスの表現を整合・アテンション集約メタパス ρ 上の隣接ノードを重み付きで集約 a:重み、ノード間の類似度を正規化したもの 14

16.

メタパス誘導型ノード表現学習——対照学習で2系統を整合協調系メタパスとカテゴリ系メタパスの表現を整合・同じアイテムiが異なるメタパスで得る2表現を正例ペアとして近づけ、他アイテムを遠ざける →協調情報とカテゴリ情報を共通表現に統合できる 𝐷：両ノード表現間の類似度 15

17.

カテゴリ認識型逐次嗜好学習アイテム系列とカテゴリ系列を2系統並列のSelf-Attentionで処理し、両者をItem-Category Attentionで繋ぐことで、各アイテムの代表的なカテゴリ嗜好を文脈依存で抽出 →カテゴリ系列とアイテム系列が相互強化されるユーザー履歴（ドメインA）アイテム系列 Self-Attention カテゴリ系列ドメインA統合表現アイテム系列ユーザー履歴（ドメインB） Self-Attention ドメインB統合表現カテゴリ系列 16

18.

転移ユニットドメインBで学んだ嗜好をそのまま A 側に渡しても整合しない →多層パーセプトロンで変換してからAの予測に注入する・映画と書籍の語彙・分布が異なるため、そのままドメインBの表現を使うと干渉してしまう・両ドメインの時点を整合する必要がある転移の式： t’=A時点tに最も近いB履歴の時点（情報リーク防止の観点から、 A時点tよりも過去の履歴のみ使用） →多層パーセプトロンを通して、カテゴリ表現で共有された潜在空間がブリッジの役割を果たす →ドメイン間に重複するユーザーがなくても転移学習できる 17

19.

予測スコアと統合損失関数・統合表現から次のアイテムを予測４つの情報源を統合（ドメインA） :アイテム系列嗜好 :カテゴリ系列嗜好 :Bから転移した嗜好 :ユーザー表現上記の式に基づき、候補アイテムiへのスコアを算出・３つの損失を同時に最適化 :A側の推薦損失 :B側の推薦損失 :対照学習損失 18

20.

実験設定：Amazonの3ドメインで評価・Amazonレビューデータセットから、Movie, CD, Bookの3つのドメインを抽出・全ユーザーが3ドメインで重複するように前処理されている【実装詳細とベイスライン】・評価指標：leave-one-out法によるHR@10とNDCG＠10 ※ NDCG：Normalized Discounted Cumulative Gain at 10。1に近いほど上位10件が正しく関連性の高い順で並んでいることを示す指標。・パラメータ：埋め込み次元 (d=50)、バッチサイズ128、Adam(lr=0.001)、 Max長(L=100)、近傍数（K=10）、Dropout0.5 ・ベースライン（15種類）：単一ドメインSR、CDSR、属性認識SR。 19

21.

主な実験結果——推薦性能の比較本論文のHGTLではすべての指標においてベイスラインを上回った。特に最もスパース性のあるBookドメインにおいて、NDCG@10で21.05%の改善を達成 20

22.

主な実験結果——重複ユーザー比率による精度の変化既存のCDSR(MGCL)手法は、重複率が0％の状況では知識転移のブリッジがないため、単一ドメイン手法(SASRec)以下の性能に低下する。一方、HGTLは重複率0％の場合でも、カテゴリ情報を介したグラフ転移により、高精度な推薦を維持した。 21

23.

Target Domainのユーザー系列の長さによる影響 SASRecはユーザー系列履歴が短い（[5,10]）コールドスタート状態では精度が低いが、 HGTLはユーザー系列履歴が短くても高い精度を示した。 22

24.

Source Domainの行動履歴系列の長さによる影響 Source Domain側での行動履歴が豊富（系列が長い）であるほど、より有用なユーザー嗜好特徴がTarget Domainに転移され、ターゲット側の推薦精度が向上する傾向が見られた。 23

25.

エッジ拡張閾値による影響閾値が0.25の場合、関連性の薄いノイズエッジが生成されて性能が低下。閾値が1.0（＝拡張なし）の場合、情報の伝播が不足になる。本研究では、閾値が0.5~0.75に設定する場合、モデルの柔軟性と性能を最大化できる。 24

26.

まとめ――本研究で得られる知見・重複ユーザーが存在しない条件でも、アイテムの属性（カテゴリ）を異種グラフで連結させることで、性能の良いクロスドメイン推薦が可能・グラフで大域的な構造情報を捉え、シーケンスで局所的・時間的な順序を捉えた上で、両者の情報を統合するアプローチは有効である・エッジ拡張によるスパース性の改善が裏付けられた 25