【人工知能・深層学習】論文紹介:Heterogeneous Graph Transfer Learning for Cross-Domain Sequential Recommendation

343 Views

June 01, 26

スライド概要

profile-image

立教大学大学院人工知能科学研究科における瀧雅人准教授が主催する研究室で2020年度からスタートしているまだ若い組織です。 最先端の深層学習について、高度化・説明性向上などをテーマに深く幅広く研究しています。 また医療や神経科学・物理学におけるデータ分析や、産業への社会実装にも携わっています。 研究室内のPaper Reading活動の記録として、研究室学生の発表資料を公開しています。 ご興味をお持ちの方は、HPをご確認ください。

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

各ページのテキスト
1.

Journal Club Heterogeneous Graph Transfer Learning for Cross-Domain Sequential Recommendation Zitao Xu, Xiaoqing Chen, Weike Pan, Zhong Ming 2026/5/30 瀧研究室 李 其融

2.

推薦システムに伴う課題——①コールドスタート システムを導入した直後や、新規ユーザー・新規商品が 追加された際、過去の行動履歴データが一切ない状態 ↓ 「データが全くない」問題 トントゥ:フィンランド の妖精をモチーフにした、 サウナに稀にみる置き物。 温泉に行く人はサウ ナに入る傾向があ る! 宿泊予約サイ トから温泉旅館の愛 用者を抽出して、ト ントゥを売るビジネ スを始めるぞ! 誰もトントゥ を知らなすぎ て薦め方がわ からん…… ● + ● - 1

3.

推薦システムに伴う課題——②スパース性 ※希薄性 組み合わせに対して実際に発生した行動(購入や評価) が非常に少なく、データ行列がスカスカ(疎)な状態 ↓ 「データがスカスカで偏っている」問題 リーグ内対戦、Dense Matrix 交流戦、Sparse Matrix ● + ● - ● + ● - ? ● + ● + ? ? ● + ● + ● + ● - ? ● - ? ? ● + ● - ● + ● + ● - ● + ? ? ? ● + ? ● - ● - ● - ● + ● + ● - ● + ? ? ● + ? ? ? ? ? ● + ● + 2

4.

この論文のポイント ・クロスドメイン逐次推薦(CDSR)におけるデータスパース性と知識転移の課題を解決手法 “Heterogeneous Graph Transfer Learning ”を提案 既存手法:重複ユーザーに依存 提案手法:アイテムの「カテゴリ情報」をドメイン間のブリッジとして活用 →異種グラフ(Heterogeneous Graph)とメタパス(Meta Path)を用いた対照学習 (Contrastive Learning)により、重複ユーザーが全く存在しない環境でも高い推薦精度を維持 3

5.

この論文のポイント ・クロスドメイン逐次推薦(CDSR)におけるデータスパース性と知識転移の課題を解決手法 “Heterogeneous Graph Transfer Learning ”を提案 既存手法:重複ユーザーに依存 提案手法:アイテムの「カテゴリ情報」をドメイン間のブリッジとして活用 →異種グラフ(Heterogeneous Graph)とメタパス(Meta Path)を用いた対照学習 (Contrastive Learning)により、重複ユーザーが全く存在しない環境でも高い推薦精度を維持 貢献 ・重複ユーザーに依存しない、異種グラフベースの知識転移フレームワークの構築 ・粗粒度(カテゴリ)と細粒度(アイテム)の双方向から逐次試行を抽出するアテンション機構 ・マルチドメインシナリオへの拡張性(HGTL-Multi)の実証 4

6.

従来のクロスドメイン逐次推薦(CDSR)の課題 ・逐次推薦が「次に何を選ぶか」を扱う一方で、単 一ドメインではデータスパース性が厳しい→別ドメ インの履歴を活用して自然な拡張を行うのがCDSR ・しかし、従来のCDSRは以下の課題を抱えている ①ドメイン間のアイテム遷移が十分に表現されない ②重複ユーザーが少ないと知識転移が難しい ③カテゴリ情報、とくにマルチカテゴリ構造をうま く活用できていない →本研究は、カテゴリを使った関連付け手法、 category-aware cross-domain sequential recommendation (CCDSR)を使用 5

7.

アイテムIDだけでは異なるドメインの嗜好を結び付けない 既存のCDSR:アイテムIDベースのみ ドメインA:映画 コメディ ID:item_a01 ドメインB:書籍 サスペン ス ID:item_b01 IDが異なるため 関連付け不可 サスペン ス ID:item_a02 スリリン グ ID:item_b02 ユーザーの「サスペンス嗜好」がドメイン間で 伝達されない 6

8.

アイテムIDだけでは異なるドメインの嗜好を結び付けない 既存のCDSR ドメインA:映画 コメディ ID:item_a01 本研究のCCDSR:カテゴリを介した関連付け ドメインB:書籍 サスペン ス ID:item_b01 コメディ 映画 カテゴリ サスペンス IDが異なるため 関連付け不可 サスペン ス ID:item_a02 スリリン グ ID:item_b02 ユーザーの「サスペンス嗜好」がドメイン間で 伝達されない サスペン ス書籍 サスペン ス映画 スリリン グ書籍 “カテゴリ:サスペンス”でドメイン間嗜好が連結 →重複ユーザーがいなくても転移学習できる 7

9.

CCDSRモデル設定:カテゴリで異ドメイン間の橋渡し Category-aware Cross-Domain Sequential Recommendation 入力データ: ユーザー集合 𝒰 , ユーザー u ∈ 𝒰 ・ドメインAの履歴 SA = { A1, A2, …, AL } ・ドメインBの履歴 SB = { B1, B2, …, BL } ・ 各アイテム Ai はIDに加え カテゴリ集合 { ci(1), …, ci(l) } を持つ 従来のCDSR: アイテムIDの系列のみを入力 ID埋め込みでユーザーの嗜好を学習 予測タスク: 両ドメインの履歴 SA, SB を入力として、 同時に次のアイテムを予測: ドメインA の次 vAi+1 ドメインB の次 vBi+1 本論文のCCDSR: IDとカテゴリの集合を同時に入力 カテゴリ嗜好をドメイン横断で転移 8

10.

HGTLの全体アーキテクチャ HGTL の4つのモジュール 入力(ユーザー履歴+カテゴリ) ↓ (a)異種グラフ構築 ↓ (b)メタパス誘導型ノード表現学習 ↓ (c)カテゴリ認識型逐次嗜好学習 ↓ (d)転移ユニット ↓ 出力(アイテム予測) 9

11.

紹介:異種グラフの定義 通常のグラフのノードは1種類のに対して、 異種グラフでは複数種類のノード(User, Item, Category)、 複数種類のエッジ(購入関係、所属関係)が混在する。 例:ノード= SNSのユーザー エッジ=ユーザー間のフォロー 例:ノード= ユーザー、商品、商品カテゴリ エッジ=ユーザーが商品を買う/レビューを書く、10 ある商品があるカテゴリに所属する

12.

異種グラフの構築とエッジ拡張 ・User(u) / Item(i) / Category(c) とい う3種のノードと2種のエッジで構成 実線:観測される関係性 破線:未観測の関係性(BERT類似度・ 遷移確率で関連を補強) 拡張手法: ①意味的類似度(BERT) カテゴリ名をBERTでベクトル化 → コサイン類似度で関連カテゴリを発見 ②行動の遷移確率 履歴上で ci → cJが連続出現した頻度から推定 (閾値 =1の時に新規エッジをつなぐ) 11

13.

メタパスが表す潜在的意味、関係性 メタパス 意味する関係性 例 I-U-I 同じユーザーが利用したア イテム同士は似ている この人が買った他の商品 I-C-I 同じカテゴリに属するアイ テム同士は似ている 同じジャンルの作品 U-I-C-I-U 同じカテゴリの作品を好む ユーザー同士は趣味が似て いる ホラー好き同士 C-I-U-I-C 同じユーザーに好まれるカ テゴリ同士は関連している サスペンス好きはホラーも好む 12

14.

メタパス誘導型ノード表現学習——異なる表現を獲得 2系統のメタパスを使用: 協調系メタパス I-U-I 同じユーザーに消費された2つのアイテム(協調フィルタリング的なユーザー類似性) カテゴリ系メタパス I-C-I 同じカテゴリを共有する2つのアイテム(ドメイン横断可能な意味的類似性) 13

15.

メタパス誘導型ノード表現学習——対照学習で2系統を整合 協調系メタパスとカテゴリ系メタパスの表現を整合 ・アテンション集約 メタパス ρ 上の隣接ノードを重み付きで集約 a:重み、ノード間の類似度を正規化したもの 14

16.

メタパス誘導型ノード表現学習——対照学習で2系統を整合 協調系メタパスとカテゴリ系メタパスの表現を整合 ・同じアイテムiが異なるメタパスで得る2表現を正例ペアとして近づけ、他アイテムを遠ざける →協調情報とカテゴリ情報を共通表現に統合できる 𝐷:両ノード表現間の類似度 15

17.

カテゴリ認識型逐次嗜好学習 アイテム系列とカテゴリ系列を2系統並列のSelf-Attentionで処理し、両者をItem-Category Attentionで繋ぐことで、各アイテムの代表的なカテゴリ嗜好を文脈依存で抽出 →カテゴリ系列とアイテム系列が相互強化される ユーザー履歴(ドメインA) アイテム系列 Self-Attention カテゴリ系列 ドメインA統 合表現 アイテム系列 ユーザー履歴(ドメインB) Self-Attention ドメインB統 合表現 カテゴリ系列 16

18.

転移ユニット ドメインBで学んだ嗜好をそのまま A 側に渡しても整合しない →多層パーセプトロンで変換してからAの予測に注入する ・映画と書籍の語彙・分布が異なるため、 そのままドメインBの表現を使うと干渉してしまう ・両ドメインの時点を整合する必要がある 転移の式: t’=A時点tに最も近いB履歴の時点 (情報リーク防止の観点から、 A時点tよりも過去の履歴のみ使用 ) →多層パーセプトロンを通して、 カテゴリ表現で共有された潜在空間がブリッジの役割を果たす →ドメイン間に重複するユーザーがなくても転移学習できる 17

19.

予測スコアと統合損失関数 ・統合表現から次のアイテムを予測 4つの情報源を統合(ドメインA) :アイテム系列嗜好 :カテゴリ系列嗜好 :Bから転移した嗜好 :ユーザー表現 上記の式に基づき、候補アイテムiへのスコアを算出 ・3つの損失を同時に最適化 :A側の推薦損失 :B側の推薦損失 :対照学習損失 18

20.

実験設定:Amazonの3ドメインで評価 ・Amazonレビューデータセットから、Movie, CD, Bookの3つのドメインを抽出 ・全ユーザーが3ドメインで重複するように前処理されている 【実装詳細とベイスライン】 ・評価指標:leave-one-out法によるHR@10とNDCG@10 ※ NDCG:Normalized Discounted Cumulative Gain at 10。1に近いほど上位10件が正し く関連性の高い順で並んでいることを示す指標。 ・パラメータ:埋め込み次元 (d=50)、バッチサイズ128、Adam(lr=0.001)、 Max長(L=100)、近傍数(K=10)、Dropout0.5 ・ベースライン(15種類):単一ドメインSR、CDSR、属性認識SR。 19

21.

主な実験結果——推薦性能の比較 本論文のHGTLではすべての指標においてベイスラインを上回った。 特に最もスパース性のあるBookドメインにおいて、NDCG@10で21.05%の改善を達成 20

22.

主な実験結果——重複ユーザー比率による精度の変化 既存のCDSR(MGCL)手法は、重複率が0%の状況では知識転移のブリッジがないため、単 一ドメイン手法(SASRec)以下の性能に低下する。一方、HGTLは重複率0%の場合でも、カ テゴリ情報を介したグラフ転移により、高精度な推薦を維持した。 21

23.

Target Domainのユーザー系列の長さによる影響 SASRecはユーザー系列履歴が短い([5,10])コールドスタート状態では精度が低いが、 HGTLはユーザー系列履歴が短くても高い精度を示した。 22

24.

Source Domainの行動履歴系列の長さによる影響 Source Domain側での行動履歴が豊富(系列が長い)であるほど、より有用なユーザー嗜 好特徴がTarget Domainに転移され、ターゲット側の推薦精度が向上する傾向が見られた。 23

25.

エッジ拡張閾値による影響 閾値 が0.25の場合、関連性の薄いノイズエッジが生成されて性能が低下。 閾値 が1.0(=拡張なし)の場合、情報の伝播が不足になる。 本研究では、閾値 が0.5~0.75に設定する場合、モデルの柔軟性と性能を最大化できる。 24

26.

まとめ――本研究で得られる知見 ・重複ユーザーが存在しない条件でも、アイテムの属性(カテゴリ)を 異種グラフで連結させることで、性能の良いクロスドメイン推薦が可能 ・グラフで大域的な構造情報を捉え、シーケンスで局所的・時間的な順 序を捉えた上で、両者の情報を統合するアプローチは有効である ・エッジ拡張によるスパース性の改善が裏付けられた 25