[DL輪読会]Deep Learning based Recommender System: A Survey and New Perspectives

>100 Views

September 28, 18

#deep learning #Deep Learning #Recommender System #Collaborative Filtering #Content-based Filtering #Review-based Recommendation

スライド概要

2018/09/28
Deep Learning JP:
http://deeplearning.jp/seminar-2/

Deep Learning JP

@DeepLearning2023

スライド一覧

DL輪読会資料

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

（ダウンロード不可）

関連スライド

【DL輪読会】KAN: Kolmogorov–Arnold Networks

Deep Learning JP 87.2K

【DL輪読会】Evolutionary Optimization of Model Merging Recipes モデルマージの進化的最適化

Deep Learning JP 59.9K

【拡散モデル勉強会】拡散モデルの数理

Deep Learning JP 58.1K

【拡散モデル勉強会】Introduction to Diffusion Models

Deep Learning JP 41.2K

【DL輪読会】Conditional Flow Matching

Deep Learning JP 37.2K

【DL輪読会】Cosmos World Foundation Model Platform for Physical AI

Deep Learning JP 37.1K

各ページのテキスト

DEEP LEARNING JP [DL Papers] “Deep Learning based Recommender System: A Survey and New Perspectives” Haruka Murakami, Matsuo Lab http://deeplearning.jp/

http://deeplearning.jp/

書誌情報 • • • • ACM Computing Surveys (arXiv公開日：18/09/04) 同タイトルで’17verと’18verがあり、どちらも論文誌掲載(?) 被引用数：75 (’17verから) 著者 – – – – SHUAI ZHANG, University of New South Wales LINA YAO, University of New South Wales AIXIN SUN, Nanyang Technological University YI TAY, Nanyang Technological University (‘18 verから参加) • 内容：近年のDLを用いた推薦システムのレビュー論文 • 選定理由：研究チーム内のプロジェクトの先行研究調査のため ‘17verを読んでいる途中で’18verがアップされました 2

この論文の目的 • ２〜３年ほどでDLを使った推薦システムが一気に増え、従来よりも良い成果が出ている • DLのレビュー論文がなかったため、各種法を分類し体系立てて整理し、これからの課題の論点を整理すると書いてあったのですが、参考文献番号の羅列が多く、詳細やどれがstate-of-theartなのかが明記していなかったので、手法もしくは用途に書かれている文献を直接読みに行くほうが早いです。 3

私たちの周囲の推薦システムの実情 • Netflix・・・視聴の80%が推薦から • Youtube・・・視聴の60%がホームの推薦から • RecSys・・・2016年からDLのWorkshop開催 – 現在ではDLが推薦システムに有効だという共通認識

情報推薦のやるべきこと • ユーザモデルやユーザプロファイルを構築後、維持 • 情報過多問題(information overload)を解決するための手段 • 情報検索(information retrieval; IR)や情報フィルタリングの分野に強く根差す • 説明・・・推薦した経緯をユーザーにわかりやすい理由として提示する

情報推薦の基礎分類 • 協調フィルタリング – 過去に同じ興味を共有したユーザは将来的も同じような興味を持つという考え – 膨大な集合の中から最も有望な選択肢をフィルタリングし、ユーザが暗黙的にお互いに協調する • コンテンツベース – 評価値行列を基にしてアイテム間の類似行列をオフラインで作成したものから推薦 – 大規模なWebシステム(amazonなど)によく使われる • ハイブリッド

協調型推薦 • 過去に同じ興味を共有したユーザーは将来的にも同じような興味を持つであろうという考え方 • 膨大な集合の中から最も有望な選択肢をフィルタリングし、ユーザが暗黙的にお互いに協調することから協調フィルタリング(collaborative filtering; CF)と呼ばれる。 • 与えられたユーザの評価値行列(rating matrix)をインプットとして使い、アウトプットとして典型的には – 対象のユーザがあるアイテムを好きかそうではないかを示す度合いの予測値 – N個の推薦アイテムのリスト(top-N) • を生成する

推薦システムにおけるDLの強み、弱み DLの強み弱点・非線形の設計が容易・結果の理由が分からない(説明性がない) ・複雑な特徴抽出が可能・データ数がある程度必要・時系列モデルが組める・パラメーターチューニングがめんどくさい・設計の部分部分の組み換えが用意 8

協調フィルタリングの実応用 • ユーザーベース協調フィルタリングの欠点 – ピアソンの相関係数によるユーザー類似度 – 最悪、ユーザー×アイテム分の計算量が必要なので、大規模な商用サイトでは実用的ではない • 予めアイテム間の類似度を算出しておく – 調整コサイン類似度を使う←オフライン処理で事前に計算可能 – Amazonなどで使われている • アイテムの内容を解析せずに精度の高い推薦ができる一方、履歴が乏しいユーザー・アイテムには適応できない(新規に対応できない〜コールド・スタート問題)。より詳細なユーザ思考を反映できない。

10.

代表的な課題 • Cold Start問題 – 新規ユーザや新規アイテムは他者との類似度を計算するための材料がないため、予測が行えない人/評価品物A 品物B 品物C 品物D 品物E Aさん５３２１？ Bさん４２５２？ Cさん４２(予測) １１？ Dさん？？？？？ • データの疎性(sparcity)問題 – 推薦システムにおいて扱う全アイテム、全ユーザ数に対して、評価付けされたアイテム数が少なすぎる人/評価品物A 品物C 品物D ３ Aさん５ Bさん・・・品物B ４１・・・

11.

最近の研究：レビュー文を使った推薦 ●Joint Deep Modeling of Users and Items Using Reviews for Recommendation(’17) – ２年以内の論文の中で現時点でトップ被引用数 • ユーザーレビューとアイテムレビューを用いて推薦予測を立てたある人のいろんな物に対するレビューある物に対するいろんな人からのレビュー • これ以前の研究はあくまでアイテムに対するユーザーの点数評価や閲覧・購入履歴などから推薦予測をしていた • レビュー文が有用であることは分かっていたが、これまでは既存手法の精度を有意に超えることができなかった 11

12.

最近の研究：レビュー文を使った推薦 • 構造が同じ２つのNNを並列に並べ、最終層で連結 • それぞれの入力はユーザーレビュー文とアイテムレビュー文 – 全体的には( u, i , rui, wui) ユーザアイテム評価値レビュー文 • レビュー文はWordembedding で入力 – bag of wards を使うのに比べ、時系列が保たれる 12

13.

最近の研究：レビュー文を使った推薦 • Yelp – レストランの評価データ(1M) • レビュー文により洗剤変数を増やすことで精度を上げられた 13

14.

最近の研究：レビュー文を使った推薦 14

15.

最近の研究：人の知見とDLのドッキング • Examples-rules Guided Deep Neural Network for Makeup Recommendation (AAAI 17’) 化粧前後の写真を使うだけでなく、メイクアップアーティストの知識も入力し、 15

16.

課題とこれからの展望(1) • DLを使った情報推薦で既によくやられていること – ユーザやアイテムのプロファイルの発掘 – 推薦に対する何かしらのフィードバック(説明付けなし) – バックグラウンドを意識した推薦 • あまりやられていないこと – 入手可能な情報全ての有効活用 – SNSなどの”足跡”の活用 – MNISTのようなデータセットがなく、皆が各々に都合の良い視点で研究の評価を行っている 16

17.

課題とこれからの展望(2) • パラメータ調整と特徴量の設計の自動化をすべき – (推薦に限らないと思うが) • データの種類に関係なく人とアイテムの関係を記述できるモデルの研究(Joint Representation Learning from User and Item Content info.)が次のトレンドになるのでは • 推薦結果の説明性の向上をもっと進めるべき – ユーザにとって説得力があるだけでなく、モデルを設計する側の人間のモデルに対する理解が深まる – ただし、説明性を持たせることの難しさはドメインによって大きく異なる – 近年はアテンションを使うことにより、特に画像で成果が出てきている 17