Yahoo!ショッピングと分散表現#yjdsw1

>100 Views

December 21, 15

スライド概要

http://yahoo-ds-event.connpass.com/event/21903/

profile-image

2023年10月からSpeaker Deckに移行しました。最新情報はこちらをご覧ください。 https://speakerdeck.com/lycorptech_jp

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

(ダウンロード不可)

関連スライド

各ページのテキスト
1.

Yahoo!ショッピングと分散表現 ヤフー株式会社 D&Sサイエンス本部サイエンス4部ベーシック1 齋藤 祐樹

2.

自己紹介 齋藤 祐樹 • ランキングやレコメンドアルゴリズムの開発 • 学生時代は形式手法やモデル検査についての研究 略歴 • 2013/3 大学院卒業 • 2013/4 ヤフー株式会社入社 • 2013/9-2014/9 YDNの予測アルゴリズム開発 • 2014/10- now ショッピングのランキングモデル開発 P2

3.

ショッピング検索とランキング P3 Yahoo!ショッピングは2段階の ランキングフェーズで構成 Search Engine Cluster second phase - 絞り込まれたレコードをランク付けする - 予測モデルによるランキング処理 first phase - 全レコードから候補となりうるものを絞り込む - 計算コストの小さい評価方法によるランキング …

4.

問題設定 P4 クエリが与えられたときに検索エンジンから返却された商品に対して クリック/購入確率が最大になるような順番になる商品のスコアを予 測したい • ラベルは5段階(Perfect, Excellent, Good, Fair, Bad) 特徴量 • • クエリ 商品情報 • • 価格,レビュー数,レビュー値,ページビュー など クエリと商品情報の単語の一致度 • 検索エンジンの返すサマリ NDCD,MRR,MAP,AUCなどのランク指標を最大にしたい

5.

問題設定 P5 クエリが与えられたときに検索エンジンから返却された商品に対して クリック/購入確率が最大になるような順番になる商品のスコアを予 測したい • ラベルは5段階(Perfect, Excellent, Good, Fair, Bad) 特徴量 • • クエリ 商品情報 • • 構造的に近いものを高く評価しやすい 価格,レビュー数,レビュー値,ページビューなど クエリと商品情報の単語の一致度 • 検索エンジンの返すサマリ NDCD,MRR,MAP,AUCなどのランク指標を最大にしたい

6.

クエリとタイトル P6 検索エンジンの返却するのスコアだとタイトルは似ているがクエリの意図す る商品と異なる商品にも高いスコアをつけてしまう クエリ:テレビ ミツマルテック 40V型フルハイビジョン液晶テレビ ブラック LC4095 [LC4095] テレビ用壁掛け金具/20〜37インチ用 液晶テレビ プラズマテレビ テレビ金具 これ以外にも言い換え表現などの問題もある

7.

最近の研究動向 P7 分散表現にskipgram[Milkolov+,’13] ,学習器にCNNとしたものが QAタスクにおいて精度がよいとの報告[Aliaksei+,SIGIR’15]がある ここがskipgramから得られる分散表現 図は[Aliaksei+,SIGIR’15]から引用

8.

ちょっとした疑問 P8 ショッピング検索においてクリックされるドキュメントはクエリとセ マンティック的に近いと仮定したとき,もし分散表現のベクトルのコサ イン類似度でセマンティック上の近さを表現できているのならばCNN などで学習する必要はないのではないか? クリックされた ドキュメント クリックされなかった ドキュメント クエリ もし上図のようになっていればコサイン類似度の降順に商品を並べればよい

9.

調査結果 P9 • コーパス:Yahoo!ショッピングの検索ログ • |vocab| : ~ 1million • Skipgramモデルのパラメータの設定は論文通り クエリに近ければクリックさ れるというわけではなさそう PCAの上位2軸でプロット