ネタバレ確信度を考慮した試合実況データセット構築と分析手法の検討

1.2K Views

June 21, 18

#スポーツ #ネタバレ防止 #Twitter #データセット #予測

スライド概要

第12回WI2学会で発表したプレゼン資料

Nakamura Laboratory (Meiji University)

@nkmr-lab

スライド一覧

明治大学総合数理学部先端メディアサイエンス学科中村聡史研究室

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

周辺視野に対するぼかしエフェクトが作業時の集中力に及ぼす影響の調査

Nakamura Laboratory (Meiji University) 31.7K

商品選択においてフォントがユーザの選択行動に及ぼす影響の調査

Nakamura Laboratory (Meiji University) 24.2K

手書きとフォントの文字形状の違いによる記憶効果の比較

Nakamura Laboratory (Meiji University) 20.8K

Make-up FLOW 2.0: 美容系YouTuberの化粧フローチャートの共有・取り入れ手法

化粧メイク化粧工程フローチャート美容系youtuber 取り入れ

Nakamura Laboratory (Meiji University) 17.3K

周辺視野における妨害刺激の減衰が集中度に及ぼす影響

Nakamura Laboratory (Meiji University) 17.1K

三択の選択肢の色の組み合わせが選択行動に及ぼす影響

選択ゴルディロックス効果色

Nakamura Laboratory (Meiji University) 16.2K

各ページのテキスト

何の数字だかわかりますか？ 1

2018ロシアW杯が開催した日！ 2

日本代表の試合 3

日本代表の試合 4

スポーツ観戦勝つか負けるかわからないハラハラ感を楽しめる（リアルタイムで観戦したいという人も多い） 5

スポーツ観戦 6 勝つか負けるかわからないハラハラ感を楽しめる（リアルタイムで観戦したいという人も多い）仕事や学業などでリアルタイムで観られない場合は録画視聴

スポーツ観戦 7 勝つか負けるかわからないハラハラ感を楽しめる（リアルタイムで観戦したいという人も多い）仕事や学業などでリアルタイムで観られない場合は録画視聴ある問題が発生

ネタバレ問題

10.

ネタバレ例ニュースで 9

11.

ネタバレ例 LINEで 10

12.

ネタバレ例 Twitterで 11

13.

検索結果 12

14.

ネタバレ防止研究スポーツの勝敗にまつわるネタバレ防止手法の検討[中村ら 2013] : Web上のネタバレを隠す表現手法(誤情報混入など)を検討 [Jeonら 2015] Spoiler detection in TV program tweets : テレビ番組におけるTwitter上のネタバレを高精度に判定する手法を検討

15.

16.

これまでの取り組み 15 スポーツにおけるネタバレの特性調査と判定手法の検討 [2017] : Twitter上のスポーツのネタバレを判定する手法について，試合状況別にSVMを切り替える手法の有効性を確認

17.

これまでの取り組み 16 スポーツにおけるネタバレの特性調査と判定手法の検討 [2017] : Twitter上のスポーツのネタバレを判定する手法について，試合状況別にSVMを切り替える手法の有効性を確認最も高精度な手法で6割実用性に乏しい

18.

問題点の原因データセット構築時に「ネタバレか否か」を直接聞いていた 17

19.

問題点の原因 18 データセット構築時に「ネタバレか否か」を直接聞いていたデータセットでネタバレとされているツイート例: 「長友足つってるw」「日本: 11宇佐美→8原口」

20.

問題点の原因 19 データセット構築時に「ネタバレか否か」を直接聞いていたデータセットでネタバレとされているツイート例: 「長友足つってるw」「日本: 11宇佐美→8原口」実際にネタバレを受ける側の目線に固定できていないどの程度の暴露をネタバレとするかの基準が固定できていない

21.

問題点の原因 20 データセット構築時に「ネタバレか否か」を直接聞いていたデータセットでネタバレとされているツイート例: 「長友足つってるw」「日本: 11宇佐美→8原口」ラベル付けの評価基準を明確にしたデータセットを構築する必要がある実際にネタバレを受ける側の目線に固定できていないどの程度の暴露をネタバレとするかの基準が固定できていない

22.

判断基準を明確化したデータセットの構築と判定手法の再検討 21

23.

ネタバレデータセット再構築ツイートから「試合結果がどのくらいの確信度で予測可能か」を聞いた（判断基準の固定と評価視点の固定が狙い） 22

24.

ネタバレデータセット再構築 23 ツイートから「試合結果がどのくらいの確信度で予測可能か」を聞いた（判断基準の固定と評価視点の固定が狙い）ネタバレツイートを「試合の最終結果が高い確信度で予測できてしまうツイート」と定義確信度が高ければ危険なツイート

25.

ネタバレデータセット再構築ツイートから「試合結果がどのくらいの確信度で予測可能か」を聞いた（判断基準の固定と評価視点の固定が狙い）結果の予測とその確信度をクリックすることでラベル付け 1000ツイート × 9試合 = 9000 ツイート 9000ツイート × 5人(以上) = 45000（以上）データ 24

26.

用意した試合 25 サッカー日本代表の試合 9試合 (以前用いたものを流用) 結果: 5勝1敗3分

27.

構築結果（抜粋）平均確信度 0〜9 10〜19 20〜29 30〜39 40〜49 50〜59 60〜69 70〜79 80〜89 90〜100 26 ツイート柏木うめぇ長かった。ここから。森重ごーーる 1-0で前半終了。アメリカ3点目よかった。ほんとよかった。香川とか岡崎とか原口とか酒井とか。【後半35分経過】日本 1 × 1 イラン勝った勝ったイラン1-1日本３－０か〜。あと２点くらい欲しかったな。経過時間 31 29 34 48 14 116 98 112 113 120

28.

構築結果平均確信度 27 試合の経過時間に対する平均確信度の推移経過時間

29.

構築結果平均確信度 28 試合の経過時間に対する平均確信度の推移試合開始からの経過時間が長いほど危険なネタバレ経過時間

30.

構築結果平均確信度 0〜9 10〜19 20〜29 30〜39 40〜49 50〜59 60〜69 70〜79 80〜89 90〜100 29 ツイート柏木うめぇ長かった。ここから。森重ごーーる 1-0で前半終了。アメリカ3点目よかった。ほんとよかった。香川とか岡崎とか原口とか酒井とか。【後半35分経過】日本 1 × 1 イラン勝った勝ったイラン1-1日本３－０か〜。あと２点くらい欲しかったな。経過時間 31 29 34 48 14 116 98 112 113 120

31.

構築結果平均確信度 0〜9 10〜19 20〜29 30〜39 40〜49 50〜59 60〜69 70〜79 80〜89 90〜100 30 ツイート柏木うめぇ長かった。ここから。森重ごーーる 1-0で前半終了。アメリカ3点目よかった。ほんとよかった。香川とか岡崎とか原口とか酒井とか。【後半35分経過】日本 1 × 1 イラン勝った勝ったイラン1-1日本３－０か〜。あと２点くらい欲しかったな。経過時間 31 29 34 48 14 116 98 112 113 120 50を超えると試合結果に対するツイートが出現

32.

構築結果平均確信度 0〜9 10〜19 20〜29 30〜39 40〜49 50〜59 60〜69 70〜79 80〜89 90〜100 31 ツイート柏木うめぇ長かった。ここから。森重ごーーる 1-0で前半終了。アメリカ3点目よかった。ほんとよかった。香川とか岡崎とか原口とか酒井とか。【後半35分経過】日本 1 × 1 イラン勝った勝ったイラン1-1日本３－０か〜。あと２点くらい欲しかったな。経過時間 31 29 34 48 14 116 98 112 113 120 今回は最終結果に対する記述が現れる確信度50を境界線とした

33.

構築結果平均確信度 0〜9 10〜19 20〜29 30〜39 40〜49 50〜59 60〜69 70〜79 80〜89 90〜100 32 ツイート柏木うめぇ長かった。ここから。森重ごーーる 1-0で前半終了。アメリカ3点目よかった。ほんとよかった。香川とか岡崎とか原口とか酒井とか。【後半35分経過】日本 1 × 1 イラン勝った勝ったイラン1-1日本３－０か〜。あと２点くらい欲しかったな。経過時間 31 29 34 48 14 116 98 112 113 120 ネタバレ

34.

構築結果平均確信度 0〜9 10〜19 20〜29 30〜39 40〜49 50〜59 60〜69 70〜79 80〜89 90〜100 33 ツイート柏木うめぇ長かった。ここから。森重ごーーる 1-0で前半終了。アメリカ3点目よかった。ほんとよかった。香川とか岡崎とか原口とか酒井とか。【後半35分経過】日本 1 × 1 イラン勝った勝ったイラン1-1日本３－０か〜。あと２点くらい欲しかったな。経過時間 31 29 34 48 14 非ネタバレ 116 98 112 113 120 ネタバレ

35.

ネタバレ判定実験 34 ネタバレツイート(確信度50以上)かどうかを判別比較内容: 単語を特徴量とした3手法の判定精度を比較手法比較項目パターンマッチ適合率ランダムフォレスト再現率 SVM F値

36.

判定結果手法 35 適合率再現率 F値パターンマッチ 0.570 0.935 0.708 ランダムフォレスト 0.808 0.857 0.826 SVM 0.809 0.883 0.843

37.

判定結果手法 36 適合率再現率 F値パターンマッチ 0.570 0.935 0.708 ランダムフォレスト 0.808 0.857 0.826 SVM 0.809 0.883 0.843 機械学習を用いた手法の方が高い

38.

判定結果手法 37 適合率再現率 F値パターンマッチ 0.570 0.935 0.708 ランダムフォレスト 0.808 0.857 0.826 SVM 0.809 0.883 0.843 SVMが最も効果的以前の精度(0.6程度) よりもかなり上昇

39.

判定結果手法 38 適合率再現率 F値パターンマッチ 0.570 0.935 0.708 SVMが最も効果的ネタバレデータセットは評価視点と判断基準ランダムフォレスト 0.808 0.857 0.826 以前の精度(60%程度) の固定を考慮して構築する必要がある SVM 0.809 0.883 0.843 よりもかなり上昇

40.

試合状況を考慮したSVM （SVM+試合状況）試合開始 0-1 0-2 試合1: 1-0 試合2: 1-0 試合3: 1-1 試合終了

41.

試合状況を考慮したSVM （SVM+試合状況）試合開始 0-1 0-2 試合1: 1-0 試合2: 勝ちモデル 1-1 1-0 試合3: 勝ちモデル試合終了

42.

試合状況を考慮したSVM （SVM+試合状況）試合開始 0-1 試合1: 0-2 負けモデル試合終了負けモデル 1-0 試合2: 勝ちモデル 1-1 1-0 試合3: 勝ちモデル

43.

試合状況を考慮したSVM （SVM+試合状況） 0-1 試合開始試合1: 0-2 負けモデル同点モデル試合終了負けモデル 1-0 試合2: 同点モデル 1-1 1-0 試合3: 同点モデル勝ちモデル勝ちモデル同点モデル

44.

試合状況を考慮したSVM （SVM+試合状況） 0-1 試合開始試合1: 0-2 負けモデル同点モデル試合終了負けモデル 1-0 試合2: 同点モデル勝ちモデル 1-1 1-0 試合3: 同点モデル勝ちモデル同点モデルシステム自身はネタバレされても問題ない！適用ネタバレを防止したい試合: 同点モデル判定試合状況により SVMの学習モデルを使い分け 1-0 勝ちモデル判定

45.

判定結果（SVM+試合状況手法）手法適合率再現率 F値 SVM 0.809 0.883 0.843 SVM+試合状況 0.831 0.880 0.852 44

46.

判定結果（SVM+試合状況手法）手法適合率再現率 SVM 0.809 0.883 0.843 SVM+試合状況 0.831 0.880 0.852 45 F値 F値が0.01上昇した

47.

判定結果（SVM+試合状況手法）手法適合率 SVM 0.809 0.883 0.843 SVM+試合状況再現率 F値 46 特に適合率が高かった異なる時間帯での誤学習 0.831 0.880 0.852 (「久しぶり」など)が少なくなったため

48.

判定結果（SVM+試合状況手法）手法適合率再現率 F値 SVM 0.809 0.883 0.843 47 特に適合率が高かった異なる時間帯での誤学習スポーツのネタバレ判定では試合状況別に SVM+試合状況 0.831 0.880 0.852 (「久しぶり」など)がモデルを切り替えるのが良い少なくなったため

49.

構築結果平均確信度 0〜9 10〜19 20〜29 30〜39 40〜49 50〜59 60〜69 70〜79 80〜89 90〜100 48 ツイート柏木うめぇ長かった。ここから。森重ごーーる 1-0で前半終了。アメリカ3点目よかった。ほんとよかった。香川とか岡崎とか原口とか酒井とか。【後半35分経過】日本 1 × 1 イラン勝った勝ったイラン1-1日本３－０か〜。あと２点くらい欲しかったな。経過時間 31 29 34 48 14 116 98 112 113 120

50.

構築結果平均確信度 0〜9 10〜19 20〜29 30〜39 40〜49 50〜59 60〜69 70〜79 80〜89 90〜100 49 ツイート柏木うめぇ長かった。ここから。森重ごーーる 1-0で前半終了。アメリカ3点目よかった。ほんとよかった。香川とか岡崎とか原口とか酒井とか。【後半35分経過】日本 1 × 1 イラン勝った勝ったイラン1-1日本３－０か〜。あと２点くらい欲しかったな。経過時間 31 29 34 48 14 116 98 112 113 120 50付近では試合結果に対する感想ツイートが出現

51.

構築結果平均確信度 0〜9 10〜19 20〜29 30〜39 40〜49 50〜59 60〜69 70〜79 80〜89 90〜100 50 ツイート柏木うめぇ長かった。ここから。森重ごーーる 1-0で前半終了。アメリカ3点目よかった。ほんとよかった。香川とか岡崎とか原口とか酒井とか。【後半35分経過】日本 1 × 1 イラン勝った勝ったイラン1-1日本３－０か〜。あと２点くらい欲しかったな。経過時間 31 29 34 70を超えると直接試合結果 48 を述べるツイートが出現 14 116 98 112 113 120

52.

構築結果平均確信度 0〜9 10〜19 20〜29 30〜39 40〜49 50〜59 60〜69 70〜79 80〜89 90〜100 51 ツイート柏木うめぇ長かった。ここから。森重ごーーる 1-0で前半終了。アメリカ3点目よかった。ほんとよかった。香川とか岡崎とか原口とか酒井とか。【後半35分経過】日本 1 × 1 イラン勝った勝ったイラン1-1日本３－０か〜。あと２点くらい欲しかったな。経過時間 31 29 34 48 14 116 98 112 113 120 80を超えると試合結果の詳細(スコアなど)を述べるツイートが出現

53.

構築結果平均確信度 0〜9 10〜19 20〜29 30〜39 40〜49 50〜59 60〜69 70〜79 80〜89 90〜100 52 ツイート柏木うめぇ長かった。ここから。森重ごーーる 1-0で前半終了。アメリカ3点目よかった。ほんとよかった。香川とか岡崎とか原口とか酒井とか。【後半35分経過】日本 1 × 1 イラン勝った勝ったイラン1-1日本３－０か〜。あと２点くらい欲しかったな。経過時間 31 29 34 48 14 116 98 112 113 120 非ネタバレ 50以上をネタバレ， 50未満を非ネタバレとした場合（以後50-49）ネタバレ

54.

構築結果平均確信度 0〜9 10〜19 20〜29 30〜39 40〜49 50〜59 60〜69 70〜79 80〜89 90〜100 53 ツイート柏木うめぇ長かった。ここから。森重ごーーる 1-0で前半終了。アメリカ3点目よかった。ほんとよかった。香川とか岡崎とか原口とか酒井とか。【後半35分経過】日本 1 × 1 イラン勝った勝ったイラン1-1日本３－０か〜。あと２点くらい欲しかったな。経過時間 31 29 34 48 14 116 98 112 113 120 非ネタバレ 60以上をネタバレ， 40以下を非ネタバレとした場合（以後60-40）ネタバレ

55.

構築結果平均確信度 0〜9 10〜19 20〜29 30〜39 40〜49 50〜59 60〜69 70〜79 80〜89 90〜100 54 ツイート柏木うめぇ長かった。ここから。森重ごーーる 1-0で前半終了。アメリカ3点目よかった。ほんとよかった。香川とか岡崎とか原口とか酒井とか。【後半35分経過】日本 1 × 1 イラン勝った勝ったイラン1-1日本３－０か〜。あと２点くらい欲しかったな。経過時間 31 29 34 48 14 116 98 112 113 120 非ネタバレ 70以上をネタバレ， 30以下を非ネタバレとした場合（以後70-30）ネタバレ

56.

構築結果平均確信度 0〜9 10〜19 20〜29 30〜39 40〜49 50〜59 60〜69 70〜79 80〜89 90〜100 55 ツイート柏木うめぇ長かった。ここから。森重ごーーる 1-0で前半終了。アメリカ3点目よかった。ほんとよかった。香川とか岡崎とか原口とか酒井とか。【後半35分経過】日本 1 × 1 イラン勝った勝ったイラン1-1日本３－０か〜。あと２点くらい欲しかったな。経過時間 31 29 34 48 14 116 98 112 113 120 非ネタバレ 80以上をネタバレ， 20以下を非ネタバレとした場合（以後80-20）ネタバレ

57.

構築結果平均確信度 0〜9 10〜19 20〜29 30〜39 40〜49 50〜59 60〜69 70〜79 80〜89 90〜100 56 ツイート柏木うめぇ長かった。ここから。森重ごーーる 1-0で前半終了。アメリカ3点目よかった。ほんとよかった。香川とか岡崎とか原口とか酒井とか。【後半35分経過】日本 1 × 1 イラン勝った勝ったイラン1-1日本３－０か〜。あと２点くらい欲しかったな。経過時間 31 29 34 48 14 116 98 112 113 120 非ネタバレ 90以上をネタバレ， 10以下を非ネタバレとした場合（以後90-10）ネタバレ

58.

判定結果（確信度帯別）確信度帯適合率再現率 57 F値 50-49 0.883 0.851 0.866 60-40 0.891 0.856 0.873 70-30 0.873 0.946 0.907 80-20 0.873 0.927 0.893 90-10 0.774 0.890 0.797

59.

判定結果（確信度帯別）確信度帯適合率再現率 58 F値 50-49 0.883 0.851 0.866 60-40 0.891 0.856 0.873 70-30 0.873 0.946 0.907 80-20 0.873 0.927 0.893 90-10 0.774 0.890 0.797 確信度帯70-30の F値が一番高かった 80-20以上ではデータ量が極端に少なかった

60.

判定実験全体の考察 SVMの精度が以前のデータセットと比べ格段に高かったネタバレのデータセット構築には評価視点と判断基準の固定が必要だった (構築のための1つのガイドラインを示すことができた) 試合状況別にSVMのモデルを切り替えると精度が上昇した試合状況別に分離することで他の時間帯のツイートによる誤学習を防げたためだと考えられる確信度帯別では70-30が最も精度が高かったより危険なネタバレほど特徴が単純で判定難易度が下がったためだと考えられる 59

61.

今後の展開: ネタバレしないSNS ネタバレコメントを自動的に伏せる 60

62.

今後の展開: ネタバレしない予告ダイジェスト 61 確信度が高いツイートが多い時間帯のシーンをダイジェストから省く平均確信度省く省く時間

63.

まとめ 62 ネタバレデータセットを再構築ネタバレデータセット構築のガイドラインを1つ示したネタバレツイートを「試合の最終結果が高い確信度で予測できてしまう投稿」と定義試合開始からの経過時間が長いほど確信度が高いより単純な言葉やより詳細な情報があるほど確信度が高い様々な条件でネタバレ判定実験を試行評価視点と判断基準の固定を考慮してデータセットを構築したら精度が上昇 SVM+試合状況手法が最も効果的確信度70以上のツイートは9割以上の精度で判定可能