109 Views
June 27, 18
スライド概要
第32回人工知能学会全国大会(JSAI2018)発表スライド
明治大学 総合数理学部 先端メディアサイエンス学科 中村聡史研究室
コミックの読書意欲を増進させる 要素に関する分析 佐藤 剣太、牧 良樹、中村聡史 (明治大学大学院 先端数理科学研究科) 2018.06.05 (火) 第32回人工知能学会全国大会
背景 コミックの一部を掲載するWeb広告 • 作中の重要なシーン • 多くの読者にとって魅力的なシーン 従来のWeb広告の問題点 • 作品の読書経験に関係なく表示されるため画一的な広告 - 読者の読んだシーンの提示が購買につながるか分からない • 各ユーザに適した広告を載せることが必要 - 既読、未読、途中まで読み進めた、などの状態を考慮
背景 - 各ユーザに適した広告の提示 • 作品の読書量に応じて動的に変更 - 例)全30巻の作品 第1巻のみ読了 内容をあまり 知らない 1 第10巻まで読了 内容をある程度 知っている 第29巻まで読了 結末を除くと全て 知っている
背景 - 各ユーザに適した広告の提示 • 作品の読書量に応じて動的に変更 - 例)全30巻の作品 第1巻のみ読了 内容をあまり 知らない 第10巻まで読了 内容をある程度 知っている 第29巻まで読了 結末を除くと全て 知っている それぞれどんなシーンが 有効か解明されていない 1
目的 コミックの読書状態に応じた推薦シーン として有効な要素を自動推定する • 読者にどういったシーンを見せると、より読書意欲 を増進できるか検証 • 推薦シーンの内容について傾向を調査 • 推薦シーンの自動推定の方法を検討
関連研究 - コンテンツの推薦 • 画像特徴量とコメントを用いたニコニコ動画の指示的要 約サムネイルの生成手法 [黒橋 97] - 複数の特徴から動画の盛り上がる部分を推定 • インターネットにおける広告の効果に関する研究 [藤田 00] - Webページの構成とユーザの興味度合いを表す定量化モデルを 作成 本研究ではコミックを対象とし、コンテンツの 経験量に応じて適切な推薦部分を分析する
以前の実験 - 読書の経験は影響するのか?(EC47) 既に読んだシーンを提示すると効果的? ? 済 もしくは まだ読んでいないシーンを提示すると効果的? ? 未
実験手順 - 概要 データセット構築者 • 推薦シーンの選出をおこなってもらった ①作品を全て読む ②前半/後半からシーン選出 前半 後半
データセット構築 - 構築手順 コミックからシーンを選出 • 対象:20〜23歳の男子学生 5人 コミック(第1巻) 推薦シーン × 16(作品) = 96(ページ) 6(ページ)/作品 各作品について 投票形式で決定
データセット構築 - 対象作品 4ジャンルから4作品ずつ選定 =16作品 ラブストーリー バトル 恋は光 DRAGON QUEST -ダイの大冒険- グランメゾンむらさきばし 銃夢 密・リターンズ! 学園ノイズ Oh! われら劣等生徒会 花影戦記 妖魔降臨 スポーツ SF 帯をギュッとね! アトム ザ・ビギニング Over Drive 女騎士、経理になる。 ジョバレ BEMADER・P やまとの羽根 宇宙課々付 エヴァ・レディ
データセット構築 - 推薦シーンの選択 • 第1巻を読み、前半・後半部から見開き3ページずつ選択 • 各ページに対する好みの度合い(0〜100)を決定 前半 30 後半 10 70 50 40 50 30 100 A 20 10 70 20 B 40 C 20 5 70 50 60 …
データセット構築 構築者A 構築者D - 推薦シーンの決定 構築者C 構築者B 構築者E (好みの度合い) ① 前半部 後半部 ① ② ② ③ ③ (ページ) • 前半部、後半部それぞれで上位3位のページを選出
実験手順 - 概要 データセット構築者 ①作品を全て読む ②前半/後半からページ推薦 未読部分 既読部分 評価者 ①作品を途中まで読む ②ページ評価 vs 既読部分 未読部分
実験 - グループ分け • 協力者と作品を2つのグループに分割 グ ル ー プ グ ル ー プ B A 読 書 評 価 ( 読 書 あ り ) 評 価 ( 読 書 あ り ) 読 書 作 品 群 作 品 群 α β
実験 - 評価実験 • 対象:20〜24歳の大学生16名 • 各作品の前半部のみを読む 前半部 後半部 (ページ数) 既読部分 未読部分 • 各作品を読み終えるごとにアンケート - 読んだところまでで気に入った部分 - 読んだところ以降で期待する場面 • Webシステムにて推薦シーンの評価
実験 - 手順 • 1日目:読書 16シーン評価 • 2日目:推薦シーン評価 評価(第1セット) 評価(第2セット) 6時間以上経過後 • 3日目:推薦シーン評価 評価(第3セット) 評価(第4セット) 6時間以上経過後 • 4日目:推薦シーン評価 評価(第5セット) 評価(第6セット) 6時間以上経過後
実験 - 評価内容 ©︎咲香里『やまとの羽根』(Manga109[Matsui 15]) 7段階のリッカート尺度 −3(全く読みたくならない、全く気にならない)〜 +3(かなり読みたくなった、かなり気になった)
実験結果 - ①各項目の平均評価値 読みたくなる度合い
実験結果 - ②作品ごとの評価値(読みたくなる度合い)
実験結果 - ③年代別の評価値(読みたくなる度合い) 「読みたくなる度合い」年代別に分けて比較 〜1999年 2000年〜 • 新しい作品の方を読みたいと感じる傾向にあり - 評価者の年代(20〜24歳)が影響
追加分析 ここまでの実験では… • 協力者が16人のみであったため不十分 協力者の数を増やして再検証 • どのような特徴をもつシーンが読者の意欲を増進できるか が不明瞭なまま 推薦シーンに現れている特徴と シーンの分布の傾向について調査を行う
追加分析 - ①協力者数の増加 • 協力者数を16人から32人に増やして再検証 読みたくなる度合い
追加分析 - ②推薦シーンの分析 推薦シーンのデータセットを分析する理由 ユーザベースのシーン選出によって 膨大な数の作品を網羅するのは非効率 推薦シーンに表れている特徴を調査し シーンの自動選出へとつなげる
追加分析 - ②推薦シーンの分析 • 大きなコマを持つページ • 活字によるセリフの量が少ないページ Manga109[Matsui 15]
追加分析 - ②推薦シーンの分析 構築者A 構築者B 構築者D 構築者E 構築者C • 高い推薦度のページが存在する作品 - 複数のユーザの気にいった箇所が同じ 先ほどのようなシーンは 高い合計値で選出される傾向 • 低い推薦度のページが多い作品 - ユーザによって気に入った箇所が異なる
追加分析 - 自動選出に向けて • 大きなコマを持つページ - 直線検出を用いたコマ数の 分割 - コマ数が少ないほど大きなコマをもつ • 活字によるセリフの量が少ないページ - 文字認識を用いた セリフの量の変化 Manga109[Matsui 15]
今後の実験 未読シーンを提示する場合 • 気に入ったシーンのなかにはネタバレを含むものも • 読書の意欲が減退する可能性 自身が気に入ったシーンではなく、 「他者に薦めたいシーン」として選ぶ必要性
今後の実験 未読シーンを提示する場合 • 気に入ったシーンのなかにはネタバレを含むものも • 読書の意欲が減退する可能性 他人に続巻を推薦するためのシーンの データセット構築をおこなう 自身が気に入ったシーンではなく、 「他者に薦めたいシーン」として選ぶ必要性
今後の実験 - データセット構築 コミック推薦ページ選択 1 2 … N-2 N-1 N N+1 … 完 シーン推薦 推薦者の手順 • 第N-1巻まで読んだ人が、第N巻を読みたくなると思う ページを選んでもらう • 推薦度もあわせて決定(0〜100)
まとめ • コミックの既読・未読シーンの提示が、作品の読書 意欲に及ぼす影響について再検証 - • 途中まで読んだユーザに対しては未読シーンが有効 コミック読者の好むシーンの傾向を調査 - 1〜2ページ分の大きさのコマをもつ - 活字の量が減少 [今後の方針] • 推薦シーンのデータセットを構築 • シーンの自動選出とその精度を検証