Pythonで実現する4コマ漫画の分析・評論_2017

208 Views

September 29, 25

#Python #4コマ漫画 #OCR #機械学習 #データ分析

スライド概要

PyCon JP 2017登壇時の資料です

esuji

@esuji5

スライド一覧

Pythonでいろいろやります

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

PythonとLLMで挑む、4コマ漫画の構造化データ化

esuji 1K

猫でも分かるUnreal Engineの学び方 - 超初心者向け編 - 2023 v1.0

ue4 ue5 ue-beginner

エピックゲームズジャパン 1.7M

Unreal Engine5 Lumenの仕組みと肝心なところ

ue5 ue-rendering ue-lumen

エピックゲームズジャパン 1.5M

UE5レンダリングフロー総おさらい(2024) 基礎編！[CEDEC+KYUSHU 2024]

ue5 unreal engine ue-rendering

エピックゲームズジャパン 1.3M

Meta XR SDK(V66-74)でQuestアプリを開発

spatial anchor unity quest pro shaperecognizeractivatestate oculus integration transformfeaturestateprovider building blocks transformrecognizeractivestate ovrsemanticclassification jointdeltaprovider ovrscenemanager jointvelocityactivestate オクルージョン sequenceactivestate scene manager ambisonic depth api metaxraudiosource playerlocomotor meta xr sdk quest3 ovrplayercontroller マルチモーダル meta haptics studio direct touch ui meta xr haptics sdk ovrspatialanchor ovrtrackedkeyboard hapticclipplayer fingerfeaturestateprovider hapticclip ワイドモーションモード wmm mruk mr utility kit voice sdk jointrotationactivestate meta horizon os ui set asw application spacewarp ovr metrics tool unityscene manager colocation discovery コロケーション mx ink passthrough camera api hand tracking microgestures webcamtexturemanager passthroughcamerautils cameraviewermanager hand pose selector recorder

あうぜん 1.2M

猫でも分かる UE5.0, 5.1 におけるアニメーションの新機能について【CEDEC+KYUSHU 2022】

ue5 cedec+kyushu ue-animation ue-optimize ue-bp ue-physics ue-sequencer

エピックゲームズジャパン 1M

各ページのテキスト

Pythonで実現する 4コマ漫画の分析・評論 2017 repo. 治∕ S @esuji https://github.com/esuji5/yonkoma2data PyCon Jp 2017 09.09

3行で分かる概要自分が面白い作品を読みたいので、4コマ漫画周辺の評論をやってます作品を読んでデータをまとめる、分析するのが大変なのでPython でやってしまおう情熱駆動開発 ✌ ('ω' ✌ )三 ✌ ('ω') ✌ 三( ✌ 'ω') ✌ 2 / 32

自己紹介名前：S治∕@esuji (北川慎治) 所属：株式会社ビープラウド運営サービス：近況：初心者向けのPython本を共著で執筆 WEBサービス：subcatalog (コミケに行く人のスペース探す) 3 / 32

4コマ漫画と評論とPython 4 / 32

4コマ漫画とは 4つのコマによって短い物語を作る日本の漫画の形式の一つ新聞や雑誌の一部に掲載されるなど古くから存在する 4コマ漫画の専門誌が存在し、ジャンルによって掲載されている作品の傾向が違っている 5 / 32

現在刊行されている月刊4コマ漫画雑誌まんがホーム、まんがタイム、まんがタイムジャンボ、まんがタイムファミリー、まんがタイムスペシャル、まんがタイムオリジナル、まんがタイムきらら、まんがタイムきららミラク、まんがタイムきららMAX、まんがタイムきららキャラット、まんがタウン、まんがくらぶ、まんがライフオリジナル、まんがライフ、まんがライフMOMO、まんが4コマぱれっと、コミック電撃だいおうじ、コミックキューン 6 / 32

評論・批評とは捉えられがちな意味作品の悪口を言うことで自尊心を満たすもの感情論で作品を貶める・レッテルを貼るもの 7 / 32

個人的に考える評論のあるべき姿作品への新しい読み方を提示して、作品と作家と読者に、新しい道を拓く (きづきあきら著『ヨイコノミライ』4巻より) 個人的な実績：アニメ『ゆゆ式』の監督インタビューアニメの良い部分を探すブログを書き続けたことがきっかけ 8 / 32

http://d.hatena.ne.jp/esuji5/20161201/1480518006

4コマ漫画評論とPython 手作業でのデータ収集が大変なのでプログラムでガッとやりたいコマ毎の画像に変換 → 画像処理セリフデータ抜き出し → OCR、自然言語処理誰がどこに映っているのか → 人物検出・認識収集したデータの分析 pandas等を使っての分析 → 慣れればExcelより速くて楽分析・可視化 → 慣れればExcelより(以下略) やりたいことが多いので出来るだけライブラリ・APIに頼る方針 Pythonならどれもだいたい実現できるだろうという目論見 9 / 32

10.

前回までのあらすじ PDFファイルからコマ画像切出しまで使用作品は『ゆゆ式』(芳文社, 三上小又) 言語化しにくい魅力がありながら作者は計算的に描いているので、評論の対象として退屈しないコアなファンが多い作品今でも当時のアニメ放送時間になるとエア実況が発生 2017年9月5日(火) 24:30放送(?)分で18クール214話 (yuyushiki6.P 82) 10 / 32

11.

今日のアジェンダ OCR結果を「日本語」にする人物を検出する(detection) 人物を分類する(classi cation) 今後の展望情熱駆動開発についてまとめ 11 / 32

12.

OCR結果を「日本語」にするセリフをデータ化するためにGoogle Cloud Vision APIでOCR 縦書き日本語に対応したOCRとしてはとてもよい結果を出すただし、そのまま日本語として扱えるかは別の話 (AP Iresult, yuyushiki7.P 46) 返ってきたOCR結果：'野々原家\n独特の\n(ヘ\nなんか?\nあつやだ\n恥ずかしい!) e®\nし!\n家の事\n恥ずかしい\nし!\n' 12 / 32

13.

OCR結果の問題点文字ではない部分が余計な文字として認識される言語を指定しなくても日本語縦書きを認識するが、逆に横書きとして認識される場合もあって煩わしい吹き出し外の手書き文字の検出精度が悪い上下で2つの吹き出しに分かれている場合、右上から下に向かって走査されるため、順番がおかしくなる特殊なフォントでは文字列の誤検出になる確率が高い傍線やリーダー点のような記号の区別精度が悪い 13 / 32

14.

日本語化への頑張りルールベースでとにかく余分なものを排除していく無効な文字の設定(例：英数記号のみ) 横長の検出部を排除細すぎる検出部は除外文字(例：1, へ, ー等)以外なら排除吹き出し外の文字を判定して除外吹き出しの結合吹き出し判定を行い、真ならそのエリア内の文字列を結合縦に吹き出しが分かれている場合も頑張る 14 / 32

15.

頑張りの結果 (AP Iresult, yuyushiki7.P 46) 野々原家独特のヘなんか? 2: あつやだ恥ずかしい!家の事恥ずかしい! 1: 15 / 32

16.

頑張りの結果2 (AP Iresult, yuyushiki7.P 57) 風予測のサイトだってどこでどっちに風が流れてるかわかる 2: おーーーこの辺は? 1: 16 / 32

17.

人物を検出する(detection) 検出：人物らしきものが映っている座標を特定する計算量が多すぎない方法としてdlibの物体検出器を利用する既存のアニメ顔検出器の結果をdlibで使えるxmlとして吐き出す等のテクニックも使えるゆゆ式では横向き・後ろ向き・顔の重なりが表現として頻出するが、それでも検出できるかを試す yuyushiki5.P 11, P 92 17 / 32

18.

imglabでGUIアノテーション dlib付属のimglabを使ってGUIで顔部分をアノテーション 1~7巻まで各50コマをランダムに抜き出し、学習させる学習させる量が多すぎるとメモリ不足で動かなくなる学習後のdetectorで5巻から顔を切り出す…… だが、しかし目を顔と誤検出吹き出しやセリフ文字を顔と誤検出顔を検出しても範囲が広すぎるか狭すぎて切り取れない期待した精度は出なかった。 18 / 32

19.

人物を分類する(classi cation) 検出した人物画像を切り抜いて分類することで誰がどこに映っているのかをデータ化する画像分類に定評のあるCNN(Convolutional Neural Network) kerasでのCIFAR10のサンプルコードをベースにしたモデル：(畳込み層+プーリング層)×2 入力画像サイズは32×32px 既存のアニメ顔検出器を用いて正面向きの顔を切り出す 19 / 32

20.

1~7巻分から切り出した顔の数野々原ゆずこ：1368 日向縁：1109 櫟井唯：1152 松本頼子：127 相川千穂：130 岡野佳：102 長谷川ふみ：77 問：このサンプルで学習は上手くいくでしょうか？ 20 / 32

21.

はい 21 / 32

22.

答：だめみたいですね…… precision recall f1-score support 0 0.86 0.99 0.92 121 1 0.84 0.99 0.91 95 2 0.97 0.97 0.97 106 3 0.50 0.25 0.33 12 4 0.00 0.00 0.00 13 5 0.00 0.00 0.00 10 6 0.00 0.00 0.00 7 avg / total 0.80 0.88 0.84 364 22 / 32

23.

人物の検出・分類手法の敗北検出と分類の精度からデータ入力支援として使えるかは微妙吹き出し等の漫画表現横向き・後ろ向き・重なりの構図が頻出主要人物の登場数に大きな偏りがある比較的、前向きや横向きが多いような作品では上手くいく可能性は十分にある cf. 『NEW GAME!』(芳文社, 得能正太郎) 23 / 32

24.

今後の展望データにまとめる処理毎に画像パスを持つCSV形式にまとめていくセリフデータと画像パスの対人物データと画像パスの対 and more... データを分析するデータが集まったら知りたいことを好きなだけ分析する 24 / 32

25.

やりたいこと-1 背景の種類を判断する場所教室、唯ちゃんの部屋、外スクリーントーンのパターン無背景 OCRの自前実装セリフ、人物、状況から該当コマを検索するシステム 25 / 32

26.

やりたいこと-2 人物配置・カメラワークの分析人物配置のパターンイマジナリーライン超えの率同ポジション率他、どんなパターンがあるのか 26 / 32

27.

やりたいこと-3 会話内容の分析頻出語を調べる会話遷移のパターン話を振る、話を広げる、ツッコむギャグを言う、受けない、ディスコミュニケーション 27 / 32

28.

よくある質問最終的にAIとかに活かせないの？創作として面白いかは別の問題として「ゆゆ式らしい」人物配置、会話を生成し無限に楽しむ二次創作のネームとして人物配置を利用人物配置の何が重要なの？漫画は右から読んでいくため、コマ上の人物配置とセリフの順番が概ね一致するただしイマジナリーライン超え等の制約を考えると、読みやすい人物配置はバリエーションに限りがある 28 / 32

29.

情熱駆動開発自分が欲しいものを誰かが作ってくれることはないと気付くやりたいことがプログラムで解決できそうか当たりを付ける Pythonなら様々な分野のライブラリが存在するやりたいことの情報に色々触れる勉強会に行く界隈の情報を流してくれる人をSNSでフォローする論文を読む勉強する実現する → ✌ ('ω' ✌ )三 ✌ ('ω') ✌ 三( ✌ 'ω') ✌ 29 / 32

30.

まとめ 4コマ評論をプログラミングで加速させるにはPythonが最適画像処理、機械学習、深層学習、APIに投げる、分析等実際、さっさとデータを手入力した方が速いのは内緒ルールベースを敷いていくのはとても辛い人物検出・分類をするには作品の難易度が高い情熱駆動開発はやっぱり ✌ ('ω' ✌ )三 ✌ ('ω') ✌ 三( ✌ 'ω') ✌ 30 / 32

31.

ご清聴ありがとうございました and... 原作『ゆゆ式』 1〜9巻発売中アニメBD-BOX好評発売中新作OVA好評発売中 31 / 32

32.

発表後に寄せられた提案人物の検出ネガティブサンプルを集めるようにする頭の一部のみをアノテーションして検出・分類に使う人物の分類 illustration2vecを用いた特徴抽出＆機械学習で精度向上セリフの内容から言ってる人を推定し、人物の認識につなげる 32 / 32