8.7K Views
July 23, 23
スライド概要
福知山公立大学にて開催されている講義、エンタテイメント情報学にて講演した資料になります。細かい技術には触れず、生成AIでどんなことをできるかを全体的にまとめました。その後、私が取り組んでいる画像生成AIの活動内容を話しました。最後、今後の生成AIとエンタメについて語りました。
サラリーマン研究員。
エンタメから みた⽣成AI 尾崎安範
発明に関するクイズ ⾚字の⽂字は後で回収する伏線です
19世紀の有名な発明とは?
19世紀(産業⾰命の時代)の有名な発明 • 電気の実⽤化 • 蒸気機関の実⽤化 • 鉄道の普及
20世紀の有名な発明とは?
20世紀(情報⾰命の時代)の有名な発明 • インターネットの商⽤化 • コンピュータの実⽤化 • 原⼦⼒発電所や核兵器の実⽤化 • 抗⽣物質の発⾒ • デジタル⾳楽や映像の発展(CD、DVDなど) • ⼈間が⽉に⾏くためのロケット技術
21世紀の有名な発明とは?
21世紀(???の時代)の有名な発明 • ⼈⼯知能(AI)の進化 • 遺伝⼦編集技術の開発 • これからどんどん⾒つかるだろう
最近の発明に対する東京⼤学の⾒解 • 東京⼤学理事・副学⻑(教育・情報担当)、太⽥ 邦史 • 「多くの分野の学者が社会の⼤変⾰を予感しており、 原⼦⼒やコンピューターの登場ぐらいのインパクトがあるだろうと 語っています。私は分⼦⽣物学や合成⽣物学が専⾨ですが、 この分野でいうと「組換えDNA技術」の登場に匹敵する変⾰」 • 「⼈類はこの数ヶ⽉でもうすでにルビコン川を渡ってしまったのかも しれない」 • ルビコン川を渡る: その後の運命を決め後戻りのできないような重⼤な決断・ ⾏動をする⽐喩 https://utelecon.adm.u-tokyo.ac.jp/docs/20230403-generative-ai
東⼤が驚く発明とは?
「⽣成AI」
⾃⼰紹介 • ⽣成AIを研究開発しているエンジニア • インターネット上では「あるふ」というハンドルネームで活動 • 主な活動 • ⽣成AIの研究開発 • 画像⽣成AIの啓蒙活動 https://prtimes.jp/main/html/rd/p/000000002.000113219.html https://youtu.be/GwNm-3SXFD0
今⽇の構成 • 発明に関するクイズ • 「⽣成AI」とその研究事例紹介 • 講演者が取り組んでいる画像⽣成AIの話 • 将来の⽣成AIとエンタメ
「⽣成AI」とは • 真新しすぎてそもそも定義がまだない • 呼び⽅も決まっていない • 昔はCreative AIと呼ばれていたし、今ではGenerative AIと呼ばれているし、 和訳は⽣成系AI、⽣成AIなのかもよくわからない • 最先端の技術は名前や定義すら決まっていないことが多い • Deep Learningも名前は当初和訳や定義が決まっていなかった • そこで次のページのとおりに⽣成AIの範囲を決める
研究事例として紹介する⽣成AIの定義 • ⽂章から⾳声、画像、⽂章などを⽣成するAI • Text-to-Speech、Text-to-Imageなどと学術的にはよばれる • たくさんの種類があるので、1つずつ紹介する • • • • • ⾳声: WaveNet, VOCAROID 6, VoiceBox 画像: Midjourney, Stable Diffusion, Adobe Firefly, DALL-E 動画: Gen-2, ZeroScope ⽂章: ChatGPT, Llama 2 ⾳楽、3Dモデルやユーザインターフェイスなど
⾳声⽣成AI(⾳声合成) • ⽂章から⾳声を⽣成するAI • サービス名など • WaveNet • VOCAROID 6 • VoiceBox 「吾輩は 猫である。 名前は、 まだ無い。」 AI • エンタメでの活躍 • ⾳楽配信 • ゲーム実況 • アナウンサー
⾳声⽣成AIの実例 https://youtu.be/CeYShIJusUYより引⽤
画像⽣成AI • ⽂章から画像を⽣成するAI • サービス名など • DALL-E • Midjourney • Stable Diffusion 猫の写真 AI • エンタメでの活躍 • • • • • ⼈間向けコンテストで優勝 AI向けコンテストが開催 画集や漫画、グラビアが発売 CMや広告に使われている (事例が多いので引⽤は割愛)
画像⽣成AIの実例(実写編) • 実はクイズに使った画像はすべてMidjourneyで作られています
画像⽣成AIの実例(イラスト編) https://huggingface.co/spaces/aipicasso/cool-japan-diffusion-latest-demo
動画⽣成AI • ⽂章から動画を⽣成するAI • サービス名など • Gen-2 • ZeroScope • エンタメでの活躍 猫が鳴く様⼦ AI • 映画のトレーラーのような動画 • CMのようなジョーク動画
動画⽣成AIの実例 https://youtu.be/ITq-mG67qiEより引⽤
⽂章⽣成AI(対話式AIを含む) • ⽂章から⽂章を⽣成するAI • サービス名など • ChatGPT • Llama 2 吾輩は猫であるを ⽝に変えて 出だしを 書いてください • エンタメでの活躍 AI 「吾輩は ⽝である。 ⽑並みは茶⾊、 尾は揺れる。」 • “AIと作った⼩説”が初⼊選[1] • ショートムービーの脚本[2] [1] https://www.itmedia.co.jp/news/articles/2202/18/news137.html [2] https://www3.nhk.or.jp/news/special/international_news_navi/articles/feature/2023/06/29/32657.html
⽂章⽣成AIの実例 • 今⽇ (7/21) に実装されたChatGPTのCustom Instructions とい う機能を使って、推理ゲームの名作ポートピア連続殺⼈事件を AIで再現してみます。
⽂章⽣成AIの実例 • 普通の挙動
⽂章⽣成AIの実例 • Custom Instructionsでヤスの設定を⼊れてみた
今⽇の構成 • 発明に関するクイズ • 「⽣成AI」とその研究事例紹介 • 講演者が取り組んでいる画像⽣成AIの話 • 将来の⽣成AIとエンタメ
講演者が取り組んでいる画像⽣成AIの話 • オチから⾔うと、画像⽣成AIが画⾵を⾼度にコピーできる という発⾒から1年で商業化しそうという話をする
きっかけ • 祖⽗が農業⾼校の先⽣だったので、家庭菜園をよくしていた • そこで、ある時、⽔耕栽培という⽅法で屋内でバジルを育てて いた
不運の発⾒ • その当時、画像⽣成AIは個⼈でとても育てるのが⼤変だった • 画像⽣成AIを個⼈で学習したら話題になるのでは?と思いつく • いらすとやの顔アイコンを試しに学習してみた • その結果、数時間あれば画⾵のコピーができることを発⾒して しまった
緊急事態発⽣ • 画⾵とはクリエーターにとっての⼈格のようなものであり、 そんな簡単にコピーしていいようなものではない • 最近炎上した例: 内閣府のポスター • いらすとやの⼈に報告して、緊急で論⽂をプレ公開 • 国会議員や弁護⼠、東⼤の先⽣と対策を相談
逆転の発想 • よくよく考えてみると、 画⾵のコピーを許可して使う分には活⽤できるのではとの アイデアが出てくる • ⼤学発ベンチャーと、いらすとやの中の⼈と共同で いらすとやの画⾵をコピーしたAI「AIいらすとや」を開発 • 「AIいらすとや」をアプリで利⽤できるようにしたところ、 そこそこのニュースになり、評判も良かった
不運の発⾒から幸運の商⽤化へ • 今後、商⽤利⽤可能なAIいらすとやを開始予定 • 基礎研究から商⽤化まで約1年で達成しそう • 通常数⼗年かかる
今後の展開 • 研究開発の流れは⼀般には以下の通り • 基礎研究→(魔の川)→応⽤研究→(死の⾕)→ 製品化→(ダーウィンの海)→市場で⽣き残る • 私の研究開発はついにダーウィンの海に⼊る • しかし、今年後半から画像⽣成AIの本命、 Adobe Fireflyがダーウィンの海に投下される • 果たしてどこまで⽣き残れるのか
今⽇の構成 • 発明に関するクイズ • 「⽣成AI」とその研究事例紹介 • 講演者が取り組んでいる画像⽣成AIの話 • 将来の⽣成AIとエンタメ
将来の⽣成AIの姿 • あらゆる⼊⼒から あらゆる出⼒を⽣成するAI AI • サービス名など • Bing AI (Microsoft) [1] • 画像理解、⽂章理解、⾳声認識、 ⽂章⽣成、画像⽣成 • DALL-E、GPT-4などを 連携させて実現している • Bard (Google) [2] • 画像理解、⽂章理解、⾳声認識、 ⽂章⽣成、⾳声⽣成 [1] https://news.microsoft.com/ja-jp/2023/07/19/230719-furthering-our-ai-ambitions-announcing-bing-chatenterprise-and-microsoft-365-copilot-pricing/ [2] https://japan.googleblog.com/2023/07/bard-40.html
将来の⽣成AIとエンタメ • 将来の⽣成AIはエンタメを根本からさらに変えていく • • • • イラストや漫画業界は画像⽣成AIが当たり前になる アニメ業界は画像⽣成AIと動画⽣成AIで労働環境をよくできる SNS、特にTikTokは、⽣成された動画で今年中にはあふれるだろう ゲーム業界は素材の⽣成やプログラミングをAIに任せるようになる https://youtu.be/dR4IuN2tF78 より引⽤
⽣成AIとSFのようなエンタメ • ロボットが⼈間のように話して、楽しませてくれる⽇は近い • ホログラムで表⽰されたキャラクターと⼈間が会話 (GateBox) • ⾃動運転⾞と会話してトロッコ問題を考えさせる (Turing) https://youtu.be/L4thAKYsCOUより引⽤ https://youtu.be/pCwW26PHjmEより引⽤
エンタメ業界の今後 • アカデミー賞受賞者、ジョージ・クルーニー • 「私たちの業界は転換点にある」 • 「⼤勢の俳優や脚本家が⽣計を⽴てられなくなっている。業界が⽣き 残るには変化が必要。俳優陣にとって、その旅はいま始まる」 • “WGAの要求はSAG―AFTRAと重なる部分が⼤きく、 公正な報酬、特に動画配信全盛の時代であることを踏まえたレ ジデュアル(再使⽤料)に関する対応、⼈⼯知能(AI)の使 ⽤に対する保護策の刷新を求めている。”[1] (※⽣成AIだけでは ない) • WGA:全⽶脚本家組合 • SAG-AFTRA:全⽶映画俳優組合 [1] https://www.cnn.co.jp/showbiz/35206614.html
⽣成AIの発明は産業⾰命レベル • AIを政府や有識者で議論する「AI戦略会議」による分析 • “⽣成AIが社会にもたらす影響を「産業⾰命やインターネット⾰命より ずっと⼤きなものになる」と分析。”[1] • ⾔葉通りに受け取ると、19 世紀以降最⼤の発明が⽣成AIか? • このため、政府は緊急で⽣成AIの開発を⽀援している • “さくらインターネットが2024年に⽣成AI向けクラウド開始、経産省が 68億円補助” [2] • “⽂章や画像などを⾃動で作る⽣成AIについて国内での独⾃の開発を⽀ 援しようと、経済産業省は、ソフトバンクに対し、およそ53億円の補 助⾦を出すと発表” [1] https://ledge.ai/articles/ai_strategy_mtg_second [2] https://xtech.nikkei.com/atcl/nxt/news/18/15427/ [3] https://www3.nhk.or.jp/news/html/20230707/k10014121611000.html
⽣成AIの社会的インパクト • 学⽣の皆さんは⽣まれてこれまでに得られた 常識を捨てざるを得ないレベルに ここ10年で社会は⽣成AIにより変化する • 世界中の経営判断を⽀援する会社、マッキンゼー • ⽣成AIによりGDPは年間630兆円増加する[1] • 世界3位、⽇本のGDP (年間548.5兆円[2])が1つ分発⽣ • 労働時間の60〜70%を占める仕事をAIで⾃動化できる[1] • ソフトバンクの経営者、孫正義 • AIの賢さは10年で100万倍に達し、⼈間と蝶の賢さを⽐べるぐらい、 ⼈間とAIの賢さを⽐べるのが無意味になる。[3] [1] https://japan.cnet.com/article/35206366/ [2] https://www.esri.cao.go.jp/jp/sna/menu.html [3] https://www.t.u-tokyo.ac.jp/ev2023-07-04
⽣成AIと我々の未来 • ⽣成AIを使ってどんな未来を発明していきたいのか • ChatGPTを⽣み出した企業の経営者、サム・アルトマン • 汎⽤⼈⼯知能(AGI)を開発し、ベーシック・インカム導⼊を⽬指す [1] • ベーシック・インカム:働かなくても収⼊が貰える仕組み • 注:⽣成AIでAGIができるとは限らない • ⻄村経産相 • AIが現状より進化した場合、ベーシック・インカム導⼊の議論の必要がある [2] • 村井⾸相補佐官(AI戦略会議の担当者) • 今もし学⽣だったら、AIで世界を変えることを選ぶ [2] [1] https://wired.jp/2021/11/12/get-free-crypto-orb-scans-eye/ [2] https://www.t.u-tokyo.ac.jp/ev2023-07-04
「未来を予測する最善の⽅法は、 それを発明することだ」 アラン・ケイ (パーソナルコンピュータの⽗)
あなたはどんな未来を 発明したいですか?