5K Views
November 17, 24
スライド概要
生成AI Expo in 東海。3日目、名古屋会場
https://aiexpo-nagoya.com/genaiexpotokai-2024-nagoya#timetable
闇のエンジニア/変なデジカメ開発中/ディープラーニング芸人/Raspberry Piとからあげ大好き/はてなブログ書いてます
生成AI時代のAI独学法 ~生成AI EXPO in 東海Ver~ 生成AI EXPO in 東海 2024/11/17
自己紹介 名前:からあげ(本名は内緒) 職業:AIのおしごと 家族:妻・娘・ネコ x 2 https://karaage.hatenadiary.jp @karaage0703 karaage0703 ブログ、各種SNSで情報発信しています
主な著書・寄稿・協力 2021/01/08発売 2021/04/21 改訂版発売 2024/01/29 新発売 ← New!! 4万部のベストセラー その他、寄稿・協力・個人出版多数(20冊以上) (ラズパイマガジン・日経Linux…)
メイカーとしての活動 過去に出展・登壇したモノづくり系イベント ・Ogaki Mini Maker Faire 2016 ・Ogaki Mini Maker Faire 2018 ・趣味TECH祭2019 ・NT金沢2022年 ・Ogaki Mini Maker Faire 2022 ・NT金沢2023年 ・NT名古屋2023年 ・Hamamatsu Micro Maker Faire 2023 ・Kariya Micro Maker Faire 2024 ・NT金沢2024 ・つくろか!3 ・Ogaki Mini Maker Faire 2024(予定)
実は元製造業です 愛知県の某自動車関係のサプライヤとして働いていました
今日話すこと - AIの重要性(5分) - AIを学ぶ(20分) - 作ってみる - 本を読む - コミュニティ(発信) - まとめ(5分)
今日話すこと - AIの重要性 - AIを学ぶ - 作ってみる - 本を読む - コミュニティ(発信) - まとめ
AIの過去のブーム 引用元:ICTの進化が雇用と働き方に及ぼす影響に関する調査研究(総務省) 2020年代いよいよ第四次人工知能ブーム!?
AIの性能向上(画像認識) ヒントン先生がディープラーニングで コンペで圧勝し衝撃を与える AlexNet ZFNet 2015年に人間を超える GoogLeNet VGGNet ResNet 引用元:Mocha.jl: Deep Learning for Julia 画像認識では2015年に既に人間超え
生成AI(LLM)の脅威的普及 各サービスの月間利用者数100万人を超えるのに要した時間 引用元:面倒なことはChatGPTにやらせよう(講談社) ChatGPTの普及の驚異的スピード
AIのインフラ化 ・パーソナルコンピュータ ・インターネット ・スマートフォン ・生成AI ← New 個人の所感ではありますが 新たなインフラになる可能性を感じています
今日話すこと - AIの重要性 - AIを学ぶ - 作ってみる - 本を読む - コミュニティ(発信) - まとめ
AIを学ぶ道呈 転職 まだまだ道半ば ひたすら独学・迷走 ディープラーニングおじさんとの出会い 暗黒会社員時代 先が見えないまま道なき道をひたすら走ってきました
暗黒会社員時代 ・外注への設計丸投げ ・山のようなエクセルのチェックシート ・たくさんのなぜなぜ(だいじなことなので5回や りました) ・etc… 「こんなもののために生まれたんじゃない」 by 月光 (鬼束ちひろ)
自分がAIを学ぶきっかけ ディープラーニングおじさん 0ヶ月 1週間後 2ヶ月後 6ヶ月後 12ヶ月後 18ヶ月後 ディープラーニングの画像認識デモを見てAIに目覚める Linux・AI環境セットアップ Pythonで画像認識プログラム開発 仕事で活用開始 セミナー参加の講師と対等に議論 Jetson TX1/TX2を3台ずつ揃えてディープラーニング実験 会社のAI戦略を動かす人材に 自分より(当時)ふたまわり以上年上の人が 独学で短期間でAIを学んで業務に活用
生成AIとの関わり:AIの冬の時代 GAで生成した仮想生物 (イメージで自分の研究とは関係ありません) ちょうど学生のころ。ニューラルネットは禁断の技術扱い 自分はGA(遺伝的アルゴリズム)とかやっていました
生成AIとの関わり:GANで遊ぶ からあげの画像を生成して遊ぶ → 何故か某公共放送事業体に技術協力することに
生成AIとの関わり:画像生成 Stable Diffusionが出はじめのころに商業誌に寄稿しています 画像生成を使ったアプリも作っています(後で紹介します)
生成AIとの関わり:文章生成 ChatGPTでAdvanced Data Analysis(Code Interpreter)が 出始めてすぐカレーちゃんと一緒に書いた本
余談:執筆秘話
3回の大幅な書き直し ・エンジニア目線からより一般人目線に ・結果を安定させるプロンプトの改善 ・OpenAI 大幅アップデート対応 それなりに本を書いていますが、修正量は過去最大 → その分良い本に仕上がったと思います
生々しい修正ゲラ 最後の最期まで修正が続きました
原稿仕上がるまで帰れま10
編集者が狂気の参拝アカウントへ
AIを支える技術 (一般的に) すぐに役に立つ・使えるけど応 用範囲は狭い 応用範囲は広いけれど、すぐに役 に立たず習得に時間がかかる 引用元:「からあげ先生のとにかく楽しいAI自作教室」(日経BP) 最先端のAIも実は基礎的な知識の積み重ね どこから学んでも良いが自分がどこにいるか意識することが大切
今日話すこと - AIの重要性 - AIを学ぶ - 作ってみる - 本を読む - コミュニティ(発信) - まとめ
自分が過去に作ったものの例
自分が作ったもの ・Skeleton Sequencer ・NINJA ランタン ・AIルンバ ・AI動物園 ・LLM(Large Language Mario) AI・LLM関係で作ってきた1部を例に紹介
Skeleton Sequencerとは 引用元:YAMAHA TENORI-ON製品紹介ページ AIを使った楽器。AIと音楽の組み合わせ
Skeleton Sequencerの紹介 姿勢推定の技術 骨格情報を元に人の形をマスク 姿勢推定技術のソフトウェアの使い方を理解して応用
Skeleton Sequencer https://karaage0703.github.io/daily-creative-coding/ 20220531_001_skeleton_sequencer_control/ 昔はキネクトを使った巨大なシステムでしたが AIの進化でスマートフォンで動くようになりました
ニンジャランタン 手の印に反応して色を変えることができるイン タラクティブなトルコランプ
Deep写輪眼 https://github.com/Kazuhito00/NARUTO-HandSignDetection 高橋 かずひとさんの公開しているOSSを活用
ニンジャランタン Deep写輪眼 Inside USB Camera USB Raspberry Pi I2C NeoPixel 電子工作して組み合わせてみる
AIルンバ ルンバは仕様が公開されているシリアルインターフェースがあるので 簡単にハックできます。(ブログで詳しく解説しています) AI x ロボットの組み合わせ
生成AIを使ってからあげとレモンを見分ける
生成AIで教師データを生成して学習
生成AIで教師データを生成して学習
自作基板で小型化 小型かつコンパクトにするために基板を作ってます
生成AIで動くルンバ
AI動物園 Stable Diffusionで人を動物に変換 GitHub Camera Gaming PC (Linux) AIどうぶつえん(p5.js) 画像データ アクセス Smartphone
Stable Diffusionの概要(抜粋) Diffusion Model シード値 “42” テキスト 乱数 潜在空間に少しノイズ を加えることで、異なる パターンの絵を生成 デコーダ 条件付け UNet 器 64x64 潜在空間 64x64 潜在空間 スケジューラ Nステップ繰り返し 仕組みを理解して自分なりの工夫をする 512x512 生成画像
マリオAIチャレンジ PyTorchチュートリアルに日本語訳されていない 面白そうなコンテンツ発見
チュートリアルを試した結果 解説や可視化が少なく、最後まで動かしても 何をしているか全然分からない…
コードをわかりやすく改造 コードを実行しながら中身を可視化・解説を補足
記事で公開 1ステージもクリアできなかったのですが ブログで公開したら興味を持った人が参加してくれました
マリオAIチャレンジ ルール • AIマリオを楽しみましょう • 情報をシェアしましょう • Google Colaboratory Notebookを使いましょう • AIを使いましょう • 人間の指示は禁止です • ルールは柔軟に変更されます プロジェクト化してみんなでやってみることに
8-3 @Kazuhito00 最難関ステージ 8-3 までクリア
日本語版の公式チュートリアルにも採用 実はこの日本語チュートリアル作っている方は 今の職場の同僚
LLMでマリオ(Large Language Mario) LLM(ChatGPT)でもマリオができる
Large Language Marioプロンプト この画像はゲーム、スーパーマリオのプレイ画面です。 画面に応じて、以下の7つのボタン操作ができます。 ボタン操作は以下の7つからどれかを選んでください。 NOOPが操作しない。Aがジャンプ。Bがダッシュです。 0 = 'NOOP' 1 = 'right' 2 = 'right', ‘A' 3 = 'right', 'B' 4 = 'right', 'A', 'B' 5 = 'A' 6 = 'left' 以下の通りjson出力してください。日本語でお願いします。 explanation: 画面の説明 reason: ボタン操作の理由 action: ボタン操作の種類
中身を覗いてみるのが大事 中で何が起こっているかをじっくりみてみるのが重要 電子回路(ハードウェア)もAI(ソフトウェア)も同じ
今日話すこと - AIの重要性 - AIを学ぶ - 作ってみる - 本を読む - コミュニティ(発信) - まとめ
ゼロから作るシリーズ 定番。効率が悪いように思えるが、手を動かして基礎 (ゼロ)から作ってみる経験は大事。自信にもつながる
ゼロから作るシリーズ 写経して実際に動かしてみる。 少し自分なりに変えてみる。応用してみる
Kaggle関係 カレーちゃん(ChatGPT本の共著者)や石原さん(u++さん)が 書いている本がおすすめ
データコンペへの参加 SIGNATEさんのChatGPTチャレンジで優勝しました 自分はあんまりデータコンペ得意じゃないですがKaggleでメダルとると転 職にも有利(という噂)
今日話すこと - AIの重要性 - AIを学ぶ - 作ってみる - 本を読む - コミュニティ(発信) - まとめ
発信 作ったもの・調べたことはSNS・ブログ等で発信 勉強会→イベント→書籍寄稿→書籍執筆へと繋がる
書籍コミュニティ
#ChatGPTやらせ隊 ・書籍購入予定者のみが入れるコミュニティです ・書籍への質問、感想、さらなる高度なテクニックの議 論が行われています ・すでに160名を超えるメンバーが加入 ・Discordサーバで運営されています。レッツジョイン! https://discord.gg/D7cXyT2AQz ChatGPTで作ったQRコード
JDLA(日本ディープラーニング協会) 画像はJDLA公式サイトより引用 G検定・E資格・Generative AI Testがある G検定・E検定に合格するとCDLE(コミュニティ)に入れます
生成AIを活用する人におすすめ 年2回開催・オンライン(自宅受験)
GAT紹介資料 ・試験シラバス 『生成AIに何ができるのか?』『背景となるロジック』『生成AIの利用において気を付けるべきこと』が理解できるよ うになり、 企業の生成AI活用の旗手となるためのリテラシーを身に着けることができます。 生成AIの利活用 生成AIの技術 【特徴】 【特徴】 生成AIには何ができるのか、どのように使うのか、性能を拡張する使い方 テキスト、画像、音声等の生成モデルに共通する技術的な特徴 【動向】 大規模言語モデルの基本構造、モデルの学習方法、アラインメント、生成の仕 新たな活用方法を生み出すためのアプローチ、活用を制限する要因、業界に特 組み、大規模言語モデルの性能評価 化した生成AIの活用方法 【動向】 テキスト、画像、音声等の生成モデルの技術動向大規模言語 生成AIのリスク モデルのオープン化 【特徴】 大規模言語モデルの性能を決める要素、マルチモーダル化、外部ツール・リソ 技術面・倫理面・法令面・社会面など多様なリスク ースの利用 生成AIの入力(データ)と出力(生成物)について 【動向】 新たなリスクの出現とそれに伴う規制化の可能性、規制化、情報収集、生成AI の活用に伴うリスクを自主的に低減するための方法
今日話すこと - AIの重要性 - AIを学ぶ - 作ってみる - 本を読む - コミュニティ(発信) - まとめ
今日のまとめ 今日は以下についてお話しました - AIの重要性 - AIを学ぶ - 作ってみる - 本を読む - コミュニティ(発信) みなさんがAIを自分で学ぶきっかけになれば嬉しいです
今日のまとめ 大事なのは継続! そのためには仲間が大切だと思います。 そのためにこのような機会はとても貴重だと思います みんなでときに楽しみ、ときに苦しみながら AIを学んでいきましょう!
ご静聴ありがとうございました