>100 Views
July 25, 25
スライド概要
2025年7月25日に開催されたGenerative AI X-Meetup Vol.1 Tokyo & Osakaの登壇資料です。
https://linedevelopercommunity.connpass.com/event/361757/
参考資料
Vertex AI Studio の刷新: あらゆるモダリティにわたる生成 AI メディアモデルのソース
https://cloud.google.com/blog/ja/products/ai-machine-learning/vertex-ai-studio-redesigned
Vertex AI が動画、画像、音声、音楽にわたる生成メディアモデルを備えた唯一のプラットフォームに
https://cloud.google.com/blog/ja/products/ai-machine-learning/expanding-generative-media-for-enterprise-on-vertex-ai
google/adk-python | DeepWiki
https://deepwiki.com/google/adk-python
Build with Veo 3, now available in the Gemini API - Google Developers Blog
https://developers.googleblog.com/en/veo-3-now-available-gemini-api/
Chirp 3: HD 音声 | Cloud Text-to-Speech API | Google Cloud
https://cloud.google.com/text-to-speech/docs/chirp3-hd?hl=ja
Firebase AI Logic client SDKs | Build generative AI features directly into your mobile and web apps
https://firebase.google.com/products/firebase-ai-logic?hl=ja
MCP Servers for Google Cloud Genmedia APIs
https://github.com/GoogleCloudPlatform/vertex-ai-creative-studio/tree/main/experiments/mcp-genmedia
Imagen - Google DeepMind
https://deepmind.google/models/imagen/
Veo - Google DeepMind
https://deepmind.google/models/veo/
Lyria - Google DeepMind
https://deepmind.google/models/lyria/
一般男性,Cloud Developer,404ニキ,Microsoft MVP, LINE API Expert ,Google PTE 2025 DataAnalytics,AWS Community Builder Dev Tools, #dotnetlab 運営,投稿は個人の見解 , #AzPoC No.5
Google ADKを使った メディア生成AI入門(概要) Generative AI X-Meetup Vol.1 Tokyo & Osaka 1
今日お伝えしたいこと ● ● ● ● 少しまえにこんな話をしました 生成AIによるメディア生成を実現するには Googleが誇るメディア系生成AI Google ADK(Agent Development Kit)でメディア生成はできるか 2
自己紹介 山田顕人(Kento.Yamada) @ymd65536 仕事:MSP向け内製システムの開発 ロール:マルチクラウドエンジニア/デベロッパー 活動:.NETラボ勉強会、Azure AI Communityの運営 LINE API Expert(2024年〜) Google Cloud Partner Top Engineer 2025 DataAnalytics(2024年〜) Google Cloud Partner Tech Blog Challenge 2023 Cloud AI/ML 部門 LAPRAS OUTPUT AWARD 2024 01 3
少し前にこんな話をしました Google Agent Development Kit でLINE Botを作ってみた 2025/7/14公開 Agent Development Kit (ADK) でLINE Bot作ってみた 2025/06/24公開 4
生成AIによるメディア生成を実現するには 課金体系に注意(無料/サブスクリプション/従量課金のいずれか) ● Gemini for Google Workspace ● Google AI Studio ● Gemini CLI + MCP Servers for Google Cloud Genmedia APIs ○ Vertex AI Creative Studio(OSS)の実験的なMCPを利用 ● Google Colaboratory + Stable Diffusion ● Vertex AI Studio ○ Media Studioという項目で生成できる ● Firebase AI Logic SDK(NEW) ○ Firebase Studioと併用する 5
Googleが誇るメディア系生成AI 項番 モデル名 役割 1 Imagen 4 最高品質のテキスト画像変換モデル 2 Chirp 3 画期的な音声生成モデル 3 Lyria 業界初のエンタープライズ対応テキスト音楽変換モデル 4 Veo 3 業界をリードする当社のビデオ生成モデル ※Veo3は音声付き動画を生成できるモデル、Veo2までは無音声の動画 ※Lyriaは楽曲生成、音声生成はgemini-2.5-flash-preview-ttsでも対応可能 6
要約:Google ADK(Agent Development Kit )とは何なのか 特徴まとめ ● Googleが開発したSDK ● A2Aを制御 ○ A2AはMicrosoftもコミット 7
でメディア生成はできるか 8
結論:ADKとGen AI SDKの併用で開発する ● ● ● ● 画像:できる。(サンプルコードを見ると厳密にはGen AI SDKを利用) 動画:リアルタイム動画分析ならできる。ADKで生成はできない 音声:リアルタイム音声処理ならできる。ADKで生成はできない 音楽:音声と扱いは同じ。ADKで生成はできない 今(2025年7月25日)のところ: Gen AI SDKを使うことで動画や音声の生成に対応できる ADKではエージェントの制御、Gen AI SDKではVertex AIを制御 9
補足:Gen AI SDKってなんなのサ ポイントに絞って解説 ● 現在推奨されるGoogle 生成AIのSDK ● Vertex AI SDKの後継 ● GoogleのGen AIを扱う時に利用するモダンなSDK 10
まとめ 以前の話を踏まえてこんな話をしました。 ● 生成AIによるメディア生成を実現する方法をいくつか ● Googleにはいろんな生成AIのモデルがあること ● ADKでメディア生成は難しいのでGen AI SDKを使う 11
おわり 12