Google ADKを使ったメディア生成AI入門(概要)

>100 Views

July 25, 25

スライド概要

2025年7月25日に開催されたGenerative AI X-Meetup Vol.1 Tokyo & Osakaの登壇資料です。

https://linedevelopercommunity.connpass.com/event/361757/

参考資料

Vertex AI Studio の刷新: あらゆるモダリティにわたる生成 AI メディアモデルのソース
https://cloud.google.com/blog/ja/products/ai-machine-learning/vertex-ai-studio-redesigned

Vertex AI が動画、画像、音声、音楽にわたる生成メディアモデルを備えた唯一のプラットフォームに
https://cloud.google.com/blog/ja/products/ai-machine-learning/expanding-generative-media-for-enterprise-on-vertex-ai

google/adk-python | DeepWiki
https://deepwiki.com/google/adk-python

Build with Veo 3, now available in the Gemini API - Google Developers Blog
https://developers.googleblog.com/en/veo-3-now-available-gemini-api/

Chirp 3: HD 音声  |  Cloud Text-to-Speech API  |  Google Cloud
https://cloud.google.com/text-to-speech/docs/chirp3-hd?hl=ja

Firebase AI Logic client SDKs | Build generative AI features directly into your mobile and web apps
https://firebase.google.com/products/firebase-ai-logic?hl=ja

MCP Servers for Google Cloud Genmedia APIs
https://github.com/GoogleCloudPlatform/vertex-ai-creative-studio/tree/main/experiments/mcp-genmedia

Imagen - Google DeepMind
https://deepmind.google/models/imagen/

Veo - Google DeepMind
https://deepmind.google/models/veo/

Lyria - Google DeepMind
https://deepmind.google/models/lyria/

profile-image

一般男性,Cloud Developer,404ニキ,Microsoft MVP, LINE API Expert ,Google PTE 2025 DataAnalytics,AWS Community Builder Dev Tools, #dotnetlab 運営,投稿は個人の見解 , #AzPoC No.5

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

各ページのテキスト
1.

Google ADKを使った メディア生成AI入門(概要) Generative AI X-Meetup Vol.1 Tokyo & Osaka 1

2.

今日お伝えしたいこと ● ● ● ● 少しまえにこんな話をしました 生成AIによるメディア生成を実現するには Googleが誇るメディア系生成AI Google ADK(Agent Development Kit)でメディア生成はできるか 2

3.

自己紹介 山田顕人(Kento.Yamada) @ymd65536 仕事:MSP向け内製システムの開発 ロール:マルチクラウドエンジニア/デベロッパー 活動:.NETラボ勉強会、Azure AI Communityの運営 LINE API Expert(2024年〜) Google Cloud Partner Top Engineer 2025 DataAnalytics(2024年〜) Google Cloud Partner Tech Blog Challenge 2023 Cloud AI/ML 部門 LAPRAS OUTPUT AWARD 2024 01 3

4.

少し前にこんな話をしました Google Agent Development Kit でLINE Botを作ってみた 2025/7/14公開 Agent Development Kit (ADK) でLINE Bot作ってみた 2025/06/24公開 4

5.

生成AIによるメディア生成を実現するには 課金体系に注意(無料/サブスクリプション/従量課金のいずれか) ● Gemini for Google Workspace ● Google AI Studio ● Gemini CLI + MCP Servers for Google Cloud Genmedia APIs ○ Vertex AI Creative Studio(OSS)の実験的なMCPを利用 ● Google Colaboratory + Stable Diffusion ● Vertex AI Studio ○ Media Studioという項目で生成できる ● Firebase AI Logic SDK(NEW) ○ Firebase Studioと併用する 5

6.

Googleが誇るメディア系生成AI 項番 モデル名 役割 1 Imagen 4 最高品質のテキスト画像変換モデル 2 Chirp 3 画期的な音声生成モデル 3 Lyria 業界初のエンタープライズ対応テキスト音楽変換モデル 4 Veo 3 業界をリードする当社のビデオ生成モデル ※Veo3は音声付き動画を生成できるモデル、Veo2までは無音声の動画 ※Lyriaは楽曲生成、音声生成はgemini-2.5-flash-preview-ttsでも対応可能 6

7.

要約:Google ADK(Agent Development Kit )とは何なのか 特徴まとめ ● Googleが開発したSDK ● A2Aを制御 ○ A2AはMicrosoftもコミット 7

8.

でメディア生成はできるか 8

9.

結論:ADKとGen AI SDKの併用で開発する ● ● ● ● 画像:できる。(サンプルコードを見ると厳密にはGen AI SDKを利用) 動画:リアルタイム動画分析ならできる。ADKで生成はできない 音声:リアルタイム音声処理ならできる。ADKで生成はできない 音楽:音声と扱いは同じ。ADKで生成はできない 今(2025年7月25日)のところ: Gen AI SDKを使うことで動画や音声の生成に対応できる ADKではエージェントの制御、Gen AI SDKではVertex AIを制御 9

10.

補足:Gen AI SDKってなんなのサ ポイントに絞って解説 ● 現在推奨されるGoogle 生成AIのSDK ● Vertex AI SDKの後継 ● GoogleのGen AIを扱う時に利用するモダンなSDK 10

11.

まとめ 以前の話を踏まえてこんな話をしました。 ● 生成AIによるメディア生成を実現する方法をいくつか ● Googleにはいろんな生成AIのモデルがあること ● ADKでメディア生成は難しいのでGen AI SDKを使う 11

12.

おわり 12