30.8K Views
June 24, 23
スライド概要
2023/06/24 ChatGPT のAPIを使ったハンズオン #機械学習名古屋 LTにて発表
闇のエンジニア/変なデジカメ開発中/ディープラーニング芸人/Raspberry Piとからあげ大好き/はてなブログ書いてます
WhisperとChatGPTで文字起こし Chat GPT のAPIを使ったハンズオンでのLT 2023/06/24 からあげ @karaage0703
自己紹介 名前:からあげ(本名は内緒) 職業:エンジニア 家族:妻・娘・ネコ x 2 https://karaage.hatenadiary.jp @karaage0703 karaage0703 ブログ、各種SNSで情報発信しています
SIGNATEのChatGPTコンペ 活用成功例 活用失敗例 2部門を制覇!(自慢です)
Podcastを文字起こししたい 歴史について語るPodcast 「COTEN RADIO」を愛聴してます エピソードを振り返りたいとき 音声だと時間かかるし振り返れないので不便
AIで文字起こしだ!!
Whisperで文字起こし 項目 Whisper API Google Colaboratory ローカル (Docker) お金 API料金(1円/分) △ 無料(課金可) ◯ 無料 ◯ 無し ◯ 不要 ◯ あり(課金次第) △ 毎回必要 ☓ 無し ◯ 初回のみ必要 ◯ 必要 ☓ 必要 ☓ 不要 ◯ ほぼ不要 ◯ 不要 ◯ 必要 ☓ 利用時間制約 モデルダウンロード ネット環境 セットアップ 方法は色々ありますがお好みで (今回はGoogle Colaboratory前提です)
文字起こしの問題点 句読点無し 樋口 世界の歴史キュレーションプログラム コテンラジオ樋口 世界の歴史キュレーション プログラム コテンラジオパーソナリティーの株式会社ブック代表樋口清則 です深井 そし て株式会社コテンの深井 隆之介です樋口 そして株式会社コテンの楊 英史です樋口 この ラジオは歴史を愛し歴史 の面白さを知りすぎてしまった深井さんを代表とする株式会社 コテンのお二人と一緒に学校の授業ではなかなか学べない国内外 の歴史の面白さを学ん じゃおうという番組ですよろしくお願いします 誰が喋っているか 分かりづらい 出典: 2019年12月23日放送 COTEN RADIO「お金の歴史」 ―カネさえあれば人生HAPPY? WhisperではLargeモデルでもプロンプトに句読点含め ても現状はあまりうまくいかない
それでもChatGPTなら… ChatGPTならきっと何とか してくれる…
プロンプト(無茶振り) 次の文章の誤記訂正、句読点の追加をしてください。 極力元の文章は変更しないようにしてください。 頼む!
ChatGPT回答 やるじゃん…
問題点 チャットGPTへの入力: GPT-3.5で入出力合わせて4096トークン※ (※ 最近1万6千トークンに対応) 1話の文字起こし結果 1万トークン 入力としては余裕持って半分の更に半分(1/4) 1000トークンくらい プロンプトの文字数制限にひっかかる
対策 1000トークン 1話の文字起こし結果 1万トークン 1000トークン … 1000トークン 困難は分割 (コードはChatGPTに書いてもらいました)
成果物 https://github.com/karaage0703/colab-notebooks transcription.ipynb Google Colaboratoryで 簡単に文字起こしできます(要OpenAI API KEY) 試してみてください
ご静聴ありがとうございました