音声入力アプリを自作してみた

490 Views

February 25, 26

スライド概要

https://ore-no-benkyoukai.connpass.com/event/382083/ の発表資料です

profile-image

Software Engineer / Python

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

各ページのテキスト
1.

音声入力アプリを 自作してみた 俺の勉強会 #5 / 2026/02/24(火) / nibu

2.

音声入力、使ってますか? 2

3.

音声入力は高速 ● タイピングより早く入力できる ● Claude Codeなどに素早く指示を与えられる 3

4.

良いツールはある、でも当然有料 ● Aqua Voice … 月額 $10 ● SuperWhisper … 月額 $8.49 ● Wispr Flow … 月額 ¥1,200 ● VoiceOS … 月額 ¥1,200 大体 $8〜$10 程度 4

5.

毎月のお金の使い道 ● Claude / ChatGPT ● 技術書 ● 趣味のボルダリング / カレー ● 住宅ローン ● ビール、日本酒etc... → 自分で作れるなら作ろう 5

6.

デモ 6

7.

仕組み ● 🎙 録音 (sounddevice) ● → 💾 WAV保存 (numpy / scipy) ● → 🤖 OpenAI Audio API で文字起こし ● → 📋 クリップボードにコピー (pyperclip) ● → ⌨ ペースト (AppleScript) ● ホットキー: pynput / アプリ化: PyInstaller 7

8.

機能 ● ⌨ ホットキー … Ctrl / Alt など変更可 ● 🔴 録音モード … 押しっぱなし or トグル ● 🎙 入力デバイス … マイクを選択可能 8

9.

完成した!やったね! 9

10.

デモ・・・ 10

11.

お高いんでしょう? 11

12.

コスト比較 ● Aqua Voice … $10/月 × 3ヶ月 = $30(約4,500円) ● OpenAI API … 1分あたり $0.006 ○ 総音声時間: 10,333秒(約172分) ○ 3ヶ月合計 $1.04(約150円) → 約4,350円の節約💰 12

13.

OpenAI APIの挙動の罠? ● 無音だと「ご清聴ありがとうございました」 ○ YouTubeの学習データが影響している? ○ temperature=0 を試したが効果なし ○ → 音量が小さければAPIを叩かないよう変更 13

14.

課題 ● 初回起動時にアクセシビリティ設定が必要 ○ macOSのセキュリティ上避けられない様子 ● 接続機器の切替 / スリープ後に使えなくなる... ○ 対応中 14

15.

まとめ ● 自分の盆栽ができて、 コツコツ手入れするのは楽しい! ● 普段触らない領域に 踏み出す良い機会になった! ● リポジトリ: voice-input-tool 15

16.

自己紹介 ● nibu ● Software Engineer ● 株式会社ビープラウド ● x: nibu(@YumihikiDev) ● 愛知県には2023年12月に引っ越してきました! ● ボルダリング / カレー / 日本酒 16