LLM翻訳 vs 機械翻訳！ AWSでのリアルタイム翻訳は何がベスト？

393 Views

May 25, 26

#リアルタイム翻訳 #LLM #機械翻訳 #AWS #macOS

スライド概要

2026/05/22 クラメソさっぽろIT勉強会 (仮) #13 ウルトラLT大会

もりやま

@moriyama

スライド一覧

札幌の隅っこにすんでるバックエンドエンジニア。

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

マルチテナントSaaSを正しく作りたい！

もりやま 7.6K

パワーアップしたStepFunctionsすごいぞ！

もりやま 3.7K

SQLServerのパフォーマンスチューニング

もりやま 3.4K

マルチテナントSaaSを正しく作りたい！（セキュリティ編）

もりやま 3K

AWSのMCPサーバーたちについて調べてみた。

もりやま 2.5K

「最小権限」を「最小の手間」で実現したい。

もりやま 2.3K

各ページのテキスト

LLM翻訳 vs 機械翻訳！ AWSでのリアルタイム翻訳は何がベスト？ 2026/05/22 クラメソさっぽろIT勉強会 (仮) #13 ウルトラLT大会

自己紹介 Name： Role： Fav：もりやま - serverworks - AWS Community Builder 2026 (Serverless) - キャンプ、お酒 - めぞん一刻

英語できない。でも英語のセッションは聴きたい。 3

課題：英語セッションの翻訳問題（特にリアルタイム）課題 YouTube（オンデマンド）は字幕・翻訳機能が充実（Chrome拡張なども豊富）一方、YouTube Liveやその他のライブ配信では、字幕の履歴が残らず、翻訳もない／あっても精度がイマイチ欲しいものプラットフォームに依存せず、macOSのシステム音声をリアルタイム翻訳するツール 4

作ったもの：realtime-transcriber（動画紹介）音声キャプチャ → 発話区間検知 → 文字起こし → 翻訳 → 要約（1 分ごと） ※PDF版は動画が見れません。 5 0:00 / 0:35

作ったもの：realtime-transcriber macOS 用システム音声リアルタイム文字起こし・翻訳 CLI システム音声 → BlackHole 2ch（音声キャプチャ） → Silero VAD（発話区間検出） → MLX-Whisper（文字起こし） → AWS（翻訳・要約） BlackHole 2ch: システム音声を仮想オーディオに中継するツール AWS に送るのはテキストだけ。音声データは外に出ない今回はこの翻訳部分についてピックアップ！ 6

昨今のリアルタイム翻訳手段は何が良いのか？：機械翻訳 vs LLM 比較したバックエンド AWS Translate（従来の機械翻訳） Amazon Bedrock（LLMによる翻訳） Amazon Nova 2 Lite Claude Haiku 4.5 Llama 4 Maverick Claude Sonnet 4.6 7

速度比較バックエンド Llama 4 Maverick Nova 2 Lite Claude Haiku 4.5 Claude Sonnet 4.6 AWS Translate 初回 1760〜2178 ms 2888〜3102 ms 2701〜3048 ms 3173〜4218 ms 2401〜2463 ms 2回目以降 589〜1032 ms 1057〜1414 ms 1103〜1633 ms 1812〜2384 ms 2401〜2463 ms Llama 4 Maverick が最速、Nova 2 Lite / Haiku 4.5 も 1〜1.6 秒で実用圏 Claude Sonnet 4.6 は 2 秒前後でリアルタイムには厳しい AWS Translate は機械翻訳でキャッシュ無し → 常に 2.4 秒で安定 LLM の初回が遅いのはプロンプトキャッシュ未ヒットのため（2 回目以降高速化） 8

翻訳精度の比較① 原文: "You'd be out there procuring colo space left and right." （あちこちでコロケーションスペースを調達することになるでしょう。）モデル AWS Translate Nova 2 Lite Claude Haiku 4.5 Claude Sonnet 4.6 Llama 4 Maverick 翻訳結果あちこちでカラースペースを調達することになります。あなたはあちこちでcoloスペースを確保することになるでしょう。あちこちでコロケーションスペースを調達しまくっているだろう。あなたはコロケーションスペースをあちこちで調達しまくっているでしょう。あなたはコロケーションスペースを次々と調達していることでしょう。 ※ colo space = colocation space（データセンターのラック貸しスペース） ※ = 専門用語を未翻訳のまま出力（誤訳ではない） 9

10.

翻訳精度の比較② 原文: "it's like borderline impossible, right?"（それってほぼ不可能ですよね？）モデル AWS Translate Nova 2 Lite Claude Haiku 4.5 Claude Sonnet 4.6 Llama 4 Maverick 翻訳結果それはほぼ不可能だと思いますよね？それはほぼ不可能ですよね？ほぼ不可能に近いですよね？ほぼ不可能に近いですよね？限界ギリギリの不可能って感じですよね？全モデル概ね正確（口語・平易な文は差が出にくい） Llama 4 Maverick は口語的すぎる傾向 10

11.

翻訳結果の違い AWS Translate（機械翻訳）: 翻訳専用モデル → 入力は「その文」だけ追加の文脈や指示を与えられない "colo space" → 「カラースペース」（？？？） Amazon Bedrock（LLM）: プロンプトで「技術セッションの文脈」を伝えられる直近 1 分の翻訳要約を毎回プロンプトに注入している "colo space" → 「コロケーションスペース」と文脈から推論口語表現も自然に意訳 11

12.

コスト比較（1時間あたり）バックエンド Llama 4 Maverick Nova 2 Lite Claude Haiku 4.5 AWS Translate Claude Sonnet 4.6 1時間あたり約 14 円約 18 円約 46 円約 124 円約 130 円速度 ◎ 最速 ○ ○ △ △ Sonnet 4.6 は精度は高いが速度・コストともに最悪 → リアルタイム用途では脱落 ※ 文字起こし（MLX-Whisper）はローカル実行なので無料 12

13.

まとめ：何を重視するかで選ぶ？結論: リアルタイム翻訳は LLM（Bedrock）が機械翻訳より体験 ◎ 重視するものバランス（速度/精度/コスト）速度（リアルタイム性）精度（専門用語・固有名詞）安定性のみ（文脈不要）おすすめ Nova 2 Lite Llama 4 Maverick Claude Haiku 4.5 AWS Translate 理由 1 秒台 / 約 18 円/h / 文脈理解 OK 589〜1032 ms、最速・最安速度・コストも実用範囲ただし専門用語は外す個人的には Nova 2 Lite がイチオシ！ AWS Translate にもカスタム用語集はあるが、リアルタイムで未知の用語に対応するのは難しそう。 13

14.

[参考]GitHub / Qiita GitHub Qiita https://github.com/SatoshiMoriyama/livetranslate https://qiita.com/s_moriyama/items/af1110bb8566136adb23 14

15.

終わりです。Thanks!!! 15

16.

[参考] 速度計測条件検証日: 2026-05-11 ソース音声: YouTube Shorts https://www.youtube.com/shorts/BhgILBkdLfg 16

https://www.youtube.com/shorts/BhgILBkdLfg

17.

[参考] コスト試算ロジック前提条件: 30 秒で約 450 文字（英語）の発話 → 1 時間で約 54,000 文字入力: 約 134K トークン/時間（システムプロンプト含む）出力: 約 30K トークン/時間為替レート: 1 USD = 150 JPY 17

18.

[参考] モデル単価（Bedrock On-Demand）バックエンド Llama 4 Maverick Nova 2 Lite Claude Haiku 4.5 Claude Sonnet 4.6 AWS Translate 入力 (per 1M tokens) $0.50 $0.30 $1.00 $3.00 $15.00 / 1M文字出力 (per 1M tokens) $0.77 $2.50 $5.00 $15.00 — ※ ap-northeast-1（東京）リージョン、Standard tier、2026年5月時点 ※ AWS Translate は原文の文字数のみに課金 ※ Bedrock は入力+出力の両方にトークン課金 18