LLM翻訳 vs 機械翻訳! AWSでのリアルタイム翻訳は何がベスト?

-- Views

May 25, 26

スライド概要

2026/05/22 クラメソさっぽろIT勉強会 (仮) #13 ウルトラLT大会

profile-image

札幌の隅っこにすんでるバックエンドエンジニア。

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

各ページのテキスト
1.

LLM翻訳 vs 機械翻訳! AWSでのリアルタイム翻訳は何がベスト? 2026/05/22 クラメソさっぽろIT勉強会 (仮) #13 ウルトラLT大会

2.

自己紹介 Name: Role: Fav: もりやま - serverworks - AWS Community Builder 2026 (Serverless) - キャンプ、お酒 - めぞん一刻

3.

英語できない。でも英語のセッションは聴きたい。 3

4.

課題:英語セッションの翻訳問題(特にリアルタイム) 課題 YouTube(オンデマンド)は字幕・翻訳機能が充実(Chrome拡張なども豊富) 一方、YouTube Liveやその他のライブ配信では、字幕の履歴が残らず、翻訳もない/あっても 精度がイマイチ 欲しいもの プラットフォームに依存せず、macOSのシステム音声をリアルタイム翻訳するツール 4

5.

作ったもの:realtime-transcriber(動画紹介) 音声キャプチャ → 発話区間検知 → 文字起こし → 翻訳 → 要約(1 分ごと) ※PDF版は動画が見れません。 5 0:00 / 0:35

6.

作ったもの:realtime-transcriber macOS 用 システム音声リアルタイム文字起こし・翻訳 CLI システム音声 → BlackHole 2ch(音声キャプチャ) → Silero VAD(発話区間検出) → MLX-Whisper(文字起こし) → AWS(翻訳・要約) BlackHole 2ch: システム音声を仮想オーディオに中継するツール AWS に送るのはテキストだけ。音声データは外に出ない 今回はこの翻訳部分についてピックアップ! 6

7.

昨今のリアルタイム翻訳手段は何が良いのか?:機械翻訳 vs LLM 比較したバックエンド AWS Translate(従来の機械翻訳) Amazon Bedrock(LLMによる翻訳) Amazon Nova 2 Lite Claude Haiku 4.5 Llama 4 Maverick Claude Sonnet 4.6 7

8.

速度比較 バックエンド Llama 4 Maverick Nova 2 Lite Claude Haiku 4.5 Claude Sonnet 4.6 AWS Translate 初回 1760〜2178 ms 2888〜3102 ms 2701〜3048 ms 3173〜4218 ms 2401〜2463 ms 2回目以降 589〜1032 ms 1057〜1414 ms 1103〜1633 ms 1812〜2384 ms 2401〜2463 ms Llama 4 Maverick が最速、Nova 2 Lite / Haiku 4.5 も 1〜1.6 秒で実用圏 Claude Sonnet 4.6 は 2 秒前後でリアルタイムには厳しい AWS Translate は機械翻訳でキャッシュ無し → 常に 2.4 秒で安定 LLM の初回が遅いのはプロンプトキャッシュ未ヒットのため(2 回目以降高速化) 8

9.

翻訳精度の比較① 原文: "You'd be out there procuring colo space left and right." (あちこちでコロケーションスペースを調達することになるでしょう。) モデル AWS Translate Nova 2 Lite Claude Haiku 4.5 Claude Sonnet 4.6 Llama 4 Maverick 翻訳結果 あちこちでカラースペースを調達することになります。 あなたはあちこちでcoloスペースを確保することになるでしょう。 あちこちでコロケーションスペースを調達しまくっているだろう。 あなたはコロケーションスペースをあちこちで調達しまくっているでしょう。 あなたはコロケーションスペースを次々と調達していることでしょう。 ※ colo space = colocation space(データセンターのラック貸しスペース) ※ = 専門用語を未翻訳のまま出力(誤訳ではない) 9

10.

翻訳精度の比較② 原文: "it's like borderline impossible, right?"(それってほぼ不可能ですよね?) モデル AWS Translate Nova 2 Lite Claude Haiku 4.5 Claude Sonnet 4.6 Llama 4 Maverick 翻訳結果 それはほぼ不可能だと思いますよね? それはほぼ不可能ですよね? ほぼ不可能に近いですよね? ほぼ不可能に近いですよね? 限界ギリギリの不可能って感じですよね? 全モデル概ね正確(口語・平易な文は差が出にくい) Llama 4 Maverick は口語的すぎる傾向 10

11.

翻訳結果の違い AWS Translate(機械翻訳): 翻訳専用モデル → 入力は「その文」だけ 追加の文脈や指示を与えられない "colo space" → 「カラースペース」(???) Amazon Bedrock(LLM): プロンプトで「技術セッションの文脈」を伝えられる 直近 1 分の翻訳要約を毎回プロンプトに注入している "colo space" → 「コロケーションスペース」と文脈から推論 口語表現も自然に意訳 11

12.

コスト比較(1時間あたり) バックエンド Llama 4 Maverick Nova 2 Lite Claude Haiku 4.5 AWS Translate Claude Sonnet 4.6 1時間あたり 約 14 円 約 18 円 約 46 円 約 124 円 約 130 円 速度 ◎ 最速 ○ ○ △ △ Sonnet 4.6 は精度は高いが速度・コストともに最悪 → リアルタイム用途では脱落 ※ 文字起こし(MLX-Whisper)はローカル実行なので無料 12

13.

まとめ:何を重視するかで選ぶ? 結論: リアルタイム翻訳は LLM(Bedrock)が機械翻訳より体験 ◎ 重視するもの バランス(速度/精度/コスト) 速度(リアルタイム性) 精度(専門用語・固有名詞) 安定性のみ(文脈不要) おすすめ Nova 2 Lite Llama 4 Maverick Claude Haiku 4.5 AWS Translate 理由 1 秒台 / 約 18 円/h / 文脈理解 OK 589〜1032 ms、最速・最安 速度・コストも実用範囲 ただし専門用語は外す 個人的には Nova 2 Lite がイチオシ! AWS Translate にもカスタム用語集はあるが、リアルタイムで未知の用語に対応するのは難しそ う。 13

14.

[参考]GitHub / Qiita GitHub Qiita https://github.com/SatoshiMoriyama/livetranslate https://qiita.com/s_moriyama/items/af1110bb8566136adb23 14

15.

終わりです。Thanks!!! 15

16.

[参考] 速度計測条件 検証日: 2026-05-11 ソース音声: YouTube Shorts https://www.youtube.com/shorts/BhgILBkdLfg 16

17.

[参考] コスト試算ロジック 前提条件: 30 秒で約 450 文字(英語)の発話 → 1 時間で約 54,000 文字 入力: 約 134K トークン/時間(システムプロンプト含む) 出力: 約 30K トークン/時間 為替レート: 1 USD = 150 JPY 17

18.

[参考] モデル単価(Bedrock On-Demand) バックエンド Llama 4 Maverick Nova 2 Lite Claude Haiku 4.5 Claude Sonnet 4.6 AWS Translate 入力 (per 1M tokens) $0.50 $0.30 $1.00 $3.00 $15.00 / 1M文字 出力 (per 1M tokens) $0.77 $2.50 $5.00 $15.00 — ※ ap-northeast-1(東京)リージョン、Standard tier、2026年5月時点 ※ AWS Translate は原文の文字数のみに課金 ※ Bedrock は入力+出力の両方にトークン課金 18