---
title: LLM翻訳 vs 機械翻訳！ AWSでのリアルタイム翻訳は何がベスト？
tags: 
author: [もりやま](https://image.docswell.com/user/moriyama)
site: [Docswell](https://www.docswell.com/)
thumbnail: https://bcdn.docswell.com/page/4EQYDPX2JP.jpg?width=480
description: 2026/05/22 クラメソさっぽろIT勉強会 (仮) #13 ウルトラLT大会
published: May 25, 26
canonical: https://image.docswell.com/s/moriyama/ZMQV6G-2026-05-25-042218
---
# Page. 1

![Page Image](https://bcdn.docswell.com/page/4EQYDPX2JP.jpg)

LLM翻訳 vs 機械翻訳！
AWSでのリアルタイム翻訳は何がベスト？
2026/05/22 クラメソさっぽろIT勉強会 (仮) #13 ウルトラLT大会


# Page. 2

![Page Image](https://bcdn.docswell.com/page/KJ4WZY6P71.jpg)

自己紹介
Name：
Role：
Fav：
もりやま
- serverworks
- AWS Community Builder 2026 (Serverless)
- キャンプ、お酒
- めぞん一刻


# Page. 3

![Page Image](https://bcdn.docswell.com/page/LE1YR6VX7G.jpg)

英語できない。でも英語のセッションは聴きたい。
3


# Page. 4

![Page Image](https://bcdn.docswell.com/page/GEWG1WLKJ2.jpg)

課題：英語セッションの翻訳問題（特にリアルタイム）
課題
YouTube（オンデマンド）は字幕・翻訳機能が充実（Chrome拡張なども豊富）
一方、YouTube Liveやその他のライブ配信では、字幕の履歴が残らず、翻訳もない／あっても
精度がイマイチ
欲しいもの
プラットフォームに依存せず、macOSのシステム音声をリアルタイム翻訳するツール
4


# Page. 5

![Page Image](https://bcdn.docswell.com/page/47ZLP5MNJ3.jpg)

作ったもの：realtime-transcriber（動画紹介）
音声キャプチャ → 発話区間検知 → 文字起こし → 翻訳 → 要約（1 分ごと）
※PDF版は動画が見れません。
5
0:00 / 0:35


# Page. 6

![Page Image](https://bcdn.docswell.com/page/YJ6WM9N9JV.jpg)

作ったもの：realtime-transcriber
macOS 用 システム音声リアルタイム文字起こし・翻訳 CLI
システム音声
→ BlackHole 2ch（音声キャプチャ）
→ Silero VAD（発話区間検出）
→ MLX-Whisper（文字起こし）
→ AWS（翻訳・要約）
BlackHole 2ch: システム音声を仮想オーディオに中継するツール
AWS に送るのはテキストだけ。音声データは外に出ない
今回はこの翻訳部分についてピックアップ！
6


# Page. 7

![Page Image](https://bcdn.docswell.com/page/GJ5MZN5DJ4.jpg)

昨今のリアルタイム翻訳手段は何が良いのか？：機械翻訳 vs LLM
比較したバックエンド
AWS Translate（従来の機械翻訳）
Amazon Bedrock（LLMによる翻訳）
Amazon Nova 2 Lite
Claude Haiku 4.5
Llama 4 Maverick
Claude Sonnet 4.6
7


# Page. 8

![Page Image](https://bcdn.docswell.com/page/LE3W925QE5.jpg)

速度比較
バックエンド
Llama 4 Maverick
Nova 2 Lite
Claude Haiku 4.5
Claude Sonnet 4.6
AWS Translate
初回
1760〜2178 ms
2888〜3102 ms
2701〜3048 ms
3173〜4218 ms
2401〜2463 ms
2回目以降
589〜1032 ms
1057〜1414 ms
1103〜1633 ms
1812〜2384 ms
2401〜2463 ms
Llama 4 Maverick が最速、Nova 2 Lite / Haiku 4.5 も 1〜1.6 秒で実用圏
Claude Sonnet 4.6 は 2 秒前後でリアルタイムには厳しい
AWS Translate は機械翻訳でキャッシュ無し → 常に 2.4 秒で安定
LLM の初回が遅いのはプロンプトキャッシュ未ヒットのため（2 回目以降高速化）
8


# Page. 9

![Page Image](https://bcdn.docswell.com/page/8EDKGZDW7G.jpg)

翻訳精度の比較①
原文: &quot;You&#039;d be out there procuring colo space left and right.&quot;
（あちこちでコロケーションスペースを調達することになるでしょう。）
モデル
AWS Translate
Nova 2 Lite
Claude Haiku 4.5
Claude Sonnet 4.6
Llama 4 Maverick
翻訳結果
あちこちでカラースペースを調達することになります。
あなたはあちこちでcoloスペースを確保することになるでしょう。
あちこちでコロケーションスペースを調達しまくっているだろう。
あなたはコロケーションスペースをあちこちで調達しまくっているでしょう。
あなたはコロケーションスペースを次々と調達していることでしょう。
※ colo space = colocation space（データセンターのラック貸しスペース）
※ = 専門用語を未翻訳のまま出力（誤訳ではない）
9


# Page. 10

![Page Image](https://bcdn.docswell.com/page/V7PK3DXXJ8.jpg)

翻訳精度の比較②
原文: &quot;it&#039;s like borderline impossible, right?&quot;（それってほぼ不可能ですよね？）
モデル
AWS Translate
Nova 2 Lite
Claude Haiku 4.5
Claude Sonnet 4.6
Llama 4 Maverick
翻訳結果
それはほぼ不可能だと思いますよね？
それはほぼ不可能ですよね？
ほぼ不可能に近いですよね？
ほぼ不可能に近いですよね？
限界ギリギリの不可能って感じですよね？
全モデル概ね正確（口語・平易な文は差が出にくい）
Llama 4 Maverick は口語的すぎる傾向
10


# Page. 11

![Page Image](https://bcdn.docswell.com/page/2JVV41L3JQ.jpg)

翻訳結果の違い
AWS Translate（機械翻訳）:
翻訳専用モデル → 入力は「その文」だけ
追加の文脈や指示を与えられない
&quot;colo space&quot; → 「カラースペース」（？？？）
Amazon Bedrock（LLM）:
プロンプトで「技術セッションの文脈」を伝えられる
直近 1 分の翻訳要約を毎回プロンプトに注入している
&quot;colo space&quot; → 「コロケーションスペース」と文脈から推論
口語表現も自然に意訳
11


# Page. 12

![Page Image](https://bcdn.docswell.com/page/5EGL12XYJL.jpg)

コスト比較（1時間あたり）
バックエンド
Llama 4 Maverick
Nova 2 Lite
Claude Haiku 4.5
AWS Translate
Claude Sonnet 4.6
1時間あたり
約 14 円
約 18 円
約 46 円
約 124 円
約 130 円
速度
◎ 最速
○
○
△
△
Sonnet 4.6 は精度は高いが速度・コストともに最悪 → リアルタイム用途では脱落
※ 文字起こし（MLX-Whisper）はローカル実行なので無料
12


# Page. 13

![Page Image](https://bcdn.docswell.com/page/4JQYDP867P.jpg)

まとめ：何を重視するかで選ぶ？
結論: リアルタイム翻訳は LLM（Bedrock）が機械翻訳より体験 ◎
重視するもの
バランス（速度/精度/コスト）
速度（リアルタイム性）
精度（専門用語・固有名詞）
安定性のみ（文脈不要）
おすすめ
Nova 2 Lite
Llama 4 Maverick
Claude Haiku 4.5
AWS Translate
理由
1 秒台 / 約 18 円/h / 文脈理解 OK
589〜1032 ms、最速・最安
速度・コストも実用範囲
ただし専門用語は外す
個人的には Nova 2 Lite がイチオシ！
AWS Translate にもカスタム用語集はあるが、リアルタイムで未知の用語に対応するのは難しそ
う。
13


# Page. 14

![Page Image](https://bcdn.docswell.com/page/K74WZY2ME1.jpg)

[参考]GitHub / Qiita
GitHub
Qiita
https://github.com/SatoshiMoriyama/livetranslate
https://qiita.com/s_moriyama/items/af1110bb8566136adb23
14


# Page. 15

![Page Image](https://bcdn.docswell.com/page/LJ1YR6MYEG.jpg)

終わりです。Thanks!!!
15


# Page. 16

![Page Image](https://bcdn.docswell.com/page/GJWG1W3172.jpg)

[参考] 速度計測条件
検証日: 2026-05-11
ソース音声: YouTube Shorts
https://www.youtube.com/shorts/BhgILBkdLfg
16


# Page. 17

![Page Image](https://bcdn.docswell.com/page/4EZLP5VX73.jpg)

[参考] コスト試算ロジック
前提条件:
30 秒で約 450 文字（英語）の発話 → 1 時間で約 54,000 文字
入力: 約 134K トークン/時間（システムプロンプト含む）
出力: 約 30K トークン/時間
為替レート: 1 USD = 150 JPY
17


# Page. 18

![Page Image](https://bcdn.docswell.com/page/Y76WM95P7V.jpg)

[参考] モデル単価（Bedrock On-Demand）
バックエンド
Llama 4 Maverick
Nova 2 Lite
Claude Haiku 4.5
Claude Sonnet 4.6
AWS Translate
入力 (per 1M tokens)
$0.50
$0.30
$1.00
$3.00
$15.00 / 1M文字
出力 (per 1M tokens)
$0.77
$2.50
$5.00
$15.00
—
※ ap-northeast-1（東京）リージョン、Standard tier、2026年5月時点
※ AWS Translate は原文の文字数のみに課金
※ Bedrock は入力+出力の両方にトークン課金
18