870 Views
June 11, 25
スライド概要
DeepSeek関連の話題が続いている。この程DeepSeek R1の改良版が発表された(5月29日)。この製品は「国際数学オリンピック」米国予選2025の問題で正答率87.5%。同じ問題にOpenAIが4月に出した最新版「03」の正答率は88.9%。・・将にデッドヒートを繰り広げている。
このような性能の製品をオープンソースで提供し続けるDeepSeekは凄い。こうしたこともあって、トランプ政権も新たな中国向けAI規制を考えているらしい。その一方、OpenAIの元研究員ダニエル・コスタイロ氏による、最近動向を踏まえた“AIと人類の未来予測「AI2027」”も話題になっている。・・そこで時流に沿って、少し違った切り口から関連テーマを論じる資料を作成してみたので公開する。
定年まで35年間あるIT企業に勤めていました。その後、大学教員を5年。定年になって、非常勤講師を少々と、ある標準化機関の顧問。そこも定年になって数年前にB-frontier研究所を立ち上げました。この名前で、IT関係の英語論文(経営学的視点のもの)をダウンロードし、その紹介と自分で考えた内容を取り交ぜて情報公開しています。幾つかの学会で学会発表なども。昔、ITバブル崩壊の直前、ダイヤモンド社からIT革命本「デジタル融合市場」を出版したこともあります。こんな経験が今に続く情報発信の原点です。
DeepSeekの登場とその後への影響 B-frontier 研究所 高橋 浩
目次 1. 2. 3. 4. 5. 6. はじめに DeepSeek V3, R1の概要 DeepSeekの影響の枠組み 生成AI/LLMの比較検討 生成AIのリスクと民主化の影響 これからの取組みについて 2
1.はじめに 検討の背景 • 生成AIの短い歴史はモデル能力の急進によって彩られてきた。 • この傾向は、DeepSeek 社が最近発表した一連の製品とそれを 説明する論文をきっかけに再び起きている。 • 2024年12月下旬、同社はOpenAIのGPT-4oと直接競合する DeepSeek-V3を発表した。 • このモデルは2ヶ月で学習され、学習に要した費用は約560万 ドルと発表された。 • 続けて、2025年1月20日、同社は、推論機能を強化した最新の Open AI-o1と同等性能を達成したDeepSeek-R1を発表した。 • この矢継ぎ早の製品発表は、NVIDIAの大幅株価低下などを含 め、世界に大きなインパクトを与えた。 • そこで、DeepSeek V3/R1の理解と各方面への影響を考える。 3
DeepSeekの特性と影響の可能性 • 最初に、結論的に概要を述べると、DeepSeek登場は生成AI市 場とAI全般に次の5つのインパクトを与えたと考えられる。 • 小型化 • 低廉化 • 専門化 • 推論機能強化 • オープンソース化 • これは、単にAI機能の進歩に留まらず、今後の生成AI市場全体 に大きな影響を与える可能性がある。 4
DeepSeek社と梁文鋒氏のプロフィール • DeepSeek社は2023年5月中国杭州に梁文鋒氏が設立した企業 • 梁文鋒氏は1985年生まれで現在39歳 • 父親は小学校の算数の教師 • 高考ではトップの成績で浙江大学(中国でNo.3の大学)に合格 • 電子情報工学の学士号(2007年)と情報通信工学の修士号(2010年)を取得 • 2013年、AIを使用した金融取引を行うヘッジファンドHigh-Flyerの 共同創立者となり、1兆円超の資産運用へ(金融工学に長けた数学の 天才風) • そうした中、2019年、AIの技術開発を行う研究部門としてHighFlyer AIを設立 • 2023年5月企業として独立しDeepSeekと命名して現在に到る。 • DeepSeek R1発表一週間後の2025年1月27日、DeepSeek R1はiOS アプリストアの無料アプリ部門で1位にランクイン。米国株式市場 などに巨大な影響を与えた。 5
2.DeepSeek V3, R1の概要 DeepSeek-V3モデルの概要と特徴 • アーキテクチャ • MoEアーキテクチャ(Mixture-of-Experts:専門家の混合)を採用。コスト効率の 高いトレーニングを実現した。 • MoEアーキテクチャ:モデルを幾つかの特定した小規模モデル(数学用、コーディング用 など)に分割することで学習負荷を軽減できる。 • 効率的な推論を実現できるMLA(Multi-head Latent Attention(推論時のキーと値の キャッシュを圧縮する手法))を採用した。 • 高いコスト効率の実現 • DeepSeek-V3は2ケ月で学習され、わずか約560万ドルで開発された。 • 従来の大規模言語モデル開発投資額の1/50~1/100程度の投資額に相当する。 • この大幅なコスト削減は、MoEアーキテクチャの採用により、トークン毎に6,710億 パラメータのうち必要な370億パラメータのみを活性化させる仕組みと、「FP8混合 精度訓練フレームワーク」「DualPipeアルゴリズム」などによって実現させた。 • 前者:FP8(8ビット浮動小数点精度)サポートでトレーニング高速化とGPUメモリ使用量削減を実現 • 後者:効率的なパイプライン並列処理を実現 • これらの技術で、GPU使用時間を2.8百万時間に抑え、14.8兆もの学習データを効率 的に処理することに成功した。 6
DeepSeek-V3実用化に向けた性能と可能性 • コスト面での優位性に加え、DeepSeek-V3は複数の標準的ベンチマーク テストでも優れた性能を証明した(次頁図参照)。 • 特に中国語と数学分野において他のAIモデルを上回る成績を記録した。 • 数学の理解力を測定するMath-500テストでは90.2点を獲得。次点の Qwenの80点を大きく引き離した。 • 英語分野では、AnthropicのClaude 3.5 Sonnetとの比較で、専門的な知識 を問うMMULU-Pro、コードの品質評価を行うSWE Verifiedなどのテスト で互角の性能を示した。 • 技術面では、毎秒60トークンという高速な文章生成能力を持ち、約10万 字相当の長い文脈を一度に理解できる。 • 商用利用を含む幅広い用途で利用可能なコードをGitHub上で公開してい る。 7
DeepSeek V3のパフォーマンス(DeepSeek V3論文より) DeepSeek-V3 とその同等製品のベンチマークパフォーマンス 3個 3個 DeepSeek-V3 は数学とコー ディングおよび それに必要な推 論能力に強い 教育 高度な推論能力 数学 競技数学 コーディング AIによるソフトウェア自動開発 8
DeepSeek-V3まとめ • DeepSeek-V3は、MoEなど独自アーキテクチャによる開発・運用の両面 で、コスト効率の高さと、実用レベルの処理能力を兼ね備えたモデルとし て (DeepSeek R1登場前から)注目されていた。 • 特に中国語や数学分野での高い性能は、ビジネスでの実用性を示す重要な 指標となる。 • また、オープンソースで提供され商用利用も可能なこのモデルは、企業の AI活用における新たな選択肢としても期待が寄せられていた。 9
DeepSeek-R1モデルの概要と特徴 DeepSeek V3をベースにしながら推論機能の強化を計ったモデル。 主要な2つのバリエーションがある。それらの概要と提供形態を示す。 • DeepSeek-R1-Zero • (通常は使用される)教師あり微調整(SFT)を使用せず、最初から純粋な 強化学習(RL)で訓練することで、自然な推論能力の獲得を目指した。 • グループ相対ポリシー最適化*(GPRO)を強化学習フレームワークに採用し、 推論と数学的処理の改善をみた。 *従来の強化学習PPOの価値モデルを複数出力報酬の平均で代替する簡略手法で計算資源節 約と学習効率化を実現した。 • 但し、フォーマット不整合、多言語出力などの面で課題を抱えた。 10
DeepSeek-R1モデルの概要と特徴(続) • DeepSeek-R1 • R1-Zeroの課題であった問題を解消するため、コールドスタートデータ生成 により構造化されたフォーマットと簡潔な要約を生成し、明瞭化を高めた。 • その後、強化学習を適応させた結果、OpenAI-o1-1217レベルの性能を実現 できた(次頁図参照)。 • また、上記で作成したDeepSeek R1により他社オープンソース生成AIを蒸留 した結果、元の性能を大幅に上回る高性能の小型生成AIを生成できた。 • 公開リソース • 下記モデルを提供している。 • オープンソースモデル&技術報告書(MITライセンス) • 6つのモデル(1.5B, 7B, 8B, 14B, 32B, 70B) • 他社オープンソース生成AIとしては、QwenとLlamaをベースに実装 11
DeepSeek R1のパフォーマンス(DeepSeek R1論文より) DeepSeek-R1のベンチマークパフォーマンス 3個 3個 DeepSeek-R1 は OpenAI-o1-1217 と全機能でほぼ同 等の性能を達成し ながらオープン ソースで提供して いる。 競技数学 コーディング 高度な推論能力 数学 教育 AIによるソフトウェア自動開発 12
DeepSeek-R1まとめ • DeepSeek-R1は、強化学習を中心とした革新的なアプローチで開発され たモデルであり、純粋な強化学習による「DeepSeek-R1-Zero」と、 DeepSeek-R1-Zeroの問題を解決した「DeepSeek-R1」の2つのバリエー ションがある。 • 特に数学や科学的推論に優れた性能を示している。 • OpenAI-o1-1217と同等の性能を持ちながら、完全にオープンソース化さ れており、公開で商用利用を含む幅広い活用が可能になる。 • 1.5Bから70Bまでの様々なサイズのモデルが提供され、APIを通じた利用 も提供されている。 • 機能呼び出しや多言語対応など、いくつかの課題が残されているが、オー プンソースコミュニティによる継続的な改善が期待され、AIの民主化に向 けた重要な進展と考えられる。 13
3.DeepSeekの影響の枠組み DeepSeek-V3, R1の影響をまとめると • V3とR1は、わずか一ケ月の間隔でリリースされた。 • R1は、V3の後継製品と言うよりは、異なる目的を持った製品である。 • V3はGPT-4oを上回り、R1は(高度な推論機能を持つ)OpenAI-o1とほぼ互角 • DeepSeek社が設立当初から目標にしていたのは、小型化、低廉化であり、これ に最も貢献したのはMoEアーキテクチャと推定される(結果的に専門化も実現: 数学とコーディングに特化) 。 • MoEの考え方は1991年頃に既に登場していたが、近年のGoogleによる重要な研 究の後、製品化で成功を修めたのはDeepSeekが際立つと考えられる。 • RIは推論機能の強化を目指して初めから強化学習を行い、自律的な推論機能強化 に成功したが (R1-ZERO)課題もあったので、それを改善したのがR1。 • V3までで達成された小型化、低廉化、専門化に加え、推論機能強化の製品(R1) も加わり、それらが全てオープンソースとして提供されている。 • V3, R1が取り入れた手法は他社でも真似できる(参考になる)内容が多い。 • 結果的に「生成AIの民主化」の扉は幅広い階層に開かれたと言える。 14
影響の枠組み DeepSeek V3 • MoEアーキテクチャー 小型化、低廉化、専門化 • FP8混合精度学習 • トレーニングの高速化、GPUメモリ使用量の削減 • DualPipeアルゴリズム • オープンソース提供 DeepSeek R1 • 初期段階から教師なし強化学習 推論機能強化 • 小型化 • 低廉化 • 専門化 • 推論機能強化 + • コールドスタートCoTデータセットと多段階訓練で洗練 • オープンソース化 • モデル蒸留の革新的使用(LLM生成データを他 LLM高信頼化に活用) • オープンソース提供 生成AIの民主化 15
「生成AIの民主化」で何が起きるか? • 小規模デバイスで生成AI機能の動作が可能になる。 • 生成AI機能搭載を前提とした多様なデバイスおよびそのコアとなる多様な AIチップが開発される。 • 実行できる生成AI機能のレベルが階層化する。 • ハイレスポンスの生成AIチャットを主体とした小デバイス向け機能から、推論機能 を活用したエージェントAI向け機能、および大規模な推論機能まで • 高度の推論機能提供を実現するにはクライドとエッジ(小規模デバイスあ るいはロボットなど)のネットワーク化が一般化する。 • これに伴い、エッジデバイスからも、ハイレスポンス生成AI利用と共に高 度の推論を必要とする機能まで多様で幅のある機能が利用可能になる。 • このような全体構成が実現されて行くと現在とは全く異なる新しい世界が 拓ける。 • しかし、これらを構成する各要素の担い手はあまりにも多様化するため、 危険あるいは負担となる新たな負の連鎖が拡散するリスクも顕在化する可 能性がある。 16
後半の検討の枠組み 前述のような背景から、後半では以下の3点に焦点を当てる。 • そもそも多様化している生成AIはどのような特徴を持つか? • 各モデルのベンチマーク以外の要因の比較:DeepSeek, ChatGPT, Claude, Qwen • 各モデルの主として技術的要因の比較:DeepSeek R1, ChatGPT 4.0, Claude 3.5, LLaMA 3.1, Qwen 2.5, Gemini 2.0 • DeepSeek登場は生成AIにどのような影響を与えるか? • 「生成AIの民主化」による新たな可能性と負の影響など • 複雑化する規制環境において生成AIを如何にガバナンスする か? • 複雑かつ急速に変化する規制環境において、AIガバナンス実施のための国際的規制 の枠組みの検討状況など 17
4.生成AI/LLMの比較検討 ベンチマークではクローズアップされ難い要因の比較 比較検討1 ベンチマークだけでは測れない多様な要因に光を当てるための尺度で比較する。 • ゼロショット学習と少数ショット学習: • ゼロショット学習は、明示的に訓練されていないタスクを実行する能力。少数ショット学習は、非常に少ない例を用いて 訓練されたタスクを実行する能力。 • バイアスと公平性の評価: • 性別、人種、民族、などのデリケートな問題に関連するあらゆる種類のバイアスから解放されたタスクを実行する能力。 • 解釈可能性と説明可能性: • 解釈可能性は、人間がモデルの応答をどれだけ容易に理解できるかの尺度。説明可能性は、モデルが特定の決定に至った 理由。 • 敵対的入力に対する堅牢性: • 悪意のある入力によってモデルを混乱させたり操作したりする敵対的攻撃に対する脆弱性の尺度。 • ドメイン固有のパフォーマンス: • 法律、医学など、特定のドメインにおけるタスクを実行するモデルの能力。 • 多言語対応能力: • 複数の言語でテキストを処理および生成するモデルの能力。 • モデルの効率性とリソース利用率: • モデルがメモリや処理能力などの計算リソースを効率的に使用できる能力。 • 時間的感度と知識保持率: • モデルが新しいデータでトレーニングした後、履歴情報をどの程度保持できるかの能力。 • 倫理的意思決定とコンプライアンス: • モデルが意思決定を行う際に倫理ガイドラインや規制にどの程度従っているかを評価する尺度。 18
各モデルの特徴と限界 比較尺度 DeepSeek ChatGPT Claude Qwen ゼロショット学習と少 数ショット学習 ゼロショット機能は強力だが、 少数ショットへの適応性は限定 的。△ GPT-4アーキテクチャを活用し た優れたゼロショット学習と少 数ショット学習。〇 ゼロショットは良好だが、数 ショットではパフォーマンスが ChatGPTに遅れをとっている。 △ 中程度のゼロショット。少数 ショットのタスクでは苦労。 ×/△ バイアスと公平性の評 価 バイアスを緩和する技術は限ら れており、公平性は現在も改善 中 △ 高度なバイアス検出と軽減機能 を備えているが、完全にバイア スが排除されているわけではな い。〇/△ 倫理的な整合性に重点を置いて いるが、バイアスの軽減は依然 として進化中。〇/△ 基本的なバイアス評価。高度な 公平性ツールは欠落。×/△ 解釈可能性と説明可能 性 解釈可能性の限界とブラック ボックス性 ×/△ 中程度の解釈可能性。一部の説 明可能性ツールを使用。△ 透明性への重点化により、解釈 可能性が向上。〇 解釈可能性が低い。説明のため のツールがほとんどない。× 敵対的入力に対する堅 牢性 中程度の堅牢性。高度な敵対的 攻撃に対して脆弱。 △ 広範囲にわたる敵対的学習と微 調整による高い堅牢性。〇 中程度の堅牢性があるが、 ChatGPTほど強力ではない。 △ 堅牢性が低いため、敵対的な入 力に苦労。× ドメイン固有のパ フォーマンス 専門的トレーニングによりニッ チな分野で優れた能力を発揮 ◎ 汎用的なパフォーマンス。複数 のドメインに適応。〇/△ 倫理およびコンプライアンス関 連の分野に優れている。〇 ドメイン固有の機能が制限され る。×/△ 多言語対応能力 多言語サポートは限定的。主要 言語に特化。△ 強力な多言語対応力があり、 50以上の言語をサポート。◎ 多言語サポートは中程度だが、 ChatGPTほど広範囲ではない。 △ 基本的な多言語サポート。リ ソースの少ない言語では対応が 困難。×/△ モデルの効率性とリ ソース利用率 非常に効率的で、リソースの少 ない環境に最適化。◎ リソースを大量に消費し、かな りの計算能力が必要。× 効率的だが、DeepSeek に比べ ると若干最適化が劣る。〇/△ 中程度の効率。パフォーマンス とリソース使用のバランスは良 好。〇/△ 時間的感度と知識保持 率 知識の保持力が限定的。古く なった情報に苦労。×/△ 時間的な感度が高く、最新の データで定期的に更新。〇 知識の保持は中程度。更新は 頻繁ではない。△ 時間的な感度が低い。頻繁な更 新がない。× 倫理的意思決定とコン プライアンス 基本的な倫理的整合性は有り。 厳格な倫理ガイドラインがある コンプライアンスは現在進行中。 が、時折コンプライアンス上の △ 問題が発生。〇/△ コンプライアンスを念頭に設計 されており、優れた倫理的意思 決定。〇 倫理的な意思決定への焦点が限 定的。×/△ 19
• DeepSeek: 各モデルの評価 • ゼロショットシナリオは良好だが、訓練データセットが小さいので、少数ショットシ ナリオでは限界がある。 • 単純な攻撃には対処できるが、複雑な攻撃には対応できない。 • 特定のドメインタスクに適している(数学分野で最高のパフォーマンスなど)。 • ChatGPT: • 微調整機能の助けなども借りて、少数ショット向け学習、ゼロショット向け学習のどちらも 優れている。 • 高度の検出技術によりバイアスにも積極的に対処し、敵対的攻撃にも非常に堅牢である。 • 但し、大規模なアーキテクチャのため高い計算能力が必要になり、効率は低くなる。 • Claude: • ゼロショット学習や少数ショット学習は、SWEベンチマークが高いなど従来より進歩して いる。 • コーディング作業に役立つ詳細な説明やサンプル出力も提供する。 • モデルの効率とリソースの利用については、速度と費用対効果に最適化されて中立的であ る。 • Qwen: • 新しいモデルでは長文テキストの生成、構造化データの理解などで大幅な改善が見られる。 • 一部の分野では優れた性能を発揮するが、非常に技術的または特殊な分野では対応が遅れ ている。 • 解釈可能性、説明可能性に関しては、出力に対して簡潔な説明を提供はするが、解釈可能 性は不十分な状況である。 20
比較検討1からの示唆 • 各モデルは結構重点の置き方に相違がある。 • 汎用志向と専用志向の2方向が顕著: • DeepSeekは専用志向, ChatGPTは汎用志向 • 結果、専用志向は効率的・リソース小、汎用志向は大計算能力・リソース大に分か れる。 • 汎用志向はバイアスや公平性対応、敵対的入力に対する堅牢性 などを強化せざるを得ない。 • これにはシステムの重さだけでなく、学習データサイズの拡大、ゼロショット学習 や少数ショット学習への充分な配慮などが必要になる。 • DeepSeekなどの専用志向は倫理規定や敵対的入力への堅牢性などが勿論必要だが、 分野を絞れば効率的に対応できる可能性もある。 • 従って、比較評価尺度を網羅的にカバーするのが必ずしも良い とは限らない。 • 今までは網羅的に条件をカバーすることにばかり目が行っていたように思う。 • 今後は使用分野、ビジネス的狙いに合わせて多様化が急速に進むと考える。 21
技術や適用分野などの相違をクローズアップする比較 比較検討2 主として採用している技術と適用分野との相関に光を当てた切り口で比較する。 • DeepSeekは、従来の生成AIが下記のよ うな課題や制限に直面している中で、こ れらを解決するため、小型化、低廉化、 専門分野に向けた精緻な対応、推論機能 の強化を目指していたと考えられる。 比較対象のモデル ① 教師あり微調整(SFT)に依存してい る。結果、計算コストが高くなる。 ② 汎用的活用を目指す結果、専門的タス クに苦戦するとともに幻覚も起きる。 • この状態に対して、各モデルがどのような状況にあるかをクローズ アップするため、次のような比較項目を採用する。 • 一般的な技術仕様の比較に加え、対象分野、システムの強み/弱み、など 22
DeepSeekと他モデルの相違をクローズアップする比較 特徴 DeepSeekR1*1 ChatGPT 4.0 Claude 3.5 LLaMA 3.1 Qwen 2.5 Gemini 2.0 パラメータ数 671B*2 1.8T(最大) 250B+ 7B, 13B, 70B, 405B 最大72B 非公開 コンテキスト長 128Kトークン 128K 200K 128K 128K 1M(長い) マルチモーダル テキスト テキスト, 画像, 音声 テキスト, 画像 テキスト, コード テキスト, 画像 テキスト, 画像, 音声, ビデオ 推論 ハイブリッド記号学 習 思考連鎖(CoT)プロン プト、RLHF、検索拡 張生成(RAG) 法制的AI、総合的推 論のトレース、少数 ショット一般化 疎な注意、知識の蒸留 マルチホップ推論、 企業レベルの微調整、 クロスリンガル転送 マルチモーダル推論 トレーニングデー タ 共通クロール、多言 語データ 公開テキスト 法制上のAI原則 公開データ、コード、 多言語テキスト 中国語データ、多言 語、ドメイン固有 コモンクロール 100万トークン入力 価格(米ドル) 0.14(安い) 2.50 3.00 3.50 (4050億入力トー クン) 0.40 (720億入力トー クン) 無料 100万トークン出力 価格(米ドル) 2.19 10.00 15.00 3.50 0.75 無料 APIの可用性 はい(オープンアク セス) はい(有料API) はい(エンタープラ イズAPI) 公式APIなし(サード パーティ実装) 公式APIなし(オープ ンソースでセルフ) はい(Google Cloud API) 主な強み 透明な推論、コスト 効率、オープンソー ス 多才、創造的、強力 な推論力 法制的AI、長いコン テキスト処理 オープンソース、カス タマイズ力、コーディ ングに最適化 強力な中国語NLP、 バイリンガルタスク Google エコシステム、マル チモーダル、リアルタイム AI サービス 制限事項 テキストのみ, フォー マット問題、データ プライバシーの懸念 クローズドソース、 高価なAPI、時折幻覚 が発生 過度に慎重な対応、 限られたマルチモー ダル機能 高いハードウェア要件、 地域データの偏り、 ドメイン固有のチュー 企業レベルの ニングの少なさ インフラが必要 不透明な意思決定、限られ た記号的推論 対象ユーザー 研究者、エンタープ ライズAI 一般ユーザー、開発 者 法務/エンタープラ イズチーム 開発者・研究者 中国語圏の市場 Googleエコシステムユー ザー 主な使用例 研究、学術、数学、 コーディング、エン タープライズAI 汎用AI、コンテンツ 生成、チャットボッ ト、コーディング 法務、コンプライア ンス、エンタープラ イズAI NLP研究、 開発者ツール、 費用対効果の高いAI 中国語言語処理、ア リババエコシステム クロスメディアAI、リアル タイムAIサービス、エン タープライズAPP *1:R1は数学、コーディング、論理的問題への対応のために設計されている。 *2:計算効率を最適化するため、クエリ毎に671B中わずか37Bのパラメータのみをアクティブ化している。 23
• DeepSeek R1: 各モデルのプロフィール • エッジコンピューティングプラットフォームや低メモリシステムなど、リソースが限られ た環境での導入に最適化されており、オープンソースなので、多様なケースで利用できる。 • ChatGPT 4.0: • マルチモーダルで画像キャプション作成や問題解決に優れているが、専門分野においては、 事実誤認や幻覚を生成する可能性がある。 • Claude 3.5: • 大規模な入力をより適切に処理し、RLHFと法制的AIによって望ましくない応答やバイアス を低減し人間の意図との整合性を高めているが、複雑な入力や曖昧な入力にやや弱い。 • LLaMA 3.1: • コーディング、論理的問題解決、低リソース言語タスクに優れ、オープンソースなので、 研究および商用に利用できるが、入力はテキストのみに制限されている。 • Qwen 2.5: • 効率性とオープンソースへのアクセス性を重視しており、また、安定したロングコンテキ スト処理を実現している。 • Gemini 2.0: • 外部関数(Google検索とGoogleマップ)を呼び出したり、ストリーミングデータを統合して 拡張されたリアルタイムアプリケーションを実現できる。 24
比較検討2からの示唆 • DeepSeekは、汎用モデルとは一線を画し、計算効率の高い アーキテクチャ、数学やコード生成などに特化、純粋な強化学 習(SFTなし)で自律的に推論機能強化したものに最小限微調 整した製品(R1)を実現、などで、 • 「ハードウェア環境に依存しない実装をオープンソース化する」目標 を一定程度達成したと考えられる。 • 一方、これまでの汎用利用/クローズドシステム/大規模リソー ス使用を前提とするChatGPTに代表される生成AIは、一貫し た目標が異なるDeepSeekの登場とその目標のほぼほぼの成功 に衝撃を受けたと考えられる。 • これは、結果的に従来方向の見直し、DeepSeek的方向性への一部追 随あるいは既存路線との共存など、新たな取組みへの良いキッカケに なったと思われる。 25
専用モデル vs 汎用モデルの比較 DeepSeek-R1の取組みから示唆される“専用モデル”と“汎用モデル”の特徴比較 専用モデル(DeepSeek的) 汎用モデル(ChatGPT的) • ドメイン固有の最適化、透明性、そしてコ スト効率を重視 • 幅広い適応性にフォーカス • RL(純粋に強化学習)のみから推論能力 を獲得し精密な推論や意思決定に特化 • 結果として計算コストが増大 • SFT(教師あり微調整)に依存 • 結果的に計算コスト削減が可能 • 高コストなので幅広い適応性を持つもの の応用範囲を制約する側面も • 低コストなので応用範囲が拡大 • システムもリソース大の環境が必要 • リソース少なのでエッジ、低メモリシステ ムなどでも動作 • 分野を絞った場合は特定専門分野でも 生成AIの有効性を発揮 • ドメイン専門知識向上を目指したAGI実 現が狙いならこの路線か? • 一般的コンテキストでは効果的でも機能 的には専門タスクで苦戦しがちな面も (ハルシネーションの原因にも) • 汎用的人工知能(AGI)へのオーソドック スな路線か?
5.生成AIのリスクと民主化の影響 生成AIの民主化とAI由来のリスクとの関係 • 「生成AIの民主化」は担い手の激増、小規模デバイスの登場などを通じ、 よりシステム化された生成AI活用の機会の登場によって、従来想定してい たAGI/ASI到来を前倒しする可能性があるかもしれない。 • その一方、従来の想定とは異なる多様なリスクの拡散を助長する可能性が あるかもしれない。 • このような考慮から、次の2つのリスクを考える。 • 人間の能力を超えたAI(AGI/ASIと称せられてき たもの)の登場に由来するリスク • DeepSeek起因などで拡大が想定される「生成 AIの民主化」などで拡散が懸念されるリスク 27
リスク概念の整理 • リスクという言葉は次のような意味で用いられてきた。 • リスクを発生する可能性のある望ましくない事象 • あるいは、リスクを発生する可能性のある望ましくない事象の原因 • あるいは、リスクを発生する可能性のある望ましくない事象の確率 • あるいは、リスクを発生する可能性のある望ましくない事象の期待値 (確率×結果) • 上述のような用法に中立的な幅広い視点からAI由来のリスクを分析する場 合、しばしば次のようなストーリーが述べられてきた。 • 人間の知能を超える高度なAI(AGI/ASIなどと称されてきた)の登場によって引き起こ される決定的な大規模事象(決定的リスク) • しかし、これとは異なるAI由来のリスクも想定される。 • 一つ一つは小さな事象であっても、それらの積み重ねによって最終的には巨大な事 象が発生するリスク(累積的リスク)。 28
累積的リスクとは • AIによって引き起こされる、より小規模で深刻度の低い混乱が 時間の経過とともに集合的に、そして徐々にシステムの回復力 を弱め、最終的には回復不能な崩壊を引き起こす可能性のある リスク • このようなジャンルに入ると思われる小さなリスクの例: • 操作と欺瞞のリスク……感情的搾取などの標的型または望ましくない説得手法を用いて人 間の認識や行動を操作することで危害を加えるAIシステム • 誤情報と偽情報のリスク……AIシステムが虚偽のコンテンツを大規模に生成・増幅し、プ ロパガンダの拡散を可能にし、公衆の信頼と言説を損なうことから生じるリスク • 悪意のある使用のリスク……AIシステムによるサイバー攻撃、AI搭載ドローンやその他の 物理システムによる物理的攻撃、ソーシャルエンジニアリング攻撃の自動化などによるリスク • 差別やヘイトスピーチのリスク……偏向したAIシステムがシステム的な不平等を永続させ たり、標的を絞った有害なコンテンツを生み出したりすることで生じるリスク • 監視、権利侵害、信頼の低下のリスク……AIを活用した大規模監視システムやプライ バシーの喪失、統治機関への信頼の喪失につながる継続的モニタリングによるリスク • 環境リスクと社会経済的リスク……大規模なAI訓練と導入に伴う膨大なエネルギー消費 と二酸化炭素排出量による生態系への被害、労働市場の変革による広範な経済的混乱、 自動化による特定職種の陳腐化に伴う労働者の離職、などに伴うリスク 29
2つのリスクの特徴 • 2つのリスクは次のように 整理される。 重度の混乱 1. AGI/ASIの到来などによるカ タストロフィ 2. 重大性は低いものの、累積的 に重要な混乱が連続的に発生 し、グローバルシステムのリ ジリエンスを侵食し、重要な 社会経済的均衡を破壊する ケース • 2つのリスクの違いを模式的に 右図に示す。 AIによる決定的リスクシナリオと累積的リスクシナリオ 時間 30
DeepSeek起因のメリットとリスク • DeepSeek起因の問題は、先行した汎用生成AIと遜色ない機能を小型化、 廉価で実現しただけでなく、規制や隔離が困難なオープンソースとして提 供されている点にある。 • これは「生成AIの民主化」の路を拓き、驚異的な可能性を秘めてはいるが、 前例のないリスクを生じさせる懸念もある。 • 即ち、最小限のリソースで誰でもアクセスできるオープンソース生成AIモ デルは悪意のある行為者による悪用に対して障壁を低くしてしまう。 • 自動化されたサイバー攻撃から偽情報キャンペーンによる重要インフラの 不安定化まで、現在でも既に発生している障害の規模や可能性が拡大され かねづ、累積的リスクを加速させる元凶になる懸念がある。 • そこで、オープンソース生成AIのもたらす計り知れない恩恵を探索すると 共に、そのリスクを軽減するための倫理的、規制的枠組み構築は喫緊の課 題になる。 • このような課題認識の概念図を次頁に示す。 31
DeepSeekおよび「生成AIの民主化」登場 に伴うメリットとデメリット DeepSeekのメリット: - 透明性 - 手頃な価格 民主化のメリット • エッジでの生成 AI活用 民主化のデメリット • リスク拡大 • フィジカルAI • 安全性の懸念 • エージェントAI DeepSeekのリスク: - 安全保障上の課題 - 大量失業 32
図の解説 • DeepSeekのメリット: • オープンソースを通じたAIの共同作業は驚異的創造性を育み、開発サイクルを 加速させ、従来の障壁を打ち破る可能性がある。 • 特にDeepSeekは低い計算要件で動作するように特別に設計されているので、 過小評価されていた地域あるいは低開発国の学生、研究者、開発者に貢献し、 成長することを可能にする。 • また、透明性はオープンソース開発の基盤であり、誰もがコードをレビューし、 より高品質で安全なソフトウェアを実現できる可能性がある。 • DeepSeekのデメリット(リスク): • 軽量・廉価なオープンソース生成AIは創意工夫の進歩の兆しであると同時に意 図せぬ大惨事の兆しともなりうる危ういバランスの出現と見做せる側面がある。 • 民主化された奔放なイノベーションという理想は厳格な安全策なしに解き放た れると思いもかけない崩壊をもたらす可能性がある。 • 懸念の例としては、個人への害悪、金銭的・経済的損害、情報操作、社会的・ インフラ的損害などである。 33
6.これからの取組みについて 複雑かつ急速に変化する規制環境におけるAIガバナンス • AIの急速な進歩と普及は社会にとって重大な規制上の課題を突 きつける。 • AIは利益をもたらす可能性を秘めているが、種々のリスクがあ るため、測定可能な損害が発生する前に何らかの対応を開始す るのが望ましい。 • しかし、規制に必要な技術的能力は不足しており、これが規制 の停滞に繋がる懸念がある。 • また、この問題は国境を越えた性質を持つため、国際的に協調 した対応が不可欠だが、この点も対応を困難にする。 • 以下に、AIガバナンスに適応される法の整備、および、これら の執行を監視する規制当局の役割などについて構築されつつあ る枠組みの概要を(次々頁で)紹介する。 34
複雑かつ急速に変化する規制環境におけるAIガバナンス(続) • AIは国際社会にとって特有の課題を提示する。 • 金融、医療、その他の分野における雇用喪失と社会不安 • AIの武器としての利用 • 説明責任と透明性の欠如 • アルゴリズムによるバイアス • データプライバシーの侵害 • 仮想世界の脅威とサイバー紛争、など • また、テクノロジーへの依存、人と人とのつながりの喪失、公平性、解 釈可能性、安全性、堅牢性とセキュリティ、合理性などの欠如、誤情報 の拡散、コンプライアンスの欠如、経済格差、など • AIは、ウィルスを通じてハードウェアに世界的影響を与えたり、軍事自 律システムを通じて人々に損害を与えたり、政府によって国民を支配す る手段になったり、戦争を誘発する軍拡競争に繋がる可能性もある。 • 発電網、食料供給網、輸送システムなどの重要インフラをハッキングし、 技術の進歩や生活基盤を破壊する可能性もある。 35
グローバルガバナンスの文脈におけるAI 現在議論されている規制の枠組み(例)を以下に示す。 •立法と実施 • 国際協力 • 調整と標準設定 • グローバルな対話の促進 国/州 国/州 国際機関 AI規制当局 • 法律を制定する • 執行を監視する •援護活動と倫理的監視 •公衆の関与 • イノベーションとコンプ ライアンス • 倫理的なAI開発 市民社会 法人および事業体 36
• 国/州: 図の解説 • 国/州は、グローバルな舞台において最も重要なルール策定者となる。 • 急速な変化が、規制する能力を複雑化させている場合、他国から責任を問われる立場にあ り、イノベーションとリスクのバランスを取ることが重要になる。 • 国際機関: • 拘束力のあるルール、慣習的なルール、ソフトルールなど、様々な形態の国際法を制定する。 • 経済協力開発機構(OECD)、国際標準化機構(ISO)、電気電子工学研究所(IEIE)、実存的リス ク研究センター、人類の未来研究所、生命の未来研究所、未来社会研究所、リーバーヒュー ム未来知能センター、AI Now研究所、機械知能研究所、AIパートナーシップなどがある。 • 法人および事業体: • 多国籍企業は、国境を超える規模で事業を展開しており、国際法の制定、実施、執行にま すます大きな影響を与えている。 • その一方、多国籍企業は規制枠組みの対象にもなっており、責任と賠償、人権侵害を含む 損害賠償といった問題が提起されている。 • 市民社会: • 自治権を持ち、自発的で非営利の社会組織は、国家レベルおよび国際レベルにおける 政策の欠陥や失敗を指摘してきた。 • 活動家や社会運動は、立法に影響を与える国際社会の一部として認められている。 AI規制当局は上記4要素と連携を取り、法の採択、国内における執行検討と実施および監視を行う。 37
今後の取組みに向けた規制関係の状況 • AIガバナンスの課題は非常に複雑であり、短期的にも長期的に もこのような曖昧な状況が続く可能性が高い。 • 背景の一つに、AI技術の重要性と、そのために国家レベルで開 発に投入してきた巨額の投資が、各国間、ステークホルダー間 の調整を難しくさせる面がある。 • 従って、AI規制が本質的にはグローバルガバナンスでないと意 味がないにも関わらず、国内におけるAI規制から推進せざるを 得ない状況にある。 • その上で、各国間をまたぐ拘束力のある法の制定や規制機関の 設立は、その先を待たなければならない。 • これで、現実の問題への対応として間に合うのかどうかは分か らない。 38
これからの取組みに向けたその他の状況 • 今後の取り組み例として、DeepSeek R1の基礎機能を様々な分野の現実 世界に適用することが考えられる。 • 現状でも専用モデルと汎用モデルには一定の補完関係がある。 • テキストベースの多様なタスクへの対応に優れマルチモダルも可能な汎用モデル • 数学的精度や構造化された問題解決が得意な専用モデル、など • しかし、例えば、医療分野で構造化された症状分析の改善や診断精度の向 上、あるいは教育分野で適応型学習システムの複雑な概念を明確に推論し 学習効果を高めるようなことが進むと、状況は一変する。 • 結局、生成AI分野の進歩は速いので、大きくはAGIに向けた次世代モデル の進捗に依存する部分が大きい。 • その際は、単に生成AI環境だけでなく、ハードウェア、ソフトウェアの統 合と効率化、IoTやエッジデバイス上でAIをより効率的に実行し、消費電 力を削減できるかどうか等、多様な側面が問われる。 • 特定分野や自律システムでは更により透明な要件の確保が求められる。 • 監査可能な推論経路明示化や組込みバイアスの緩和戦略も必要になる。 • これらの点でオープンソース・エコシステムへの期待は大きいものの、リ スクへの備えもますます重要性を増すことになると思われる。 39
最終まとめ 1. DeepSeekは単にリソース少・廉価なオープンソース生成AIの登場とい うことに留まらず、新たなトレンドを作り出した。 2. 誰もが生成AIに取組める「生成AIの民主化」は低開発国などにも生成AI 活用の意欲を与え、一方、先進国においてもエッジでも生成AI活用の機 会を拡大できる手段を示した。 3. “蒸留”という耳なれない言葉も飛び交った。他LLMの生成データをト レーニングデータに活用することで、品質を強化することが出来、(権 利問題がありそうだが)信頼性を要求される幅広い用途に路を拓くこと も可能になった。 4. このようなメリットがあることから、新たな競争のパラダイムは、この 方向にシフトしそうで、既存大手テック企業からこの方向性を意識した miniモデルの提供(例:Open AIの03-miniモデル)も登場している。 40
最終まとめ(続) i. しかし、看過できない重要な視点としては、軽量・廉価なオープ ンソース生成AIの担い手が世界中に拡散し、そのことで発生する リスクが途方もない可能性があることである(AIがいずれAGI/ASI レベルに達するだろうことも背景にある)。 ii. これを防ぐ施策は早期着手が望まれるが、どのような施策を考え ても、かなり困難な路になるだろうことが予想される。 iii. 低開発国(あるいはサイバー犯罪者、ならず者国家、過激派グルー プ)を含む多数の担い手が偽情報生成が容易な生成AIを広範に利用 した場合の世界を仕切る適当な監視の方法は有るのだろうか? iv. このような懸念への対応も含めて、これからの時代への関係者の 真摯な対応が強く望まれるところである。 41
編集後記 • DeepSeek モデルの成功は、従来の米国中心のAI 拠点以外でも、才能と研究 への創意工夫、戦略的投資があればAI台頭が可能であることを実証した。 • さらに、中国の AI 研究の能力が高まっていることが浮き彫りにされ、イノ ベーションを促進する支援的な政府政策の重要性も注目されることになった。 Fnu Neha • 1 つの国や少数の企業に支配されない AI に関する世界的議論に貢献したとの ケント州立大学 (米国オハイオ州) 評価も低開発国を中心にあるようだ。 • DeepSeek が AI の限界を押し広げ続けるにつれて、新しいコラボレーション、 ブレークスルー、独占構造の解体の可能性も近づいているのかもしれない。 • これは、競争が世界中で進歩と革新を推進し、公平でダイナミックな AI 開発 Atoosa の有望な未来を示している、と受け止める向きもあるようだ。 Kasirzadeh カーネギーメロ • 反面、後半では幾つかの異なる切り口、特にリスクに対する対応について取 ン大学(米国) り上げてみた。 • このような研究分野は女性学者の活躍が目覚ましかったので、代表的論者の 顔写真を掲載しておく。 • シンギュラリティの到来やAGI登場などに関心を寄せることは重要ではあるが、 Esmat Zaidan それと共に生成AIの影響力は極めて根本的であり、DeepSeek登場で扉が開け ハマド・ビン・ ハリーファ大学 られたAI由来の課題にも目を向ける必要がある。 (カタール) • 本稿は、全体としてはDeepSeek由来のトレンドをポジティブに捉える立場 でまとめてみた。これからの変化に注目して行きたい。 42
文献