DeepSeekが示す生成AI開発の2つの大きな可能性とは

>100 Views

March 12, 26

#deepseek #生成AI #DeepSeek #LLM #強化学習 #蒸留

スライド概要

2025年2月26日の生成AI協会（GAIS）勉強会での講演内容です

森一弥

@kmori

スライド一覧

アステリア株式会社エバンジェリスト。生成AI協会（GAIS）エバンジェリスト。データ連携・ノーコード・生成AIなどの技術をテーマに、企業の業務変革や新技術の社会実装について発信しています。講演、執筆、コミュニティ活動を通じて、難しい技術を分かりやすく伝えることを得意としています。DIME連載「生成AIやってみた！」や「マンガでわかる生成AI」の原作も担当。AI・ノーコード・データ連携を軸に、企業の業務自動化や新しいIT活用の可能性を探っています。

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

（ダウンロード不可）

関連スライド

LangChain と VectorStore で作るかんたん自社チャット

chatgpt langchain singlestore hugging face

森一弥 17.6K

AI全盛時代に備えるナレッジデータ管理〜VectorStoreの選び方〜

chatgpt langchain singlestore rag vectorstore pinecone faiss zilliz chroma qdrant

森一弥 10.3K

ChatGPTでつくる！資産を生かした自社専用チャットで業務効率化

chatgpt langchain rag langflow vectorstore

森一弥 7.3K

先端技術でリードする！ChatGPTによる社内データの活用連携

chatgpt

森一弥 7.1K

ChatGPTでの自社データ活用

chatgpt

森一弥 2.2K

できる開発はもう使っている！？ AI開発現場に聞く ChatGPT の実例

chatgpt

森一弥 1.1K

各ページのテキスト

自己紹介アステリア株式会社エバンジェリスト森一弥生成AI協会（GAIS）：エバンジェリスト / データ連携活用WGリーダーブロックチェーン推進協会（BCCC）：技術応用部会長 ◼ 講演・TV・雑誌・Web掲載（AI関連のみ一部抜粋） Schoo にて生成AIの授業を担当出典：Schoo https://schoo.jp/teacher/3817 Interop24 Tokyo / Apps Japan 2024 出典：APPS JAPAN 2024 https://forest.f2ff.jp/introduction/91 78?project_id=20240601 AISmiley でのウェビナー出典：AISmiley https://aismiley.co.jp/webinar/2024 0628webinar/ ＠DIME にて生成AI コラム連載中出典：@DIME https://dime.jp/genre/1830048/ © 2025 Asteria Corporation

https://aituc.asteria.com/

DeepSeek ショック ◼ 1/20 リリースされた中国発のLLM 「DeepSeek R1」が話題 ◼ 無料（MITライセンス）、オープンソース、商用利用可能 ◼ OpenAI o1 に匹敵する性能 ◼ Web検索、「深く考える」、写真OCR、画像OCR、ドキュメント添付 ◼ トレーニングコストはo1の約3%？ ◼ NVIDIA株が一時約17%下落 ◼ 1/27 画像生成「Janus-Pro」 © 2025 Asteria Corporation

学習コストが安い！？ DeepSeek R1ができるまで DeepSeek V3 Base 強化学習 DeepSeek R1-Zero DeepSeek R1 教師ありファインチューニング＋強化学習 ◼ パラメータ数：6710億の大規模言語モデル ◼ 2024年12月リリース ◼ V3時点から学習コストが安いと話題になっていた ◼ 性能はGPT-4oと同等 ◼ MITライセンス、オープンソース ◼ DeepSeek V3 Baseに強化学習のみを実施 ◼ 性能向上の効果を確認 ◼ 出力言語が不安定などの問題あり ◼ 言語の一貫性、読みやすさなどの問題を解消 ◼ 性能はGPT o1レベルを達成 © 2025 Asteria Corporation

強化学習とは ◼ 結果から学び、徐々に賢い判断ができるようにする機械学習 ◼ 例えば数学問題を解き、間違っていたら他の解き方を試す ◼ 教師あり学習と違って、教師データの用意が必要ない機械学習いろいろ教師あり学習教師なし学習強化学習 Dog Cat ◼ 教師データの特徴を学習 ◼ 学習済みのデータのどれに近いのかで判断 ◼ データ群のパラメータで似たものをグルーピングしていく ◼ 数学など答えが明確な問題を方法は指示せずAIに考えさせる ◼ スコアの向上を目指す © 2025 Asteria Corporation

ローカル利用・モバイル利用を加速！？ DeepSeek R1からの圧縮・派生 DeepSeek R1 Qwen2.5-Math-1.5B DeepSeek-R1-Distill-Qwen-1.5B Qwen2.5-Math-7B DeepSeek-R1-Distill-Qwen-7B Qwen2.5-14B DeepSeek-R1-Distill-Qwen-14B Qwen2.5-32B 蒸留 DeepSeek-R1-Distill-Qwen-32B Llama-3.1-8B DeepSeek-R1-Distill-Llama-8B Llama-3.3-70B-Instruct DeepSeek-R1-Distill-Llama-70B © 2025 Asteria Corporation

10.

モデル圧縮技術「蒸留」 ◼ 大きなモデルの入力と出力（確率分布）を学習させる ◼ 小さなモデルの性能向上につながる小さなモデルを作る技術いろいろ圧縮（Pruning）量子化（Quantization）蒸留（Distillation） Dog:0.85 Cat:0.15 0.45678 → 0.5 0.21012 → 0.2 Dog:0.85 Cat:0.15 0.33310 → 0.3 ◼ 大きなモデルの低影響なパラメーターを間引く ◼ モデル内の重みや演算を簡略化 ◼ 大きなモデルの確率分布を小さなモデルで模倣するように学習 © 2025 Asteria Corporation

11.

DeepSeekが示す生成AI開発の2つの大きな可能性とは

森一弥

関連スライド

LangChain と VectorStore で作る かんたん自社チャット

AI全盛時代に備えるナレッジデータ管理〜VectorStoreの選び方〜

ChatGPTでつくる！資産を生かした自社専用チャットで業務効率化

先端技術でリードする！ChatGPTによる社内データの活用連携

ChatGPTでの自社データ活用

できる開発はもう使っている！？ AI開発現場に聞く ChatGPT の実例

各ページのテキスト

LangChain と VectorStore で作るかんたん自社チャット