LLMとはなんですか？

766 Views

August 15, 25

#ai #llm #生成ai #LLM #生成AI #AI活用 #情報セキュリティ #RAG

スライド概要

チームメンバーの初学者用にAI、LLMとは何かを説明した資料です
スライド自体：生成AIを使用して作成しています

酒井要

@KanameShiga

スライド一覧

これから機会があれば登壇資料を掲載していきたいと思います

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

チームリーダーこそPower PlatformとM365を学ぼう

powerplatform 運用保守 m365

酒井要 4.4K

蓄積されたデータを使用してCoplotエージェントで活用する

powerplatform copilot エージェント運用保守

酒井要 4.2K

パワプラXM365Xナッジ気ままに勉強会_＃120_資料

powerplatform m365 ナッジ理論アダプティブカード

酒井要 4K

SharePointでフォルダ管理からの脱却とAI活用に向けたハイブリッド化

m365 copilot sharepoint フォルダ管理コンテンツ管理

酒井要 3.8K

SPARCフレームワーク AI時代を生き抜くスライド作成

ai スライドフレームワーク sparc

酒井要 1.1K

AIの学習(オプトイン、オプトアウト)について

生成ai オプトアウトオプトイン

酒井要 832

各ページのテキスト

LLMとはなんですか？

LLMとは Large Language Model (ラージ・ランゲージ・モデル) 大量のテキストデータを学習して、自然な言語を生成・理解する AIモデルという意味です。このあとのページで少し深堀りしていきたいと思います

この資料でわかること AIとLLMの関係（位置づけ） LLMの得意・不得意と仕組み（最小限）代表的サービスと活用領域（実務のイメージ）品質確保・セキュリティ・法務の要点 RAG/ツール連携の概念と限界の補い方

AIとLLMの関係 AI：人の知的作業を模倣する広い概念生成AI：新しいコンテンツを生成 ◦ テキスト／画像／音声／動画 LLM：生成AIの中の“テキスト担当” ◦ 要約・言い換え・ドラフト作成・Q＆A・コード補助

LLMはAIのどこにある？位置づけ図 AI（人工知能）従来型AI：画像認識・音声認識・最適化・ルール推論等生成AI（何かを新しく作る）画像生成（例： Midjourney, DALL·E）音声生成（例： ElevenLabs 等）テキスト生成＝LLM ChatGPT / Claude / Gemini Copilot（LLM＋企業データ＋ツール）・LLMは生成AIの“テキスト担当” (LLMは言語を中核とする生成AI。近年は画像・音声も扱うマルチモーダル型が普及（ただし言語モデルが必要です）。) ・AI＝LLMではないが、現場で触れやすい入口。

LLMの得意・不得意得意 ◦ 要約・言い換え・構成ドラフト ◦ フォーマット変換・整形 ◦ コード補助（読解・修正・説明）不得意 ◦ 最新事実の正確な把握（学習時点の知識）学習データが固定されており、学習時点以降の情報を持たないため ◦ 厳密計算・根拠の自動提示 ◦ 専門分野の正確な判断（裏取り必須） → 出力は必ず検証（出典URL・最終更新日・数値根拠を確認してから使用）

LLMの仕組み（ざっくり）入力確率的な出力（指示・制約・文脈）「次トークン予測」（文章・コード等）ポイント：・人間のように“理解・思考”しているわけではない (確率分布に基づき最も尤もらしい連続テキストを生成) ・大量のテキストの統計パターンで次のトークン(単語や記号)を予測・精度は“指示の明確さ”と“検証の徹底”で大きく変わる

代表的なサービスと特徴 ChatGPT ◦ 短文から長文まで応答が安定／拡張機能も豊富 Claude ◦ 長文読解や指示の素直さに定評 Gemini ◦ Googleサービス連携の強み Copilot ◦ 業務アプリと連携（M365等）／組織データの活用 ※2025年8月時点

活用領域：文章・コミュニケーション要約・言い換え・文面調整（トーン/長さ/読者指定）議事録・報告書の骨子作成メール・チャットの下書き支援

10.

活用領域：調査・要約・検索補助資料の下読み（概略把握）観点リスト化（比較軸・評価基準の抽出）一次情報確認のためのキーワード整理

11.

活用領域：コード・技術文書コードの要約・説明・リファクタ案テスト観点の列挙・境界値の洗い出し技術文書の構成化・テンプレート整形

12.

RAG (リトリーバル・オーグメンテッド・ジェネレーション) (Retrieval-Augmented Generation) ／検索連携で“限界”を補うユーザー質問検索／DB参照 LLMで生成 LLM単体の限界（学習時点の知識）を補うため、外部の最新情報や社内データを検索で取り込み、根拠を明示しながら回答する仕組み。検索結果は引用と出典併記、日付の整合を確認回答（根拠付き）

13.

品質確保のポイント出典の確認（URL・文献）／引用の明記日付の整合（“いつ時点か”を明確化）数値・計算の再確認（電卓・表計算で裏取り）専門事項は必ず一次情報に当たる

14.

セキュリティ・法務の観点入力データが学習に使われるかの設定確認（オプトアウト可否）、ログ保存期間と保管場所（リージョン）の把握・個人情報や社外秘の入力を避ける（専用環境を使用）・ログと保存範囲の把握（提供サービスの設定）・ライセンス・著作権・利用規約の遵守・プロンプトインジェクション対策（要約→抽出→検証の分離）許可コマンドのホワイトリスト化、 URLの自動実行禁止、システムプロンプトの固定

15.

よくある誤解Q&A Q: AI＝LLM？ ◦ A: いいえ。LLMは生成AIの“テキスト担当”。AI全体はもっと広い。 Q: 検索の代替になる？ ◦ A: 要約や下書きには有効だが、一次情報の確認は必須。 Q: 誤情報は出ない？ ◦ A: 出る可能性あり（ハルシネーション）。検証が前提。

16.

まとめ＆参照情報まとめ ◦ LLMは強力な補助ツール ◦ “位置づけ・仕組み・リスク”を理解して安全に活用

17.

用語ミニ辞典（1/2）用語定義 LLM（Large Language Model ）大量テキストから“次のトークン（単語や記号）”を予測して文章を生成・理解・生成するAI。トークンモデルが扱う最小単位（単語/記号/サブワード）。文字数≠トークン数に注意。コンテキストウィンドウ一度に読み書きできるトークンの上限。大きいほど長文に強いが計算負荷も増える。ハルシネーションそれらしいが誤った内容を自信満々に出す現象。出典・日付・数値で検証が必須。 RAG（Retrieval-Augmented Generation）外部検索で関連資料を取り出し、根拠を添えて生成する方式。学習時点の限界を補う。埋め込み（Embedding）文や単語をベクトルに変換した表現。意味の“近さ”を数値化して検索に使う。ベクトルDB 埋め込みベクトルを保存し、似ている文を高速に見つけるデータベース。マルチモーダルテキストに加え画像・音声・動画など複数モダリティを入出力で扱う仕組み。作成: 2025-08-15 | 用語ミニ辞典

18.

用語ミニ辞典（2/2）用語定義プロンプト／システムプロンプトユーザーの指示がプロンプト。役割やルールを定める上位指示がシステムプロンプト。プロンプトインジェクション入力に“隠し指示”を埋め込み、意図しない動作や情報漏えいを狙う攻撃。ガードレール（安全対策）不適切出力の抑制・機密の保護・ツール実行の許可制などの安全設計。ファインチューニング特定領域のデータでLLMの振る舞いを追加学習して最適化すること。 SLM（Small Language Model ）小型の言語モデル。軽量で安価・高速。限定用途では高精度も狙える。温度（Temperature）／Top-p 出力の多様性を調整するパラメータ。高いほど創造的、低いほど安定。ツール呼び出し（関数呼び出し） LLMが外部APIや関数を呼んで検索・計算・DB操作などを行う仕組み。出典（Citation）回答の根拠となるURL・文献情報。日付と併記して検証可能性を高める。作成: 2025-08-15 | 用語ミニ辞典