506 Views
August 15, 25
スライド概要
チームメンバーの初学者用にAI、LLMとは何かを説明した資料です
スライド自体:生成AIを使用して作成しています
これから機会があれば登壇資料を掲載していきたいと思います
LLMとはなんですか?
LLMとは Large Language Model (ラージ・ランゲージ・モデル) 大量のテキストデータを学習して、 自然な言語を生成・理解する AIモデルという意味です。 このあとのページで少し深堀りしていきたいと思います
この資料でわかること AIとLLMの関係(位置づけ) LLMの得意・不得意と仕組み(最小限) 代表的サービスと活用領域(実務のイメージ) 品質確保・セキュリティ・法務の要点 RAG/ツール連携の概念と限界の補い方
AIとLLMの関係 AI:人の知的作業を模倣する広い概念 生成AI:新しいコンテンツを生成 ◦ テキスト/画像/音声/動画 LLM:生成AIの中の“テキスト担当” ◦ 要約・言い換え・ドラフト作成・Q&A・コード補助
LLMはAIのどこにある? 位置づけ図 AI(人工知能) 従来型AI:画像認 識・音声認識・最適 化・ルール推論 等 生成AI(何かを新しく作る) 画像生成(例: Midjourney, DALL·E) 音声生成(例: ElevenLabs 等) テキスト生成=LLM ChatGPT / Claude / Gemini Copilot(LLM+企業 データ+ツール) ・LLMは生成AIの“テキスト担当” (LLMは言語を中核とする生成AI。近年は画像・音声も扱うマルチモーダル型が普及(ただし言語モデルが必要です)。) ・AI=LLMではないが、現場で触れやすい入口。
LLMの得意・不得意 得意 ◦ 要約・言い換え・構成ドラフト ◦ フォーマット変換・整形 ◦ コード補助(読解・修正・説明) 不得意 ◦ 最新事実の正確な把握(学習時点の知識) 学習データが固定されており、学習時点以降の情報を持たないため ◦ 厳密計算・根拠の自動提示 ◦ 専門分野の正確な判断(裏取り必須) → 出力は必ず検証(出典URL・最終更新日・数値根拠を確認してから使用)
LLMの仕組み(ざっくり) 入力 確率的な 出力 (指示・制約・文脈) 「次トークン予測」 (文章・コード等) ポイント: ・人間のように“理解・思考”しているわけではない (確率分布に基づき最も尤もらしい連続テキストを生成) ・大量のテキストの統計パターンで次のトークン(単語や記号)を予測 ・精度は“指示の明確さ”と“検証の徹底”で大きく変わる
代表的なサービスと特徴 ChatGPT ◦ 短文から長文まで応答が安定/拡張機能も豊富 Claude ◦ 長文読解や指示の素直さに定評 Gemini ◦ Googleサービス連携の強み Copilot ◦ 業務アプリと連携(M365等)/組織データの活用 ※2025年8月時点
活用領域: 文章・コミュニケーション 要約・言い換え・文面調整(トーン/長さ/読者指定) 議事録・報告書の骨子作成 メール・チャットの下書き支援
活用領域: 調査・要約・検索補助 資料の下読み(概略把握) 観点リスト化(比較軸・評価基準の抽出) 一次情報確認のためのキーワード整理
活用領域: コード・技術文書 コードの要約・説明・リファクタ案 テスト観点の列挙・境界値の洗い出し 技術文書の構成化・テンプレート整形
RAG (リトリーバル・オーグメンテッド・ジェネレーション) (Retrieval-Augmented Generation) /検索連携で“限界”を補う ユーザー質問 検索/DB参 照 LLMで生成 LLM単体の限界(学習時点の知識)を補うため、 外部の最新情報や社内データを検索で取り込み、 根拠を明示しながら回答する仕組み。 検索結果は引用と出典併記、日付の整合を確認 回答 (根拠付き)
品質確保のポイント 出典の確認(URL・文献)/引用の明記 日付の整合(“いつ時点か”を明確化) 数値・計算の再確認(電卓・表計算で裏取り) 専門事項は必ず一次情報に当たる
セキュリティ・法務の観点 入力データが学習に使われるかの設定確認(オプトアウト可否)、 ログ保存期間と保管場所(リージョン)の把握 ・個人情報や社外秘の入力を避ける(専用環境を使用) ・ログと保存範囲の把握(提供サービスの設定) ・ライセンス・著作権・利用規約の遵守 ・プロンプトインジェクション対策(要約→抽出→検証の分離) 許可コマンドのホワイトリスト化、 URLの自動実行禁止、システムプロンプトの固定
よくある誤解Q&A Q: AI=LLM? ◦ A: いいえ。LLMは生成AIの“テキスト担当”。AI全体はもっと広い。 Q: 検索の代替になる? ◦ A: 要約や下書きには有効だが、一次情報の確認は必須。 Q: 誤情報は出ない? ◦ A: 出る可能性あり(ハルシネーション)。検証が前提。
まとめ&参照情報 まとめ ◦ LLMは強力な補助ツール ◦ “位置づけ・仕組み・リスク”を理解して安全に活用
用語ミニ辞典(1/2) 用語 定義 LLM(Large Language Model ) 大量テキストから“次のトークン(単語や記号)”を予測して文章を生成 ・理解・生成するAI。 トークン モデルが扱う最小単位(単語/記号/サブワード)。文字数≠トークン数に 注意。 コンテキストウィンドウ 一度に読み書きできるトークンの上限。大きいほど長文に強いが計算負荷 も増える。 ハルシネーション それらしいが誤った内容を自信満々に出す現象。出典・日付・数値で検証 が必須。 RAG(Retrieval-Augmented Generation) 外部検索で関連資料を取り出し、根拠を添えて生成する方式。学習時点の 限界を補う。 埋め込み(Embedding) 文や単語をベクトルに変換した表現。意味の“近さ”を数値化して検索に 使う。 ベクトルDB 埋め込みベクトルを保存し、似ている文を高速に見つけるデータベース。 マルチモーダル テキストに加え画像・音声・動画など複数モダリティを入出力で扱う仕組 み。 作成: 2025-08-15 | 用語ミニ辞典
用語ミニ辞典(2/2) 用語 定義 プロンプト/システムプロン プト ユーザーの指示がプロンプト。役割やルールを定める上位指示がシステム プロンプト。 プロンプトインジェクション 入力に“隠し指示”を埋め込み、意図しない動作や情報漏えいを狙う攻撃 。 ガードレール(安全対策) 不適切出力の抑制・機密の保護・ツール実行の許可制などの安全設計。 ファインチューニング 特定領域のデータでLLMの振る舞いを追加学習して最適化すること。 SLM(Small Language Model ) 小型の言語モデル。軽量で安価・高速。限定用途では高精度も狙える。 温度(Temperature)/Top-p 出力の多様性を調整するパラメータ。高いほど創造的、低いほど安定。 ツール呼び出し(関数呼び出 し) LLMが外部APIや関数を呼んで検索・計算・DB操作などを行う仕組み。 出典(Citation) 回答の根拠となるURL・文献情報。日付と併記して検証可能性を高める。 作成: 2025-08-15 | 用語ミニ辞典