2.1K Views
November 10, 23
スライド概要
2023年11月9日の生成AI協会(GAIS)勉強会での講演内容です。
2日前にOpenAIのDevDayでの大幅アップデート発表があったので、その内容に振らざるを得なかったという経緯があります。
ChatGPTでの⾃社データ活⽤ アステリア株式会社 エバンジェリスト ⽣成AI協会(GAIS) エバンジェリスト ⽣成AIデータ連携利活⽤WG 森 ⼀弥 2023年11⽉9⽇ © 2023 Asteria Corporation
アステリア株式会社 エバンジェリスト 森 ⼀弥 新しい技術の可能性を、未来の顧客に伝える 「ASTERIA」シリーズのシニアプロダクトマネージャーを経て、 ブロックチェーンに携わり、現在は AI や IoT など先端技術全般を担当 ⾃らプログラミングし経験した新技術の可能性、勘所を、 これから業務に採⽤する皆様にお伝えします n 講演・TV・雑誌取材(AI関連のみ抜粋) ITmedia:「ChatGPT」は業務をどう変えるのか? インプレス:今話題のAI「ChatGPT」とは何か? ⼈の仕事は奪われるのか? PC-Webzine:ChatGPTは何者か・ChatGPT の基礎解説と⽤途の可能性 Apps Japan:先端技術でリードする!ChatGPT による社内データの活⽤連携 メール等でご連絡ください [email protected] ⽣成AI協会 エバンジェリスト ITmedia 企画・原作 特許 © 2023 Asteria Corporation 2
企業や組織でよくある要望 社内データを使って ChatGPTにいい感じに回答させたい でも外部への情報流出は避けたい! © 2023 Asteria Corporation
⽅法1:プロンプトでで直接社内情報を 読んでもらう n ⼀時的なもので回答が欲しいならこれも n n n n アリ アップデートのたびに扱えるデータ量は 増えている 画像も読めるようになった プラグインを使ってPDFなども読める OpenAIに学習データとされないように、 設定をオフにしたり、オプトアウト申請 の必要あり © 2023 Asteria Corporation
⽅法2:APIでファインチューニング (追加学習)する n ⾃社⽤にChatGPTをアップデートする イメージ n 読み込みデータを⽤意・加⼯する必要あり n API利⽤ではOpenAIには学習データ として搾取されない(と規約に載っている) n 回答の精度は(3.5だと)今ひとつ? n 4.0のファインチューニングが先⽇可能に なったが⼤規模データを持つ⼀部組織のみ n 画⾯操作からできるようになった (学習データとして使われるかは不明) © 2023 Asteria Corporation
⽅法3:社内⽤のデータベースを作って ChatGPTに都度読ませる(RAG) local cloud Framework ChatGPT User VectorStore Embedding ⾃社 データ n Retrieval Augmented Generation (検索拡張⽣成) n VectorStoreというデータベースを⽤意 して社内情報を準備 n ユーザーからの質問に関連する情報を都度 VectorStoreから検索してChatGPTに読ま せる n n データ加⼯変換や、APIを使った開発が必要 n 関連情報があればそれっぽい回答が来る 基本的に社内データは⽤意したVectorStore ⼊れるので全件を外部に出さなくて済む © 2023 Asteria Corporation
・・・と、⾔うわけでVectorStoreの種類とか、 それぞれの特徴の話をしようと思ってましたが、 11/6(現地時間)のDevDayにて新しい発表 があり、状況は変わりつつあります © 2023 Asteria Corporation
DevDayの新しい発表内容(抜粋) n API開発をする際に関わってきそうなもの u画像解析がAPIから実⾏できるように l 基本的にはテキスト情報をもとにしていたが、画像解析が可能に l 画像の多い社内⽂書でも読み込んでそれっぽい回答をしてもらえる? uFunction Calling のアップデートとJSONモード l ChatGPTから呼び出してもらうシステムが定義でき、説明内容をみて適宜コールしてく れる「Function Calling」が機能強化 l ChatGPTから返ってくるデータを定義できる「JSONモード」 ますます出来ることの幅が広がり、 「ChatGPTと連携できること」がシステムの必須要件となるかも!? © 2023 Asteria Corporation
DevDayの新しい発表内容(抜粋) uGPTs l 特定の⽬的にカスタマイズされたGPT、外部API やカスタマイズデータも利⽤ l ノーコード(プログラムが必要ない)で作れる l プライバシーの設定もあり l アプリストアのように公開したり、企業の内部 専⽤でも利⽤できる ⼤規模なものでなければ、システム開発すら要らない 画像の出典:https://www.searchenginejournal.com/ © 2023 Asteria Corporation
法務リスクに関する情報 n 著作権シールド uOpenAIが著作権侵害に関する法的請求に対して、 守ってくれたうえに費⽤を⽀払ってくれる uChatGPT Enterprise と 開発者プラットフォームが 対象 u国内だとどうなる?? © 2023 Asteria Corporation
まとめ n 企業内でのChatGPTの利⽤はどんどん 「普通のこと」になっていく n 今後の様々なシステム開発はChatGPTから アクセスされることを意識すべき n 業務の分野ごとにVectorStoreを⽤意しておい ても無駄にはならなさそう? © 2023 Asteria Corporation
⽣成AI データ連携利活⽤ WG n ⽣成AIを企業や組織で使う場合には周辺 n 環境や各種データとの「連携・利活⽤」 が必要不可⽋ 連携利活⽤に関わる情報共有や ディスカッションなどを⾏うWGです u 活⽤データの準備⽅法 u 環境の準備⽅法 u 活⽤事例の紹介 u システム、サービスの調査、紹介 u ほか n ご興味ある⽅は⽣成AI協会へのご⼊会と、 https://gais.jp/ WGへのご参加をお願い致します © 2023 Asteria Corporation
個別のご相談も承ります 社内向けのセミナー ⾃社データ活⽤のアドバイス メール等でご連絡ください [email protected] © 2023 Asteria Corporation 13
事例:⼤⼿会計ソフトベンダー 開発メンバーへのアドバイスを⾏う「アドバイザリー契約」 社内向けセミナー n ⼊⾨・基本セミナー n RAG環境をレクチャー n サンプルプログラムの 提供(LangChain) 社内情報の活⽤ 環境の構築⽀援 n 社内⽂書のベクター データ化⽀援 n VectorStore選定協⼒ n 活⽤プログラム構築⽀援 毎週の勉強会⽀援 報告書・発表資料 作成⽀援 n 作成中プログラムや 環境へのアドバイス n 話題の新技術に関する 情報提供 n 報告書の原案作成 n 発表会資料の原案作成 n プレゼン⽅法に関する アドバイス → 具体的なアイデアの創出や若いメンバーのモチベーション向上に貢献 AI(⼤規模⾔語モデル)による⾃社データ活⽤について 詳細はアステリアまでお問い合わせください © 2023 Asteria Corporation