LLMATCH [Season1] 最終成果報告_石田憲太郎

326 Views

May 01, 25

スライド概要

◾️ 3/26開催 LLMATCH [Season1] 最終成果発表会
2024年12月にスタートしたLLMATCHでは、約4ヶ月にわたり30名の学生がLLMの研究開発に挑戦し、最先端の研究に取り組みました。3/26にオンラインにて、 “LLMATCH [Season1]” の最終成果発表会を行いました。

▼発表者
・石田憲太郎 「診療録からの構造化抽出〜自由記載データからの効率的な情報検索システムを目指して〜」
・渡辺悠介 「問診AI- 再現性の高いドメイン特化LLMの提案」
・吉田馨「ロボコンに向けたバスケットボールシミュレーションの分析と戦略の生成〜紆余曲折」
・tom11111111 「Gemini-2.0-Flash-Thinkingを用いたLLMエージェントによるマインクラフト建築」

▼発表資料はこちら
https://www.docswell.com/user/matsuo-lab_llm

▼発表動画はこちら
https://youtu.be/7Ik3LTcdks0

----
◾️ LLMATCHとは
「LLMATCH」という名称は、“Large Language Model Advanced Training & Challenging Hub” に由来し、学生の皆さんが持つLLM(大規模言語モデル)に関するアイデアを、研究として発展させることを目的としたプログラムです。
本プログラムでは、東京大学 松尾・岩澤研究室の研究員が、最大1年を目安に、参加者一人ひとりの関心やスキルに応じて、次のキャリアや挑戦につながる支援を行っています。
また、研究メンバーの活動を支える「アシスタント」ポジションも設けており、学生・社会人を問わず、コミュニティの一員として研究の進行をサポートしてくださる方を広く募集しています。

▼LLMATCHへの参加方法:
下記のリンクから「松尾研LLMコミュニティ」 Slackに入り、# llmatch_01_general チャンネルよりご参加ください。
https://linktr.ee/matsuolab_community
----

profile-image

東京大学松尾・研究室が運営する「松尾研LLMコミュニティ」でのイベント資料などを公開します。 ◾️ 松尾研LLMコミュニティとは 松尾研LLMコミュニティは、「大規模言語モデルについて知って学べるオンライン空間」として、東京大学松尾・岩澤研究室が運営するコミュニティです。 現在、学生を中心とした7800名以上が、原則無償で参加しています。 また、本コミュニティでは様々なイベント等を定期的に開催しております。 是非下記のリンクより参加申し込みをお待ちしております。 ◾️ 松尾研LLMコミュニティの各種リンク ・今後のイベント開催情報/参加申込;https://tr.ee/7d_W4DsImD ・松尾研LLMコミュニティ参加フォーム;https://tr.ee/RyDfuRzS55 ・過去イベントアーカイブ;https://tr.ee/wqdbFJJZ25

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

診療録からの構造化抽出 〜自由記載データからの効率的な情報検索システムを目指して〜 2025年3月26日 LLMATCH 最終報告会 @石田 憲太郎 1

2.

診療録からの構造化抽出 〜自由記載データからの効率的な情報検索システムを目指して〜 2025年3月26日 LLMATCH 最終報告会 @石田 憲太郎 2

3.

成果物:医療記録分析アプリ β版の公開 Github クラウドβ版 URL テストデータ作成機能あり、 GeminiはAPIキー設定済み。 すぐに触っていただけます。 3

4.

開発の動機 4

5.

より多くの患者さんを治すため医学研究は必須 質の高い情報を集めることは重要なステップの一つ 保険データ 病院 A 診療 録 検査データ データ抽出 患者 病院 B DB登録 集約 利活 用 健診データ 病院C 5

6.

診療録の 8割は自由記載データ 患者情報 患者名: 山田 太郎 年齢: 45歳 性別: 男性 S: Subjective(主観的情報) 患者の訴え: 「3日前から続く咳と発熱があります。昨夜は 38.5度まで上がりました。喉の痛みもあります。」 病歴: 「先週から職場で風邪が流行しています。」 現病歴: 「初日は喉の違和感のみでしたが、次第に咳と熱 が出てきました。市販の風邪薬を飲みましたが、症状が改 善しません。」 O: Objective(客観的情報) 身体所見: 全身: 軽度の倦怠感あり、意識清明 頭頸部: 咽頭発赤あり、扁桃腺腫大なし 胸部: 呼吸音清、ラ音なし、心音整 腹部: 平坦、軟、圧痛なし A: Assessment(評価) 1.急性上気道炎の疑い 2.症状(発熱、咳、咽頭痛)と身体所見が一致 1. インフルエンザ検査陰性 2. 白血球数と炎症反応は軽度上昇のみ P: Plan(計画) 1.治療計画: 2. 対症療法を中心に行う 3. 解熱鎮痛剤(アセトアミノフェン 400mg 1日3回 食後) 4. 咳止め(デキストロメトルファン 15mg 1日3回 食後) 5. 十分な水分摂取と休息を指示 6

7.

大量の自由記載から目視で情報を抽出する必要がある カルテ 目視判定 DB登録 医学研究の律速 エラーによる質の低下 7

8.

自由記載から効率的に情報収集できるシステムが必要 カルテ 目視判定 DB登録 {"検体":"子宮頸部円錐切除 ", “診断”:”adenocarcinoma", "腫瘍系":{"水平方向 ": "17 mm", "深さ": "5 mm"}, “リンパ管侵襲 ”: “なし", "切除断端 ":"陽性", "TNM":{"pT":"1b1","pN":"X","M":"X"}} LLMによる構造化 8

9.

実際に利用してもらう際の課題 多くの医療関係者にとって プログラミングは難しい 使いやすいUIも必須 生成AIを簡単に扱えるアプリ開発に焦点を絞った 9

10.

成果物:医療記録分析アプリ β版の紹介 仕様は変更される可能性があります。 最新の状況はGithubをご覧ください。 https://github.com/iishiken/LLMATCH 10

11.

医療記録分析アプリ β版 11

12.

医療記録分析アプリ構成 クラウド利用 PC クラウド環境 ブラウザ Streamlit cloud ChatGPT Claude Gemini DeepSeek クラウド版は Geminiのみ API キー設定済み 無料で試していただけます ローカル利用 PC ローカルサーバー (vLLMに対応 ) Streamlit UI 個人情報を扱う場合は施設の要件に合わせて クラウドの機密性については今後改良予定 ChatGPT Claude Gemini DeepSeek 12

13.

医療記録分析アプリフロー 入力:エクセルファイル ID,日付,テキストが必要 出力:エクセルファイル 抽出結果とその理由 ID毎、記載日順に整形 ブラウザ LLM ダミーデータ生 成機能あり プロンプトテンプレート (GUIで自由に追加・編集可能) 13

14.

実際の使い方 14

15.

医療記録分析システム 1、処理させるファイルの用意 ID,記載日,自由記載が 格納されたエクセルを用意 もしくはシステムの テストデータ生成機能を使用 15

16.

医療記録分析システム 2、使用する LLMの選択 LLMプロバイダーを選択し、 APIキーを入力 ※クラウド版は Gemini flash lightを無料で試せます ローカル利用の場合は vLLMサーバーにも対応 16

17.

医療記録分析システム 3、実際の抽出 ID,日付,自由記載が格納された列名を指定 抽出したい情報を選択 デフォルトでよく収集される情報の プロンプトテンプレートを入力しています。 17

18.

医療記録分析システム 4,抽出結果 統計情報の出力機 能 18

19.

医療記録分析システム 4,抽出結果 抽出結果 抽出項目の理由 エクセルファイルで保存可能 19

20.

結語 クリック操作で簡単に構造化抽出を行えるアプリ開発 カルテ 目視判定 DB登録 {"検体":"子宮頸部円錐切除 ", “診断”:”adenocarcinoma", "腫瘍系":{"水平方向 ": "17 mm", "深さ": "5 mm"}, “リンパ管侵襲 ”: “なし", "切除断端 ":"陽性", "TNM":{"pT":"1b1","pN":"X","M":"X"}} LLMによる構造化 20

21.

謝辞 LLMACHを率いてくださった @小橋洋平さん @ Kaho Sunata さん 技術的なサポートをしてくださった @tmotoyaさん、@ryo_sato さん サポートチームエンジニアの皆様 @KoWakutaさん、@yochimachika さん、@ maharasa さん @sasaki_seiya (siruku6) さん、@y_morinaga さん アドバイスをくださった LLMATCHサポーターの皆様 21