【大規模言語モデル入門Ⅱ】11章

811 Views

December 19, 24

#大規模言語モデル #指示チューニング #量子化 #LoRA #モデル評価

スライド概要

京都大学人工知能研究会KaiRA

@kyoto-kaira

スライド一覧

AI・機械学習を勉強したい学生たちが集まる、京都大学の自主ゼミサークルです。私たちのサークルに興味のある方はX(Twitter)をご覧ください！

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

【論文読み会】GraphCast: Learning skillful medium-range global weather forecasting

京都大学人工知能研究会KaiRA 29.7K

【論文読み会】NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis

京都大学人工知能研究会KaiRA 22.7K

【IT Text 自然言語処理の基礎】第7章：事前学習済みモデルと転移学習

京都大学人工知能研究会KaiRA 20.6K

【物体検出】ResNet・EfficientNet (v2)

京都大学人工知能研究会KaiRA 17.9K

【Pythonで学ぶ音声認識】第5章：GMM-HMMによる音声認識（5.3節まで）

京都大学人工知能研究会KaiRA 12.9K

【Pythonで学ぶ音声認識】第5章：GMM-HMMによる音声認識（5.5節）

京都大学人工知能研究会KaiRA 12.1K

各ページのテキスト

2024年度後期輪読会#10(2024/12/19) 大規模言語モデル入門Ⅱ 第11章指示チューニング理学部3回生山下素数 0

アジェンダ ◼ 指示チューニング ◼ 量子化とLoRA ◼ LLMによる評価 1

指示チューニングとは指示チューニングとは、事前学習後のLLMに、人間の指示に従った応答をするような振る舞いをさせるために行うファインチューニング事前学習と同様に次トークン予測を行うデータはユーザーの発話部分とLLMの応答部分でできているが、ユーザーの発話部分に関しては損失を計算しない今回はQLoRAと8 bit AdamWを用いたBertのファインチューニングを実装する 2

チャットテンプレート作成ユーザーの発話部分のテキストとLLMの応答部分のテキストを一つのテキストにまとめる処理が必要 Jinja2というテンプレートを使用 • {% %}の中では条件分岐などが使える • {{ }}の中に変数を埋め込める • {%- %}と書いてあれば前の無視して{% %}と同じ役割 3

チャットテンプレートから文章をトークンID化 pad_tokenはunk_tokenに設定 4

16bit浮動小数と量子化 16bit浮動小数にはFP16とBF16の種類がある BF16は2018年にGoogle Brainが提案した数値表現でより広い範囲の値を表現できてオーバーフロー・アンダーフローが生じにくいが数値表現の精度が落ちるさらに、メモリ使用量を減らすための工夫として量子化を用いる 16bit->4bitへの量子化パラメーターのそれぞれを24 = 16通りに振り分ける次のような手法がある • 等間隔量子化 • 等間隔に分ける • NormalFloat4(NF4)<-QLoRAで使用 • データが正規分布に従うと思って分ける • 平均付近のビンの数が多い • ブロックごとの量子化<-QLoRAで使用 • パラメーターをブロックごとに分けて、ブロックごとに最大値と最小値を計算して量子化 • 一つのブロックは外れ値を含んで量子化精度が落ちるが他のブロックの精度は上がる 5

量子化の設定モジュール単位で量子化されるブロック数はデフォルトでは64 6

LoRA 学習パラメーターを固定し、差分の部分を小さな2つの行列の積にして学習する 7

訓練の実行いつもどおりTrainerの設定をして訓練を実行 optimizerのパラメーターがモデルのパラメーター数の2倍になるため、optimizer のパラメーターの重みも量子化するような AdamWアルゴリズムを使用する 8

10.

LLMによるモデルの評価(有用性や関連性) FlexEvalを用いる Japanese Vicuna QA Benchmarkを用いる評価者LLMで有用性や関連性などに基づいて評価させる単一採点とペア評価を行うスコアはjsonファイルから読み込む 9

11.

LLMによるモデルの評価(安全性) FlexEvalを用いる Do-Not-Answer-Ja-120を用いる LLMが非倫理的な指示に従ってしまわないかを評価する 10

12.

LLMによるモデルの評価(GPT4による評価) 評価をするようなプロンプトを書く 11

13.

LLMによるモデルの評価(GPT4による評価) 設定ファイルを保存し、 flexeval_fileで評価を実行 12