Merge is All You Need: ローカルLLM小説生成モデル Project Ninja

Local Novel LLM Project Slide: たいらローカルLLM小説生成モデル _____ is All You Need

Local Novel LLM Project Slide: たいらローカルLLM小説生成モデル Merge is All You Need

00 メンバー紹介コアメンバー・ゆうっち X:@int_float 担当：プロジェクトリーダー・モデル評価・うみせ X:@UiE029 担当：データセット作成・エンジニアリング・ロゴ作成・エクスヴェリア X:@nzk1015 担当：データセット作成・エンジニアリング・弥生水葉 X:@yayoi_mizuha 担当：データセット作成

4.

00 メンバー紹介サブメンバー・たいら X:@TylorShine 担当：モデル学習・エンジニアリング

https://twitter.com/TylorShine

5.

目次 01 成果発表・デモ Results and Demonstration 02 プロジェクトの経緯 History and Progress 03 Ninjaになるまで The Syugyo 04 Ninjaが出来てからのアレコレ Something After to be Ninja CONTENTS 05 Ninjaのこれから Future

6.

目次 01 成果発表・デモ Results and Demonstration 02 プロジェクトの経緯 History and Progress 03 Ninjaになるまで The Syugyo 04 Ninjaが出来てからのアレコレ Something After to be Ninja CONTENTS 05 Ninjaのこれから Future

7.

目次 01 成果発表・デモ Results and Demonstration 02 プロジェクトの経緯 History and Progress 03 Ninjaになるまで The Syugyo 04 Ninjaが出来てからのアレコレ Something After to be Ninja CONTENTS 05 Ninjaのこれから Future

8.

目次 01 成果発表・デモ Results and Demonstration 02 プロジェクトの経緯 History and Progress 03 Ninjaになるまで The Syugyo 04 Ninjaが出来てからのアレコレ Something After to be Ninja CONTENTS 05 Ninjaのこれから Future

9.

目次 01 成果発表・デモ Results and Demonstration 02 プロジェクトの経緯 History and Progress 03 Ninjaになるまで The Syugyo 04 Ninjaが出来てからのアレコレ Something After to be Ninja CONTENTS 05 Ninjaのこれから Future

10.

目次 01 成果発表・デモ Results and Demonstration 02 プロジェクトの経緯 History and Progress 03 Ninjaになるまで The Syugyo 04 Ninjaが出来てからのアレコレ Something After to be Ninja CONTENTS 05 Ninjaのこれから Future

11.

n o i t c e S 01 成果発表・デモ

12.

02 プロジェクトの経緯 Project Ninja小説生成モデルを公開しました！＞＞＞ https://huggingface.co/Local-Novel-LLM-project

https://huggingface.co/Local-Novel-LLM-project

13.

01 成果発表・デモ使用モデル: Local-Novel-LLM-project/Ninja-v1

14.

01 成果発表・デモ使用モデル: Local-Novel-LLM-project/Ninja-v1-128k

15.

目次 01 成果発表・デモ Results and Demonstration 02 プロジェクトの経緯 History and Progress 03 Ninjaになるまで The Syugyo 04 Ninjaが出来てからのアレコレ Something After to be Ninja CONTENTS 05 Ninjaのこれから Future

16.

n o i t c e S 02 プロジェクトの経緯

17.

02 プロジェクトの経緯小説を書けるローカルLLMを作りたい！ - ハッカソン第0回にてチームを立ち上げる

18.

02 プロジェクトの経緯小説を書けるローカルLLMを作りたい！ - ハッカソン第0回にてチームを立ち上げるモチベーション: - 某N◯velAIとかAI◯べりすとみたいなストーリー生成をローカルでやりたい！

19.

目次 01 成果発表・デモ Results and Demonstration 02 プロジェクトの経緯 History and Progress 03 Ninjaになるまで The Syugyo 04 Ninjaが出来てからのアレコレ Something After to be Ninja CONTENTS 05 Ninjaのこれから Future

20.

n o i t c e S 03 Ninjaになるまで

21.

03 Ninjaになるまでベースモデルの選定当初はフルスクラッチでモデル構築、学習という話だったが、いくらつよつよマシン環境 (本当にありがとうございます！！ ) とはいえゼロからの学習だと効率が悪いだろう > モデルのFine-Tuningを基本に良い方法を探る方針に

22.

03 Ninjaになるまでベースモデルの選定候補モデルたち: Apache-2.0など、できるだけ緩い制限のモデルに絞る - Stability AI: Japanese StableLM-3B-4E1T Base / Base Gamma 7B - Google: Gemma 7B base model - Line Corp.: japanese-large-lm (1.7b, 3.6b) > モデルのFine-Tuningを基本に良い方法を探る方針に

23.

03 Ninjaになるまでベースモデルの選定候補モデルたち - 東京工業大学: Swallow-MS-7b-v0.1 まず、Swallow-MS-7b-v0.1 (以下、Swallow) をベースモデルとして使用させていただき検討することにしました > モデルのFine-Tuningを基本に良い方法を探る方針に

https://huggingface.co/tokyotech-llm/Swallow-MS-7b-v0.1

24.

03 Ninjaになるまでベースモデルの選定候補モデルたち - 東京工業大学: Swallow-MS-7b-v0.1 まず、Swallow-MS-7b-v0.1 (以下、Swallow) をベースモデルとして使用させていただき検討することにしました > で、どうする？

https://huggingface.co/tokyotech-llm/Swallow-MS-7b-v0.1

25.

03 Ninjaになるまで ChatVectorのマージ @jovyan さんの記事: Chat Vectorを使って日本語LLMをチャットモデルに改造する - 元論文: Chat Vector: A Simple Approach to Equip LLMs with Instruction... > で、どうする？

26.

03 Ninjaになるまで ChatVectorのマージ @jovyan さんの記事: Chat Vectorを使って日本語LLMをチャットモデルに改造する - 元論文: Chat Vector: A Simple Approach to Equip LLMs with Instruction... これは...引いて足すだけ...だと... > で、どうする？

27.

03 Ninjaになるまで ChatVectorのマージ @jovyan さんの記事: Chat Vectorを使って日本語LLMをチャットモデルに改造する - 元論文: Chat Vector: A Simple Approach to Equip LLMs with Instruction... これは...引いて足すだけ...だと... > 早速Swallowさんに適用してみた

28.

03 Ninjaになるまで ChatVectorのマージ大まかなコード(jovyanさんの記事のコードを簡略化):

29.

03 Ninjaになるまで TaskVectorのマージ似た処理をともなう実験を何度も施行するうちに - “ninja-merger.py”ができました - 当初はTask Vectorのマージのみでしたが、機能が増えていきました - MergeKit よりTaskVectorの扱いが楽...かな？ TIESとかは未実装です... - 後日Apache-2.0 Licenseで公開します！

https://github.com/arcee-ai/mergekit

30.

03 Ninjaになるまで TaskVectorのマージ WizardLM2-7B + (Swallow-MS-7B - Mistral-7B) = ? 出力結果: > …(vocab_sizeの違うTokenizerかつ未学習のため誤字脱字など散見されますが) 合成できてそう！別モデルでも試してみる

31.

03 Ninjaになるまで TaskVectorのマージ ChatNTQ-JA-7B + (WizardLM2-7B - Mistral-7B) = ? 出力結果: > …？？？

32.

03 Ninjaになるまで TaskVectorのマージ ChatNTQ-JA-7B + (WizardLM2-7B - Mistral-7B) = ? 出力結果2: >

33.

03 Ninjaになるまで TaskVectorのマージ ChatNTQ-JA-7B + (WizardLM2-7B - Mistral-7B) = ? 出力結果2: > …つよい...もうこれでいいのでは？

34.

03 Ninjaになるまで TaskVectorのマージ ChatNTQ-JA-7B + (WizardLM2-7B - Mistral-7B) = ? 出力結果2: > …つよい...もうこれでいいのでは？(ここまでハッカソン開始前)

35.

03 Ninjaになるまで TaskVectorのマージ mergekitでのマージ - よさげなモデル+Ninjaを並べてTIESなどでいい感じにマージ > 日本語アシスタント性能が良さげなモデル Vecteus (の前身)ができました！ > …つよい...もうこれでいいのでは？(ここまでハッカソン開始前)

36.

03 Ninjaになるまでハッカソン開始学習方針 - モデルが素の状態で性能良いため、Full Fine-Tuningはハードル高そう > LoRAで小説生成タスクを強化してみよう > 小説データセット、約580MB - 使用したライブラリ: LLaMA-Factory: Unify Efficient Fine-Tuning of 100+ LLMs - とてもお手軽。数多のモデルやDeepSpeed、Unslothも標準サポート - GUI(gradio)もあるので設定が楽(GUIからマルチGPU使用は未サポート)

37.

目次 01 成果発表・デモ Results and Demonstration 02 プロジェクトの経緯 History and Progress 03 Ninjaになるまで The Syugyo 04 Ninjaが出来てからのアレコレ Something After to be Ninja CONTENTS 05 Ninjaのこれから Future

38.

n o i t c e S 04 Ninjaが出来てからのアレコレ

39.

04 Ninjaが出来てからのアレコレハッカソン開始 LoRA hparams比較実験 (以下はもちろん今回のモデルでの傾向です) - rsLoRA有効 + LoRA Rank 256、Q, K: 効きすぎてループ出力しやすかった - (一般的な7B程度のモデルでよく見る単語ループではなく長いレンジかつ意味合いでのループのような感じ) - rsLoRA無効 + LoRA Rank 128、excl. embed_tokens, lm_head: - いい感じだけれどもうちょっとチューニングできそうなど、多くのパターンを試行しました。

https://arxiv.org/abs/2312.03732

40.

04 Ninjaが出来てからのアレコレ mergekit-evo…? 途中でmergekitにmergekit-evo(世代進化マージ)がcommitされました > 早速つかおう！！...How To 進化時の評価...？ > lm-evaluation-harness が使用できる！が日本語対応ブランチは旧Ver… > v0.4に一部日本語タスクを移植しました。(後日、他タスク対応＆整理してPull Request出す予定です！) > 独自に小説推敲評価用タスクも書きました。

41.

04 Ninjaが出来てからのアレコレ mergekit-evo…? 結果：うまく進化してそうです。最初自前タスクの設定ミスに気づかず「だめかなー」な雰囲気で設定直したあととりあえず生成続けたモデルを放置... - 後にふと生成を試してみると結果が良さそうだったので、進化途中モデルも後日整理して公開します！ - もっと継続して進化させたい気持ち...

42.

04 Ninjaが出来てからのアレコレ axolotl Freeze Layerの設定の柔軟性かなにかの理由で学習用ライブラリをaxolotlに > 設定とか使いやすかったです。一通りの機能もそろっててすばらしい！！後半はこちらで入出力レイヤーのFTなどをしました。

43.

目次 01 成果発表・デモ Results and Demonstration 02 プロジェクトの経緯 History and Progress 03 Ninjaになるまで The Syugyo 04 Ninjaが出来てからのアレコレ Something After to be Ninja CONTENTS 05 Ninjaのこれから Future

44.

n o i t c e S 05 Ninjaのこれから

45.

05 Ninjaのこれから TODOs ・Mergeを続けたい、設定詰めたり研究したい・Evo Mergeを続けたい・Ninja-V1モデルでの評価など、品質評価タスクを詰めたい・LoRA、FTなどで特定タスク、ジャンルなどに特化したものを量産したい・Mergeを続けたい！！

46.

05 Ninjaのこれから結論

47.

05 Ninjaのこれから Merge is All You Need

48.

05 Ninjaのこれからご清聴ありがとうございました！！