オリジナルデータでYOLACTを作って動かそう！　Part.2　ディープラーニングでYOLACTを学習

27.6K Views

April 27, 24

#YOLACT #ディープラーニング #物体検出 #アノテーション #転移学習

スライド概要

インスタンスセグメンテーションAIの「YOLACT」を自分で用意した画像でファインチューニングして使いたい方向けの資料です。
Part2ではYOLACT向けのアノテーションファイルの成形と、ディープラーニングの開始方法を紹介します。

スプレッドナレッジ

@59n58783

スライド一覧

主にオープンソースを利用して、ディープラーニングやArduPilotの自律走行ロボットを開発しています。バリバリ農学部出身ですが、異分野にも挑戦中。これまで作った資料を順次公開しています。

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

オリジナルデータでYOLACTを作って動かそう！　Part.1　パソコンの環境構築からアノテーションまで

スプレッドナレッジ 24.4K

オリジナルデータでYOLACTを作って動かそう！　Part.3　インスタンスセグメンテーションの実行

スプレッドナレッジ 7.2K

猫でも分かるUnreal Engineの学び方 - 超初心者向け編 - 2023 v1.0

ue4 ue5 ue-beginner

エピックゲームズジャパン 1.7M

Unreal Engine5 Lumenの仕組みと肝心なところ

ue5 ue-rendering ue-lumen

エピックゲームズジャパン 1.4M

UE5レンダリングフロー総おさらい(2024) 基礎編！[CEDEC+KYUSHU 2024]

ue5 unreal engine ue-rendering

エピックゲームズジャパン 1.2M

Meta XR SDK(V66-74)でQuestアプリを開発

spatial anchor unity quest pro shaperecognizeractivatestate oculus integration transformfeaturestateprovider building blocks transformrecognizeractivestate ovrsemanticclassification jointdeltaprovider ovrscenemanager jointvelocityactivestate オクルージョン sequenceactivestate scene manager ambisonic depth api metaxraudiosource playerlocomotor meta xr sdk quest3 ovrplayercontroller マルチモーダル meta haptics studio direct touch ui meta xr haptics sdk ovrspatialanchor ovrtrackedkeyboard hapticclipplayer fingerfeaturestateprovider hapticclip ワイドモーションモード wmm mruk mr utility kit voice sdk jointrotationactivestate meta horizon os ui set asw application spacewarp ovr metrics tool unityscene manager colocation discovery コロケーション mx ink passthrough camera api hand tracking microgestures webcamtexturemanager passthroughcamerautils cameraviewermanager hand pose selector recorder

あうぜん 1.2M

各ページのテキスト

オリジナルデータで YOLACTを作って動かそう！ Part.2 ディープラーニングでYOLACTを学習作成者：スプレッドナレッジ

【Part.2 の内容】 0. 前回のおさらい 1. YOLACTのAIを作成する手順 2. アノテーションデータの形式変換 3. YOLACTのconfigファイルの設定 4. ディープラーニングの開始

0. 前回のおさらい

0-1 前回のおさらい引用：https://github.com/wkentaro/labelme

https://github.com/wkentaro/labelme

0-2 今回解説するパート

0-3 Ubuntuに追加でダウンロードするファイル（1）Ubuntuを起動＆端末を開いて「Labelme」のソースコードをダウンロードする（1度だけ行えばよい） →「2. アノテーションデータの形式変換」の際に必要【Ubuntuの端末へ入力するダウンロードコマンド】 ① cd ～ ② git clone https://github.com/wkentaro/labelme.git

0-3 Ubuntuに追加でダウンロードするファイル（1）続き

0-3 Ubuntuに追加でダウンロードするファイル（2）以下のサイトからYOLACTのベースネットワークをダウンロードする →ディープラーニングの際に必要（詳しくは第5章へ） https://github.com/dbolya/yolact

https://github.com/dbolya/yolact

0-3 Ubuntuに追加でダウンロードするファイル（2）続き：ページ内の「Training」にあるhereをクリックする

10.

0-3 Ubuntuに追加でダウンロードするファイル（2）続き：ダウンロードした3つのファイルを yolactディレクトリ内のweightsディレクトリへコピー

11.

0-3 Ubuntuに追加でダウンロードするファイル（3）Visual Studio Codeをインストールする →大容量のテキスト形式のデータを開くのに最適なため Ubuntu Softwareを開いて “Visual Studio Code” を検索してダウンロード

12.

１. YOLACTのAIを作成する手順

13.

1-1 YOLACTの開発手順要件定義＆データ収取＆アノテーションアノテーションデータを独自形式へ変換 YOLACTのconfigファイルの設定ディープラーニングの実行

14.

1-2 アノテーションが終わったら・アノテーションが終わると画像データが保存されているフォルダにアノテーションデータ（.json）がしっかり保存されているか確認

15.

1-2 アノテーションが終わったら画像データ（.jpg）＆アノテーションデータ（.json）画像データ（.jpg）＆アノテーションデータ（.json）画像データ（.jpg）＆アノテーションデータ（.json） practice 1つのフォルダーへまとめましょう！

16.

・データを移動する前に：trainとvalidationに分ける practice train 用 practice_train 推奨比率 train : valid validation 用 practice_validation ＝ 8 ： 2

17.

18.

準備ができたらデータ移動

19.

2. アノテーションデータの形式変換

20.

2-0 この章で解説するパートアノテーションデータを独自形式へ変換

21.

COCO形式へ変更とは？・YOLACT作成時にLabelmeで作成したアノテーションデータ（.json）をそのまま利用できない →labelmeのPythonプログラムで独自形式へ変更する必要がある

22.

2-1 学習データをUbuntu/labelmeへ移動 home labelme examples instance_ segmentation train用とvalidation用のディレクトリを分けてから instance_segmentationディレクトリへコピーする practice_ train practice_ validation

23.

2-2 labels.txtの内容を一部変更・labels.txt：YOLACTに分類させる項目名を記載するtxtファイル

24.

① 3行目以降を削除 ② 3行目以降に分類項目名を順に記述する ③ 最後に保存して閉じる

25.

2-3 変換プログラムの実行 ①「yolact」の仮想環境を起動 ② cdコマンドでinstance_segmentationディレクトリへ移動 ③ Pythonプログラムを使って最初にtrain用のデータを変換していく ④ Pythonプログラムを使って次にvalidation用のデータを変換していく【端末に打ち込む実行コマンド】 ① conda activate yolact ② cd ～/labelme/examples/instance_segmentation

26.

【端末に打ち込む実行コマンド】 ③ python labelme2coco.py {train用データのディレクトリ名} {train用の変換データの出力先ディレクトリ名} --labels labels.txt

27.

【端末に打ち込む実行コマンド】 ④ python labelme2coco.py {validation用データのディレクトリ名} {validation用の変換データの出力先ディレクトリ名} --labels labels.txt

28.

2-4 変換した学習データの内容・2-3の③と④で指定した変換データの出力先ディレクトリが instance_segmentationディレクトリに出力されている

29.

3. YOLACTのconfigファイルの設定

30.

3-0 この章で解説するパート YOLACTのconfigファイルの設定

31.

3-1 configファイルとは・ディープラーニングに必要な設定を記載するファイル →ディープラーニングをどう進めるか＆どのように学習を進めていくか書いてある・データセット名の定義・学習データ（画像＆アノテーションデータ）・YOLACT＋＋のネットワーク構成・入力データのサイズ・学習率の変更タイミング・ディープラーニングの総回数 …etc

32.

3-2 学習データの移動と一部内容変更 ① 2-3で作成したデータのファイル名を以下のように変更する ※名前は何でも良いですが今回はこの名前で進めます train_images train.json validation_images validation.json

33.

② train.jsonとvalidation.jsonの内容を一部変更 →ファイル内の「JPEGImages/」の文字列を全て削除

34.

③ yolactディレクトリ内に学習データを保存しておく新しいディレクトリを新規作成＆そこへ①の4つのファイルをコピーする home labelme examples instance_ segmentation practice_train_ output practice_validation_ output コピー yolact train_data practice

35.

3-3 configファイルの変更 ① dataディレクトリ内にあるconfig.pyを開く home yolact data 今回は Resnet101という CNNをバックボーンにした YOLACT++を作成します

36.

②「--DATASETS--」の欄の最後の辺りにデータセット名や各種学習データの保存場所・ファイル名・ディレクトリ名、分類項目名と数を記述するデータセット名 trainとvalidation の学習用画像の保存場所とディレクトリ名 trainとvalidation のアノテーションデータの保存場所とファイル名分類項目名と数自分の条件に合わせて修正する部分

37.

③「--YOLACT++ CONFIGS--」の欄の最後の辺りに作成するYOLACT++の定義を記述していく 1) 「yolact_plus_bas e_config」の部分を丸々コピーする

38.

③続き 2) 1)でコピーした部分を「--YOLACT ++ CONFIGS--」の欄の最後部へ貼り付ける独自の定義文をどこに記述したか分かりやすいようにこのような文章を加えておくと良い

39.

③続き 3) 「yolact_plus_base_config」と「”name”」の部分を独自の名前に変更する今回は学習データに合わせて「practice」と変更する

40.

③続き 3-3の②で記述した「データセット名」を指定 4) 「”name”」の下に5つの項目を追加する＆必要に応じて赤点線部を変更する分類項目の数を関数を使って指定学習率を指定学習率の変更タイミングを指定ディープラーニングの回数を指定自分の条件に合わせて修正する部分

41.

③続き 5) 「保存(S)」をクリックして configファイルを閉じる

42.

4. ディープラーニングの開始

43.

4-0 この章で解説するパートディープラーニングの実行

44.

4-1 転移学習でAI作成

45.

4-2 ディープラーニング開始！・以下の3つのコマンドを実行するとディープラーニングが始まる ① conda activate yolact ② cd ～/yolact ③ python train.py –config {3-3の③で定義したconfig名} --batch_size {batchサイズ} → 今回の場合

46.

pytorchや GPUの割り当て、データの読み込みが始まっていくうまくいくとこのようにディープラーニングが開始される 2回学習が進むと validationのデータで検証を行う繰り返し…

47.

4-3 CUDA out of memoryの対処 GPUのメモリ使用量の調整 ①ディープラーニングのコマンドのbatchサイズを減らす（＝ 1回の学習に使用するデータ数を減らす） ②configの’max_size’を32の倍数で小さくする（＝ YOLACTのモデルサイズを小さくする）

オリジナルデータでYOLACTを作って動かそう！ Part.2 ディープラーニングでYOLACTを学習