2.6K Views
October 23, 23
スライド概要
ゴムやエラストマーなどの柔らかい素材でできたロボットはソフトロボットと呼ばれ,その物理的な柔らかさから,従来のロボットの課題の一つである安全性を保証できるとして注目が集まっている.一方で,ソフトロボットの課題の一つとして,柔らかさゆえに正確な数理モデルの計算が困難であるため,高精度な制御が難しいことが挙げられる.
そこで本研究では,ソフトロボットの一種であるMcKibben型人工筋肉に対して,高精度な制御の実現のための,予測モデルを学習によって獲得することを目的とした.空気圧,筋肉長,荷重データを収集する,スケール可能なデータ収集装置の作成し,収集したデータを用いて時系列予測モデルの学習を行った.さらに,学習した予測モデルを用いて制御タスクを実行し,本手法の有効性を検証した.
空気圧人工筋肉のスケール可能な データ収集システムとモデル学習 JSAI2023 OS-21 世界モデルと知能 2023.6.7 池田悠也 1、松嶋達也1、岩澤有祐1、新山龍馬2、松尾豊 1 [1]東京大学、[2]明治大学
研究背景 深層学習・ロボット学習の発展 ● データドリブンで動作を学習 ○ 動画は引き出しを開ける動作を模倣学習で獲得 ● 大規模言語モデルによる動作のプランニング ○ 抽象的なタスクを動作の手順に落とし込む ■ SayCan[1] 複雑で柔軟なタスクが低コストで実現可能 → サービス分野への進出が期待される 2
研究背景 サービス分野へロボットが進出する際の課題 ● 従来のロボットは特性が既知の固い部品を用いることで、正確な制御を 実現していた → 人や物にぶつかった際の安全性を確保できない ソフトロボットはこの課題を打破する1つの解決策として、注目が集ま っている 3
研究背景 ソフトロボットとは ● ゴムやエラストマーなどの素材で構成され、 物理的な柔らかさを持つロボットの総称[2] ○ 安全性を保証できる ソフトロボットの課題 ● 高い自由度を持ち、素材の特性が未知 → 正確な動作特性を計算できず、制御が困難 https://www.youtube.com/watch?v=gng eaoJ--9Q&ab_channel=InsiderTech → 動作の高精度な予測モデルを学習し、 高精度な制御を実現できないか 4
研究の目的 研究の目的 ● 高精度な制御を実現するために、ソフトロボットの一種である McKibben型人工筋の予測モデルを深層学習ベースで獲得する 5
McKibben 型人工筋の概要 McKibben 型人工筋 ● 1960 年頃[3]に開発された空気圧駆動の人工筋肉 ○ ゴムチューブを網目状の組紐が覆う構造 ● チューブ内に圧縮空気を加えるとゴムチューブが膨張 → 組紐の網目の角度が変化し軸方向に収縮力が発生 6
McKibben 型人工筋の特性 空気圧一定条件下の長さと力の関係 ● 収縮率と力の関係 ○ 非線形性が存在 C ● 時間の流れに注目 ○ 除荷時と負荷時で異なる経路 ■ 弾性ヒステリシスが存在 B D A 7
実験の流れ 全体の実験の流れ ● データ収集装置の作成 ● 学習実験 ● 制御実験 8
データ収集装置の概要 ● 空気圧と長さを制御時の 空気圧と長さと力を測定可能 ● 制御装置 ○ 空気圧:電空レギュレータ ○ 長さ:電動フォースゲージスタンド ● センサ ○ 力:フォースゲージ ○ 長さ:リニアエンコーダ ○ 空気圧:空気圧センサ 9
データ収集の設定 ● 多様なデータを取るための工夫 ○ 空気圧と長さをランダムに制御 ○ 空気圧:変化量をランダム化 ○ 長さ:向きと速さをランダム化 ● データは 10Hz で測定 ○ Arduinoで同期を取る工夫 ● 合計約5時間分のデータを収集 10
学習実験 集めたデータを用いて学習実験を行い、以下の検証を行った ● アーキテクチャによる性能の検証 ○ RNN, LSTM, MLPを用いて検証 ● 学習データ量による性能の検証 ○ 全データの10, 30, 50, 70, 80, 90%のデータを用いて検証 11
学習実験 アーキテクチャによる性能の検証 実験設定 RNN, LSTM, MLP1:20ステップの空気圧・長さ・力履歴入力 → 長さ予測 MLP2:1ステップの空気圧・長さ・力履歴入力 → 長さ予測 結果 ● 時系列モデルであるRNN, LSTMの性能がMLPに比べて高い 12
学習実験 学習データ量による性能の検証 実験設定 アーキテクチャ実験のRNNと同様 結果 ● 学習に使用するデータが増えると性能が上がる 13
制御実験 学習したモデルで、実用的な環境下での有効性を検証する 制御タスク:人工筋を用いて、質量が既知の重りを指定された 一次元上の軌道に従って動かす 目標軌道:正弦波 1/2 周期分 重りの質量:544 g 使用モデル:RNN, MLP1, MLP2, 基礎特性式 14
制御実験 結果 ● 目標軌道との平均二乗誤差は、 MLP1 < MLP2 < 基礎特性式 < RNN ● 定性的には、MLP以外は目標に 追従できているとは言えない 15
考察 学習実験 ● RNNやLSTMはMLPと比べて高精度な予測が可能であった → 時系列モデルがMcKibben人工筋の特性を捉えたモデル化に有効 ● 学習データが多いほど精度が向上した → データ収集をスケールさせる仕組みが重要であるという示唆 16
考察 制御実験 ● MLPのモデルを使用して軌道追従タスクを高精度で行うことができた → 学習した予測モデルを用いてMcKibben人工筋の制御ができる ● RNNのモデルが軌道追従タスクを解けなかった理由 → データ収集方法に問題があったと考えられる ● 制御実験に必要なデータが学習データに含まれていない ○ 制御実験は力一定のデータが必要 ○ データ収集時は長さと空気圧を制御したときの力を測定 → 力一定のデータがほとんど含まれなかった 17
まとめ まとめ ● ソフトロボットの高精度な制御を実現するために、McKibben型人工筋を 対象とし、予測モデルを学習ベースで獲得することを目指した ● 時系列モデルが人工筋の高精度な予測モデル学習に有効であった ● MLPベースの予測モデルを用いて制御タスクを高精度で行えた 今後の課題 ● より効率的にデータを収集する方法を考える ○ 実世界のタスクから収集が必要そうなデータを特定する 18
出典 [1] Do As I Can, Not As I Say: Grounding Language in Robotic Affordances [2] 新山 龍馬:やわらかいロボット, 金子書房 (2018) [3]脇元 修一:細径 McKibben 型人工筋の開発と用途開拓, 計測と制御, Vol. 57, No. 11, pp. 8 19