1K Views
March 03, 25
スライド概要
制御理論合宿2024での発表内容です。
2024年9月11日(水) 制御理論合宿 複数エージェント間の通信遅延に対する 協力型補償アプローチ ○藤田健人(博士後期3年)
2/23 自己紹介 (3分)
研究 3/23 研究自己紹介 • 名古屋大学 椿野チーム (群制御の研究、特に階層型制御) • 非線形システムに強い興味あり (非線形最適制御やリーブラケット運動) 階層ネットワーク型制御 自主ゼミ(坂野先生と)
人物 4/23 人物紹介 • 性格:マイペースで話好き • どこにでもいる • 先月までスペイン滞在(仲野先生のおかげ) 趣味 • 旅、将棋、卓球、バスケ サハラ砂漠 ガンジス川
5/23 研究概要 (オフレコ版4分)
モチベーション(オフレコ) 6/23 制御性能は情報集約に 僕 よりこうなって... その理論、通信遅延で破綻しない? 通信遅延考えなくて良いの? 有識者 通信遅延で性能落ちるから無意味 通信遅延で性能落ちないようにする 研究くらい誰かがやっとるわ! あれ、、、ない 作るかぁ(今回) (〜〜法を使えば遅延対策できると 目標:通信遅延で性能が全く落ちないようにしたい 言いたい)
今回の成果1:実用的な予測器を提案 7/23 安定性が大幅に向上! 遅れ補償なし 2 発散 1 0.5 0 -0.5 -1 2 Position (i= 1) Position (i= 2) Position (i= 1) Position (i= 2) 1.5 Position [m] Position [m] 1.5 提案手法 1 安定 0.5 0 収束 -0.5 0 5 10 15 Time [s] 20 25 30 -1 0 5 10 15 Time [s] 20 25 30
今回の成果2:Theoretical Tightness 通信遅延があたかもなくなった(無外乱時) 当初の目標を達成! 2 Position w ith proposed m ethod (i= 1) IdealPosition (i= 1) Position [m] 1.5 1 遅延なしと一致 0.5 0 -0.5 0 5 10 15 Time [s] 20 25 30 位置の時刻歴応答(エージェント1のみ) 8/23
9/23 研究概要 (4分)
予備資料:社会的背景(MASの話) 10/23 MASを知っていればスキップ スマートモビリティ社会 Society 5.0 Woven City 連携して宅配 ◼ モビリティにAIを搭載 交通・物流の自動化(スマート化) ◼ モビリティ同士の協調 より良い交通 ex. 交通渋滞緩和 大規模システムや トンネル内部では 中央集権型は困難 連携して配⾞ ニーズへの連携による対応
研究背景:通信遅延 マルチエージェントシステム (MAS) ◼ 通信が重要 通信遅延に弱い 通信遅延 古い情報 性能劣化 通信遅延補償が必要 11/23
遅延を打ち消す方法 直前で曲げようとする bad 12/23 未来の状態を予測 good! 現在 未来 過去の 入力履歴 現在 未来 ・・・ 急には曲がれない(入力遅延) 遅延を打ち消せる [1] 遅延には予測による補償が有効 [1] E. Fridman, “Introduction to time-delay systems: Analysis and control”, 2014
研究目的 13/23 目的 MAS の 通信遅れ補償 手段 他機状態を予測:過去 状態 + 他機入力履歴 → 現在状態予測 (入手不可) input Plant 1 state Controller 𝑁 state Controller 1 Plant 𝑁 input 通信遅れ MASでは他機の状態予測は不可能(とされてきた)
提案手法 14/23 信頼 (Trust) ◼ 入力履歴そのものを予測するための方法 ◼ 他エージェントによる状態予測は 正確 だと 思い込む(信頼) clairvoyance (千里眼) 予測 本当に正確な予測が可能 (後述) 図はイメージ
15/23 問題設定と提案手法 (4分)
問題設定 協調安定化問題 1 通信遅れ (一定時間 𝐿 ) 2 16/23 ダイナミクス(2機) 𝑥ሶ 1 𝑡 = 𝐴1 𝑥1 (𝑡) + 𝐵1 𝑢1 (𝑡) 𝑥1 (𝑡) 𝑦1 𝑡 = 𝑥2 (𝑡 − 𝐿) 𝑥ሶ 2 𝑡 = 𝐴2 𝑥2 (𝑡) + 𝐵2 𝑢2 (𝑡) 𝑥1 ∈ ℝ𝑛1 :状態 𝑢1 ∈ ℝ𝑚1 :制御入力 𝑦1 :観測出力 𝐿 ∈ ℝ :むだ時間 古い状態 𝑥1 (𝑡 − 𝐿) 𝑦2 𝑡 = 𝑥2 (𝑡) 制御入力 𝑢1 𝑡 = 𝐾11 𝑥1 (𝑡) + 𝐾12 𝑥2 (𝑡) 𝑢2 𝑡 = 𝐾21 𝑥1 (𝑡) + 𝐾22 𝑥2 (𝑡) 𝐵1 𝐾12 𝐴1 + 𝐵1 𝐾11 : Hurwitz 𝐵2 𝐾21 𝐴2 + 𝐵2 𝐾22 ↓ 遅れがなければ安定
問題設定 協調安定化問題 1 通信遅れ (一定時間 𝐿 ) 2 16/23 ダイナミクス(2機) 𝑥ሶ 1 𝑡 = 𝐴1 𝑥1 (𝑡) + 𝐵1 𝑢1 (𝑡) 𝑥1 (𝑡) 𝑦1 𝑡 = 𝑥2 (𝑡 − 𝐿) 𝑥ሶ 2 𝑡 = 𝐴2 𝑥2 (𝑡) + 𝐵2 𝑢2 (𝑡) 𝑥1 ∈ ℝ𝑛1 :状態 𝑢1 ∈ ℝ𝑚1 :制御入力 𝑦1 :観測出力 𝐿 ∈ ℝ :むだ時間 古い状態 𝑥1 (𝑡 − 𝐿) 𝑦2 𝑡 = 𝑥2 (𝑡) 制御入力 予測値 𝑢1 𝑡 = 𝐾11 𝑥1 (𝑡) + 𝐾12 𝑥ො2 (𝑡) 𝑢2 𝑡 = 𝐾21 𝑥ො1 (𝑡) + 𝐾22 𝑥2 (𝑡) 𝐵1 𝐾12 𝐴1 + 𝐵1 𝐾11 : Hurwitz 𝐵2 𝐾21 𝐴2 + 𝐵2 𝐾22 ↓ 遅れがなければ安定
予測方法 読み合い(本来) 機体 1 𝑡 − 2𝐿 信頼(提案手法) 通信遅延 機体 2 入力の履歴 𝑡−𝐿 17/23 𝑡 時刻 予測に用いる 仮定の変更 こちら → 相手は 通信遅延なし 𝑡−𝐿 𝑡 時刻 相手の制御入力 𝑢2 𝑡 = 𝐾21 𝑥ො1 (𝑡) + 𝐾22 𝑥2 (𝑡) 相手の予測に依存 相手の動きを予測するためには こちらがどう予測されているか 知る必要あり 𝑢ො 2|1 𝑡 = 𝐾21 𝑥1 (𝑡) + 𝐾22 𝑥2 (𝑡) 真値 相手の観測能力を信頼する (真値を観測していると思い込む)
信頼の具体的な計算 機体2に対する信頼 𝑢ො 2|1 𝑡 = 𝐾21 𝑥1 (𝑡) + 𝐾12 𝑥2 (𝑡) 真値と仮定する 予測値 18/23 2機全体の閉ループ行列 𝐵1 𝐾12 𝐹11 𝐹12 𝐴1 + 𝐵1 𝐾11 ≔ 𝐹21 𝐹22 𝐵2 𝐾21 𝐴2 + 𝐵2 𝐾22 𝑡 𝑥ො2|1 𝑡 = 𝑒 𝐹22𝐿 𝑥2 (𝑡 − 𝐿) + න 𝑒 𝐹22 𝑡−𝜏 𝐹21 𝑥1 𝜏 𝑑𝜏 𝑡−𝐿 自身の入力 𝑢1 𝑡 = 𝐾11 𝑥1 (𝑡) + 𝐾12 𝑥ො2 (𝑡) 𝑡 𝑢1 𝑡 = 𝐾11 𝑥1 𝑡 + 𝐾12 𝑒 𝐹22𝐿 𝑥2 (𝑡 − 𝐿) + 𝐾12 න 𝑒 𝐹22 𝑡−𝜏 𝐹21 𝑥1 𝜏 𝑑𝜏 𝑡−𝐿 機体1が利用できる情報だけで構成
19/23 信頼法の性能確認 (5分)
シミュレーション条件 二重積分器 (質点) 通信遅れ 1 [s] 𝑥1 20/23 ステップ幅 1.0 × 10−3 [s] 𝑥2 初期値 2 0 −1 0𝑇 全体の目標:相対位置の安定化 設計概念:階層的に達成 個々の目標:各々の位置を0 全体の目標:相対位置を0 制御ゲイン 𝐾 = 𝐼2 ⨂𝐾𝑖𝑛𝑑 + 1 −1 𝑇 1 −1 ⨂𝐾𝑐𝑝 𝐾𝑖𝑛𝑑 , 𝐾𝑐𝑝 ∈ ℝ2×2
シミュレーション結果(外乱なし) 21/23 大幅な性能改善を確認 2 Trust Truncated N o C om pensation Position [m] 1.5 1 既存手法(Truncated Predictor-based approach[2][3]) 𝑥ො2|1 𝑡 = 𝑒 𝐹22𝐿 𝑥2 (𝑡 − 𝐿) 𝐹22 :個のFBを施したA 0.5 提案手法(Trust) 0 -0.5 -1 𝑡 ある種の拡張? 𝑥ො2|1 𝑡 = 𝑒 𝐹22𝐿 𝑥2 (𝑡 − 𝐿) + න 𝑒 𝐹22 𝑡−𝜏 𝐹21 𝑥1 𝜏 𝑑𝜏 𝑡−𝐿 0 2 4 6 8 10 Time [s] [2] D. Yang et al., “Predictor-based control of time delay systems”, IJSS, 2022 [3] 渡部慶二, “むだ時間システムの制御”, SICE, 1992 𝑞𝑖𝑛𝑑 = 1 𝑞𝑐𝑝 = 10 LMI解有
補足:別シミュレーション結果(外乱なし) 22/23 8 # 10 提案手法は必ずしも万能ではない 10 Trust Truncated N o C om pensation 6 Position [m] 4 考察: 2 相手が安定 (Trustworthy) 0 -2 -4 提案手法(Trust)が効果的 -6 -8 個の安定性が極端に低い例 0 2 4 6 Time [s] 8 10 LMIによる裏付けあり [2] D. Yang et al., “Predictor-based control of time delay systems”, IJSS, 2022 [3] 渡部慶二, “むだ時間システムの制御”, SICE, 1992 𝑞𝑖𝑛𝑑 = 0.1 𝑞𝑐𝑝 = 100 LMI解有
まとめ 23/23 成果 ⚫ 「他機体はシステム全体の情報を正確に予測できている」という仮定による新 たな入力-状態予測法を提案 ⚫ 既存手法の調査(本手法は既存手法の(大きな)拡張だった) ⚫ シミュレーションでの比較による,本提案手法の効果を確認 発表外の内容 ⚫ Trustへのスムーズな切り替え手法を提案 (How to get “credit“ to start trust) ⚫ LMIベースで2機の場合の安定条件を導出 (What kinds of dynamics are “trustworthy”) ただし、LMI安定性を満たすことと数値シミュレーションの安定性は一致しないことがあり、要検討 ⚫ (無限個の)固有値のいくつかを確認して、安定性を数値的に確認 今後の課題 ⚫ N機での安定性証明
おわり
26/23 補足スライド
補足:シミュレーション結果(外乱あり) 27/23 外乱:0.3 dB W/s ホワイトノイズ × 1Hz ローパスフィルタ を15秒 外乱ありでも安定! 外乱が収まれば収束! 遅れ補償なし 2 発散 1 0.5 0 -0.5 -1 2 Position (i= 1) Position (i= 2) 1.5 Position [m] Position [m] 1.5 提案手法 機体1の位置 1 安定 0.5 0 収束 外乱終了 -0.5 0 5 10 15 Time [s] 20 25 30 -1 Position (i= 1) Position (i= 2) 0 5 10 15 Time [s] 20 25 30
補足:シミュレーション結果(外乱あり) 28/23 外乱:0.3 dB W/s ホワイトノイズ × 1Hz ローパスフィルタ を15秒 予測誤差システムが安定 位置の時刻歴応答 Position w ith proposed m ethod (i= 1) IdealPosition (i= 1) Position [m] 1.5 1 0.5 不一致(当然) 収束 0 -0.5 0 5 10 15 Time [s] 外乱終了 20 25 30 1 Predicted state and Real state 2 予測値の時刻歴応答 R ealstate ofposition (i= 1) Predicted state ofposition (i= 1) 0.8 0.6 0.4 ずれているが安定 0.2 収束 外乱終了 0 -0.2 0 5 10 15 Time [s] 20 25 30
補足:誤差システムに関するLMI 29/23 予測誤差システム 𝑥 𝑡 = 𝑥 𝑡 − 𝑥ො 𝑡 (=実際値 – 予測値) 定理(予測誤差システムの安定性) を満たす準正定行列 𝑃1 , 𝑃2 が存在すれば誤差システムは安定. (各係数行列については今回は説明割愛) 安定性の条件を導いた (詳細割愛) 今回のシミュレーション条件が これを満たすことを確認した(割愛)
要求条件 相手のダイナミクス 33/23 予測値 𝑡 𝑥ො 𝑡 = 𝑒 𝐴𝐿 𝑥(𝑡 − 𝐿) + 𝐵 න 𝑒 𝐴 𝑡−𝐿−𝜏 𝑢 𝜏 𝑑𝜏 𝑥ሶ 𝑡 = 𝐴𝑥(𝑡) + 𝐵𝑢(𝑡) 初期値𝑥(𝑡 − 𝐿)で解く 時間発展 過去の状態 𝑡−𝐿 入力の履歴の影響 機体 1 間に合わない 機体 2 入力の履歴 通信では獲得不可能 𝑡−𝐿 𝑡 時刻 情報伝達の様子 相手の入力履歴を予測する必要
信頼の具体的な計算 機体2に対する信頼 𝑢2 𝑡 = 𝐾21 𝑥1 (𝑡) + 𝐾12 𝑥2 (𝑡) 予測値 35/23 2機全体の閉ループ行列 𝐵1 𝐾12 𝐹11 𝐹12 𝐴1 + 𝐵1 𝐾11 ≔ 𝐹21 𝐹22 𝐵2 𝐾21 𝐴2 + 𝐵2 𝐾22 𝑡 𝑥ො2 𝑡 = 𝑒 𝐹22𝐿 𝑥2 (𝑡 − 𝐿) + න 𝑒 𝐹22 𝑡−𝜏 𝐹21 𝑥1 𝜏 𝑑𝜏 𝑡−𝐿 𝑢1 𝑡 = 𝐾11 𝑥1 (𝑡) + 𝐾12 𝑥ො2 (𝑡) 自身の入力 𝑡 𝑢1 𝑡 = 𝐾11 𝑥1 𝑡 + 𝐾12 𝑒 𝐹22𝐿 𝑥2 (𝑡 − 𝐿) + 𝐾12 න 𝑒 𝐹22 𝑡−𝜏 𝐹21 𝑥1 𝜏 𝑑𝜏 𝑡−𝐿 機体1が利用できる情報だけで構成 相手のダイナミクス 予測値 𝑡 𝑥ො 𝑡 = 𝑒 𝐴𝐿 𝑥(𝑡 − 𝐿) + 𝐵 න 𝑒 𝐴 𝑡−𝐿−𝜏 𝑢ො 𝜏 𝑑𝜏 𝑥ሶ 𝑡 = 𝐴𝑥(𝑡) + 𝐵𝑢(𝑡) ො 𝑡−𝐿 時間発展 信頼 初期値𝑥 𝑡 − 𝐿 過去の状態 入力の履歴の影響 で解く
信頼の帰納的な成立 ある時間区間 𝑡0 − 𝐿, 𝑡0 で両機体の互いの状態予測が正確 定義 〃 どのような状況かは後述 で両機体の相手に対する信頼が成立 相手状態の正確な予測可能 𝑡0 − 𝐿 + 𝑑𝑡, 𝑡0 + 𝑑𝑡 で両機体の相手に対する信頼が成立 くりかえし ↓ 時刻 𝑡0 以降で両機体の相手に対する信頼が常に成立 最初の区間だけ成り立てば常に成り立つ (理想環境下では時刻 𝑡0 以降の両機体の互いの状態予測が正確) 38/23