複数エージェント間の通信遅延に対する協力型補償アプローチ

1.6K Views

March 03, 25

#制御理論 #複数エージェントシステム #通信遅延 #予測制御 #協調制御

スライド概要

制御理論合宿2024での発表内容です。
ジャーナル論文：
K. Fujita and D. Tsubakino, "A Predictor-Based Approach to Communication Delay Compensation for Multi-Agent Systems," in IEEE Access, vol. 12, pp. 196148-196158, 2024, doi: 10.1109/ACCESS.2024.3520957

KentoFujita

@8659274464

スライド一覧

Japan

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

（ダウンロード不可）

関連スライド

学振特別研究員になるために～2025年度申請版

学振 dc1 dc2 jsps pd

大上雅史 759.2K

研究に使える便利なフリーソフト ImageJ

imagej 放射線技師

片山豊 353.5K

StampFlyで学ぶマルチコプタ制御

伊藤恒平 336.1K

大規模言語モデルに追加学習で専門知識を教える試み (2023, arXiv:2312.03360)

Kan Hatakeyama 297.7K

ZAZA株式会社_会社紹介

ZAZA株式会社 281.1K

東京大学 3Dスキャン勉強会「フォトグラメトリ」

フォトグラメトリ vr 3dデジタルアーカイブ

龍 lilea 270.9K

各ページのテキスト

2024年9月11日（水）制御理論合宿複数エージェント間の通信遅延に対する協力型補償アプローチ ○藤田健人（博士後期3年）

2/23 自己紹介（3分）

研究 3/23 研究自己紹介 • 名古屋大学椿野チーム（群制御の研究、特に階層型制御） • 非線形システムに強い興味あり（非線形最適制御やリーブラケット運動）階層ネットワーク型制御自主ゼミ（坂野先生と）

人物 4/23 人物紹介 • 性格：マイペースで話好き • どこにでもいる • 先月までスペイン滞在（仲野先生のおかげ）趣味 • 旅、将棋、卓球、バスケサハラ砂漠ガンジス川

5/23 研究概要（オフレコ版4分）

モチベーション（オフレコ） 6/23 制御性能は情報集約に僕よりこうなって... その理論、通信遅延で破綻しない？通信遅延考えなくて良いの？有識者通信遅延で性能落ちるから無意味通信遅延で性能落ちないようにする研究くらい誰かがやっとるわ！あれ、、、ない作るかぁ（今回）（〜〜法を使えば遅延対策できると目標：通信遅延で性能が全く落ちないようにしたい言いたい）

今回の成果1：実用的な予測器を提案 7/23 安定性が大幅に向上！遅れ補償なし 2 発散 1 0.5 0 -0.5 -1 2 Position (i= 1) Position (i= 2) Position (i= 1) Position (i= 2) 1.5 Position [m] Position [m] 1.5 提案手法 1 安定 0.5 0 収束 -0.5 0 5 10 15 Time [s] 20 25 30 -1 0 5 10 15 Time [s] 20 25 30

今回の成果2：Theoretical Tightness 通信遅延があたかもなくなった（無外乱時）当初の目標を達成！ 2 Position w ith proposed m ethod (i= 1) IdealPosition (i= 1) Position [m] 1.5 1 遅延なしと一致 0.5 0 -0.5 0 5 10 15 Time [s] 20 25 30 位置の時刻歴応答（エージェント1のみ） 8/23

9/23 研究概要（4分）

10.

予備資料：社会的背景（MASの話） 10/23 MASを知っていればスキップスマートモビリティ社会 Society 5.0 Woven City 連携して宅配 ◼ モビリティにAIを搭載交通・物流の自動化（スマート化） ◼ モビリティ同士の協調より良い交通 ex. 交通渋滞緩和大規模システムやトンネル内部では中央集権型は困難連携して配⾞ニーズへの連携による対応

11.

研究背景：通信遅延マルチエージェントシステム (MAS) ◼ 通信が重要通信遅延に弱い通信遅延古い情報性能劣化通信遅延補償が必要 11/23

12.

遅延を打ち消す方法直前で曲げようとする bad 12/23 未来の状態を予測 good! 現在未来過去の入力履歴現在未来・・・急には曲がれない（入力遅延）遅延を打ち消せる [1] 遅延には予測による補償が有効 [1] E. Fridman, “Introduction to time-delay systems: Analysis and control”, 2014

13.

研究目的 13/23 目的 MAS の通信遅れ補償手段他機状態を予測：過去状態 + 他機入力履歴 → 現在状態予測（入手不可） input Plant 1 state Controller 𝑁 state Controller 1 Plant 𝑁 input 通信遅れ MASでは他機の状態予測は不可能（とされてきた）

14.

提案手法 14/23 信頼 (Trust) ◼ 入力履歴そのものを予測するための方法 ◼ 他エージェントによる状態予測は正確だと思い込む（信頼） clairvoyance （千里眼）予測本当に正確な予測が可能（後述）図はイメージ

15.

15/23 問題設定と提案手法（4分）

16.

問題設定協調安定化問題 1 通信遅れ（一定時間 𝐿 ） 2 16/23 ダイナミクス（2機） 𝑥ሶ 1 𝑡 = 𝐴1 𝑥1 (𝑡) + 𝐵1 𝑢1 (𝑡) 𝑥1 (𝑡) 𝑦1 𝑡 = 𝑥2 (𝑡 − 𝐿) 𝑥ሶ 2 𝑡 = 𝐴2 𝑥2 (𝑡) + 𝐵2 𝑢2 (𝑡) 𝑥1 ∈ ℝ𝑛1 ：状態 𝑢1 ∈ ℝ𝑚1 ：制御入力 𝑦1 ：観測出力 𝐿 ∈ ℝ ：むだ時間古い状態 𝑥1 (𝑡 − 𝐿) 𝑦2 𝑡 = 𝑥2 (𝑡) 制御入力 𝑢1 𝑡 = 𝐾11 𝑥1 (𝑡) + 𝐾12 𝑥2 (𝑡) 𝑢2 𝑡 = 𝐾21 𝑥1 (𝑡) + 𝐾22 𝑥2 (𝑡) 𝐵1 𝐾12 𝐴1 + 𝐵1 𝐾11 : Hurwitz 𝐵2 𝐾21 𝐴2 + 𝐵2 𝐾22 ↓ 遅れがなければ安定

17.

問題設定協調安定化問題 1 通信遅れ（一定時間 𝐿 ） 2 16/23 ダイナミクス（2機） 𝑥ሶ 1 𝑡 = 𝐴1 𝑥1 (𝑡) + 𝐵1 𝑢1 (𝑡) 𝑥1 (𝑡) 𝑦1 𝑡 = 𝑥2 (𝑡 − 𝐿) 𝑥ሶ 2 𝑡 = 𝐴2 𝑥2 (𝑡) + 𝐵2 𝑢2 (𝑡) 𝑥1 ∈ ℝ𝑛1 ：状態 𝑢1 ∈ ℝ𝑚1 ：制御入力 𝑦1 ：観測出力 𝐿 ∈ ℝ ：むだ時間古い状態 𝑥1 (𝑡 − 𝐿) 𝑦2 𝑡 = 𝑥2 (𝑡) 制御入力予測値 𝑢1 𝑡 = 𝐾11 𝑥1 (𝑡) + 𝐾12 𝑥ො2 (𝑡) 𝑢2 𝑡 = 𝐾21 𝑥ො1 (𝑡) + 𝐾22 𝑥2 (𝑡) 𝐵1 𝐾12 𝐴1 + 𝐵1 𝐾11 : Hurwitz 𝐵2 𝐾21 𝐴2 + 𝐵2 𝐾22 ↓ 遅れがなければ安定

18.

予測方法読み合い（本来）機体 1 𝑡 − 2𝐿 信頼（提案手法）通信遅延機体 2 入力の履歴 𝑡−𝐿 17/23 𝑡 時刻予測に用いる仮定の変更こちら → 相手は通信遅延なし 𝑡−𝐿 𝑡 時刻相手の制御入力 𝑢2 𝑡 = 𝐾21 𝑥ො1 (𝑡) + 𝐾22 𝑥2 (𝑡) 相手の予測に依存相手の動きを予測するためにはこちらがどう予測されているか知る必要あり 𝑢ො 2|1 𝑡 = 𝐾21 𝑥1 (𝑡) + 𝐾22 𝑥2 (𝑡) 真値相手の観測能力を信頼する（真値を観測していると思い込む）

19.

信頼の具体的な計算機体2に対する信頼 𝑢ො 2|1 𝑡 = 𝐾21 𝑥1 (𝑡) + 𝐾12 𝑥2 (𝑡) 真値と仮定する予測値 18/23 2機全体の閉ループ行列 𝐵1 𝐾12 𝐹11 𝐹12 𝐴1 + 𝐵1 𝐾11 ≔ 𝐹21 𝐹22 𝐵2 𝐾21 𝐴2 + 𝐵2 𝐾22 𝑡 𝑥ො2|1 𝑡 = 𝑒 𝐹22𝐿 𝑥2 (𝑡 − 𝐿) + න 𝑒 𝐹22 𝑡−𝜏 𝐹21 𝑥1 𝜏 𝑑𝜏 𝑡−𝐿 自身の入力 𝑢1 𝑡 = 𝐾11 𝑥1 (𝑡) + 𝐾12 𝑥ො2 (𝑡) 𝑡 𝑢1 𝑡 = 𝐾11 𝑥1 𝑡 + 𝐾12 𝑒 𝐹22𝐿 𝑥2 (𝑡 − 𝐿) + 𝐾12 න 𝑒 𝐹22 𝑡−𝜏 𝐹21 𝑥1 𝜏 𝑑𝜏 𝑡−𝐿 機体1が利用できる情報だけで構成

20.

19/23 信頼法の性能確認（5分）

21.

シミュレーション条件二重積分器（質点）通信遅れ 1 [s] 𝑥1 20/23 ステップ幅 1.0 × 10−3 [s] 𝑥2 初期値 2 0 −1 0𝑇 全体の目標：相対位置の安定化設計概念：階層的に達成個々の目標：各々の位置を0 全体の目標：相対位置を0 制御ゲイン 𝐾 = 𝐼2 ⨂𝐾𝑖𝑛𝑑 + 1 −1 𝑇 1 −1 ⨂𝐾𝑐𝑝 𝐾𝑖𝑛𝑑 , 𝐾𝑐𝑝 ∈ ℝ2×2

22.

シミュレーション結果（外乱なし） 21/23 大幅な性能改善を確認 2 Trust Truncated N o C om pensation Position [m] 1.5 1 既存手法（Truncated Predictor-based approach[2][3]） 𝑥ො2|1 𝑡 = 𝑒 𝐹22𝐿 𝑥2 (𝑡 − 𝐿) 𝐹22 :個のFBを施したA 0.5 提案手法（Trust） 0 -0.5 -1 𝑡 ある種の拡張？ 𝑥ො2|1 𝑡 = 𝑒 𝐹22𝐿 𝑥2 (𝑡 − 𝐿) + න 𝑒 𝐹22 𝑡−𝜏 𝐹21 𝑥1 𝜏 𝑑𝜏 𝑡−𝐿 0 2 4 6 8 10 Time [s] [2] D. Yang et al., “Predictor-based control of time delay systems”, IJSS, 2022 [3] 渡部慶二, “むだ時間システムの制御”, SICE, 1992 𝑞𝑖𝑛𝑑 = 1 𝑞𝑐𝑝 = 10 LMI解有

23.

補足：別シミュレーション結果（外乱なし） 22/23 8 # 10 提案手法は必ずしも万能ではない 10 Trust Truncated N o C om pensation 6 Position [m] 4 考察： 2 相手が安定 (Trustworthy) 0 -2 -4 提案手法（Trust）が効果的 -6 -8 個の安定性が極端に低い例 0 2 4 6 Time [s] 8 10 LMIによる裏付けあり [2] D. Yang et al., “Predictor-based control of time delay systems”, IJSS, 2022 [3] 渡部慶二, “むだ時間システムの制御”, SICE, 1992 𝑞𝑖𝑛𝑑 = 0.1 𝑞𝑐𝑝 = 100 LMI解有

24.

まとめ 23/23 成果 ⚫ 「他機体はシステム全体の情報を正確に予測できている」という仮定による新たな入力-状態予測法を提案 ⚫ 既存手法の調査（本手法は既存手法の（大きな）拡張だった） ⚫ シミュレーションでの比較による，本提案手法の効果を確認発表外の内容 ⚫ Trustへのスムーズな切り替え手法を提案 (How to get “credit“ to start trust) ⚫ LMIベースで2機の場合の安定条件を導出 (What kinds of dynamics are “trustworthy”) ただし、LMI安定性を満たすことと数値シミュレーションの安定性は一致しないことがあり、要検討 ⚫ （無限個の）固有値のいくつかを確認して、安定性を数値的に確認今後の課題 ⚫ N機での安定性証明

25.

おわり

26.

26/23 補足スライド

27.

補足：シミュレーション結果（外乱あり） 27/23 外乱：0.3 dB W/s ホワイトノイズ × 1Hz ローパスフィルタを15秒外乱ありでも安定！外乱が収まれば収束！遅れ補償なし 2 発散 1 0.5 0 -0.5 -1 2 Position (i= 1) Position (i= 2) 1.5 Position [m] Position [m] 1.5 提案手法機体1の位置 1 安定 0.5 0 収束外乱終了 -0.5 0 5 10 15 Time [s] 20 25 30 -1 Position (i= 1) Position (i= 2) 0 5 10 15 Time [s] 20 25 30

28.

補足：シミュレーション結果（外乱あり） 28/23 外乱：0.3 dB W/s ホワイトノイズ × 1Hz ローパスフィルタを15秒予測誤差システムが安定位置の時刻歴応答 Position w ith proposed m ethod (i= 1) IdealPosition (i= 1) Position [m] 1.5 1 0.5 不一致（当然）収束 0 -0.5 0 5 10 15 Time [s] 外乱終了 20 25 30 1 Predicted state and Real state 2 予測値の時刻歴応答 R ealstate ofposition (i= 1) Predicted state ofposition (i= 1) 0.8 0.6 0.4 ずれているが安定 0.2 収束外乱終了 0 -0.2 0 5 10 15 Time [s] 20 25 30

29.

補足：誤差システムに関するLMI 29/23 予測誤差システム 𝑥෤ 𝑡 = 𝑥 𝑡 − 𝑥ො 𝑡 （=実際値 – 予測値）定理（予測誤差システムの安定性）を満たす準正定行列 𝑃1 , 𝑃2 が存在すれば誤差システムは安定．（各係数行列については今回は説明割愛）安定性の条件を導いた（詳細割愛）今回のシミュレーション条件がこれを満たすことを確認した（割愛）

30.

要求条件相手のダイナミクス 33/23 予測値 𝑡 𝑥ො 𝑡 = 𝑒 𝐴𝐿 𝑥(𝑡 − 𝐿) + 𝐵 න 𝑒 𝐴 𝑡−𝐿−𝜏 𝑢 𝜏 𝑑𝜏 𝑥ሶ 𝑡 = 𝐴𝑥(𝑡) + 𝐵𝑢(𝑡) 初期値𝑥(𝑡 − 𝐿)で解く時間発展過去の状態 𝑡−𝐿 入力の履歴の影響機体 1 間に合わない機体 2 入力の履歴通信では獲得不可能 𝑡−𝐿 𝑡 時刻情報伝達の様子相手の入力履歴を予測する必要

31.

信頼の具体的な計算機体2に対する信頼 𝑢2 𝑡 = 𝐾21 𝑥1 (𝑡) + 𝐾12 𝑥2 (𝑡) 予測値 35/23 2機全体の閉ループ行列 𝐵1 𝐾12 𝐹11 𝐹12 𝐴1 + 𝐵1 𝐾11 ≔ 𝐹21 𝐹22 𝐵2 𝐾21 𝐴2 + 𝐵2 𝐾22 𝑡 𝑥ො2 𝑡 = 𝑒 𝐹22𝐿 𝑥2 (𝑡 − 𝐿) + න 𝑒 𝐹22 𝑡−𝜏 𝐹21 𝑥1 𝜏 𝑑𝜏 𝑡−𝐿 𝑢1 𝑡 = 𝐾11 𝑥1 (𝑡) + 𝐾12 𝑥ො2 (𝑡) 自身の入力 𝑡 𝑢1 𝑡 = 𝐾11 𝑥1 𝑡 + 𝐾12 𝑒 𝐹22𝐿 𝑥2 (𝑡 − 𝐿) + 𝐾12 න 𝑒 𝐹22 𝑡−𝜏 𝐹21 𝑥1 𝜏 𝑑𝜏 𝑡−𝐿 機体1が利用できる情報だけで構成相手のダイナミクス予測値 𝑡 𝑥ො 𝑡 = 𝑒 𝐴𝐿 𝑥(𝑡 − 𝐿) + 𝐵 න 𝑒 𝐴 𝑡−𝐿−𝜏 𝑢ො 𝜏 𝑑𝜏 𝑥ሶ 𝑡 = 𝐴𝑥(𝑡) + 𝐵𝑢(𝑡) ො 𝑡−𝐿 時間発展信頼初期値𝑥 𝑡 − 𝐿 過去の状態入力の履歴の影響で解く

32.

信頼の帰納的な成立ある時間区間 𝑡0 − 𝐿, 𝑡0 で両機体の互いの状態予測が正確定義〃どのような状況かは後述で両機体の相手に対する信頼が成立相手状態の正確な予測可能 𝑡0 − 𝐿 + 𝑑𝑡, 𝑡0 + 𝑑𝑡 で両機体の相手に対する信頼が成立くりかえし ↓ 時刻 𝑡0 以降で両機体の相手に対する信頼が常に成立最初の区間だけ成り立てば常に成り立つ（理想環境下では時刻 𝑡0 以降の両機体の互いの状態予測が正確） 38/23

複数エージェント間の通信遅延に対する 協力型補償アプローチ