Visual Relocalization

9.2K Views

November 21, 24

#Visual Relocalization #SLAM #位置推定 #コンピュータビジョン #COLMAP

スライド概要

株式会社サイバーエージェントで取り組んでいる Visual Relocalization のご紹介です。

データセットはパートナーであるサツドラホールディングス株式会社様の EZOHUB TOKYO で取得しています。

Takeshi Ishita

@IshitaTakeshi

スライド一覧

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

ROSConJP 2024 LT

Takeshi Ishita 1.6K

ROSJP LT Raspberry Pi で動かすカメラベースオドメトリ推定

Takeshi Ishita 1.1K

CLIP による店舗内商品検索

Takeshi Ishita 1.1K

猫でも分かるUnreal Engineの学び方 - 超初心者向け編 - 2023 v1.0

ue4 ue5 ue-beginner

エピックゲームズジャパン 1.6M

Unreal Engine5 Lumenの仕組みと肝心なところ

ue5 ue-rendering ue-lumen

エピックゲームズジャパン 1.3M

Meta XR SDK(V66-74)でQuestアプリを開発

spatial anchor unity quest pro shaperecognizeractivatestate oculus integration transformfeaturestateprovider building blocks transformrecognizeractivestate ovrsemanticclassification jointdeltaprovider ovrscenemanager jointvelocityactivestate オクルージョン sequenceactivestate scene manager ambisonic depth api metaxraudiosource playerlocomotor meta xr sdk quest3 ovrplayercontroller マルチモーダル meta haptics studio direct touch ui meta xr haptics sdk ovrspatialanchor ovrtrackedkeyboard hapticclipplayer fingerfeaturestateprovider hapticclip ワイドモーションモード wmm mruk mr utility kit voice sdk jointrotationactivestate meta horizon os ui set asw application spacewarp ovr metrics tool unityscene manager colocation discovery コロケーション mx ink passthrough camera api hand tracking microgestures webcamtexturemanager passthroughcamerautils cameraviewermanager hand pose selector recorder

あうぜん 1.1M

各ページのテキスト

第48回ロボティクス勉強会 Visual Relocalization CyberAgent AI Lab 石田岳志

石田岳志 Takeshi Ishita ● 所属: ○ CyberAgent AI Lab ● 出身: ○ 山梨県笛吹市 ○ 桃がたくさん採れる写真 ● 学歴: ○ 東京高専専攻科 (学士) ● 専門: ○ Visual SLAM, Visual Localization ○ LiDAR SLAM (ちょっと)

目指すもの学術貢献事業貢献自己位置推定 3次元復元環境理解

手軽に導入可能な位置推定 LiDAR… まだちょっと値段が高いカメラ... 物体認識にも使えるし安い今回は地図に対するカメラの位置推定をご紹介

Visual Relocalization 地図上でカメラがどこにあるのかを推定する問題

2つのステップ：地図復元と位置推定 COLMAP での地図復元 RGB画像 COLMAP 画像特徴つき点群地図位置推定 RGB画像画像特徴つき点群地図 6DoF カメラ姿勢

https://colmap.github.io

今回は位置推定を解説 COLMAP での地図復元 RGB画像 COLMAP 画像特徴つき点群地図位置推定 RGB画像画像特徴つき点群地図 6DoF カメラ姿勢

https://colmap.github.io

実際に位置推定してみる 8

画像から地図を作る：データの収集パートナーであるサツドラホールディングス株式会社様の EZOHUB TOKYO でデータ取得 RealSense D455 の RGB カメラを利用 ● 視野角が広い ● キャリブレーションパラメータがわかりやすい

https://ezohub.jp/office/tokyo/

10.

画像から地図を作る：COLMAPによる地図復元画像の情報が埋め込まれている → 姿勢推定に利用できる赤いものはカメラ姿勢

11.

入力画像と地図をマッチングし、位置推定緑枠：推定成功赤枠：推定失敗動画は4倍速 https://www.youtube.com/watch?v=OBBnJqUkoQg パートナーであるサツドラホールディングス株式会社様のご協力のもと EZOHUB TOKYO でデータを取得しました

12.

動作の仕組み 12

13.

3ステップで位置推定 1. 画像検索入力画像と特徴点マッチングできる画像を地図から探す 2. マッチング入力画像の特徴点と地図内の3次元点を結びつける 3. 姿勢推定 2次元点と3次元点の対応からカメラ姿勢を求める

14.

前提：カメラの表現カメラはどのように物体を見ている？ 3次元点を2次元点に投影する

15.

前提：地図の表現地図は 2次元点と3次元点の対応で表現される

16.

姿勢推定の手順：画像フレームを入力する姿勢推定したい画像フレームを入力する

17.

姿勢推定の手順：画像検索入力フレームと特徴点マッチング可能な画像を地図フレームの中から探す

18.

姿勢推定の手順：画像検索特徴点マッチングするフレームを指定する

19.

姿勢推定の手順：マッチング地図内のフレームに対して特徴点マッチングを行う入力画像の2次元点と地図内の3次元点の対応関係が得られる

20.

姿勢推定の手順得られた対応関係を使ってカメラの姿勢を推定する PnP問題というよく知られた問題に落とし込めるので簡単にカメラ姿勢推定できる

21.

カメラによる姿勢推定の利点・欠点利点 ● 安価なセンサで位置推定可能 ● 省スペース、省電力欠点 ● 地図作成に時間がかかる ● 地図と特徴点マッチングできない画像の姿勢は推定できない ● 入力画像ごとに地図を全探索しているため、遅い ○ オドメトリ推定と組み合わせることで改善可能

22.

Relocalizationのコードとデータを公開しています！！リポジトリURL: github.com/CyberAgentAILab/visual-relocalization-colmap データセットURL: huggingface.co/datasets/cyberagent/in-store-visual-localization パートナーであるサツドラホールディングス株式会社様のご協力のもと EZOHUB TOKYO でデータを取得しました

23.

今後の予定地図環境の理解 ● 何がどこに写っているのか ● 店舗で使う場合、商品の種類や位置を知りたいオドメトリと組み合わせて高速化 ● 高速で滑らかな動作を目指す