[DEIM2019]スマートフォンの位置変化の影響を考慮した両足ジェスチャ認識手法

314 Views

March 25, 19

#Gesture recognition #Smartphone #Dataset creation #Navigation #Input method

スライド概要

DEIM2019で使用したスライド

Nakamura Laboratory (Meiji University)

@nkmr-lab

スライド一覧

明治大学総合数理学部先端メディアサイエンス学科中村聡史研究室

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

周辺視野に対するぼかしエフェクトが作業時の集中力に及ぼす影響の調査

Nakamura Laboratory (Meiji University) 25.7K

商品選択においてフォントがユーザの選択行動に及ぼす影響の調査

Nakamura Laboratory (Meiji University) 17.3K

手書きとフォントの文字形状の違いによる記憶効果の比較

Nakamura Laboratory (Meiji University) 17.3K

Make-up FLOW 2.0: 美容系YouTuberの化粧フローチャートの共有・取り入れ手法

化粧メイク化粧工程フローチャート美容系youtuber 取り入れ

Nakamura Laboratory (Meiji University) 15.8K

周辺視野における妨害刺激の減衰が集中度に及ぼす影響

Nakamura Laboratory (Meiji University) 14.2K

色覚特性を考慮したゲームの有利不利制御のAmong Usを用いた検証

色覚多様性者模擬フィルタ色のハンディキャップオンラインゲーム

Nakamura Laboratory (Meiji University) 12.8K

各ページのテキスト

スマートフォンの位置変化の影響を考慮した両足ジェスチャ認識手法田村柾優紀（明治大学大学院先端数理科学研究科）中村聡史（明治大学）

提案手法 (デモ動画)

背景 (デバイスの主な操作方法) • 環境にあるデバイスを操作する際には主に手による操作と、音声による操作が考えられる • 音声による操作は手が使えない状況や使いたくない状況で主に使用される

背景 (デバイスの主な操作方法) • 環境にあるデバイスを操作する際には主に短期間に何度も行わない手による操作と、音声による操作が考えられる操作には便利 • 音声による操作は手が使えない状況や使いたくない状況で主に使用される

背景 (デバイスの主な操作方法) • 環境にあるデバイスを操作する際には主に短期間に何度も行わない手による操作と、音声による操作が考えられる操作には便利 • 音声による操作は手が使えない状況や使いたくない状況で主に使用される何度も同じ操作をするのは手間が大きい

音声タンギングによる操作 Voice as Sound: Using Non-verbal Voice Input for Interactive Control[2015 Igarashi] 一度に操作が必要な場合における手間の問題を解決

背景 1ページ読み終わってからページ遷移させたい状況ザッピング一度に操作するわけではないが同じような操作が何回も必要となる時には音声認識での操作は手間

背景 (音声認識) 楽譜を見ながら大きな音が出て子供を寝かし楽器を演奏しまうような料理中つけてる時音声認識による操作が向かない状況

関連研究 (足によるジェスチャ) • ShoeSoleSense: Proof of Concept for a Wearable Foot Interface for Virtual and Real Environments[2013 Matthies] 靴のソールに圧力センサを取り付け足のジェスチャを認識 • Exploring Subtle Foot Plantar-based Gestures with Sock-placed Pressure Sensors[2015 Fukahori] 靴下に圧力センサを取り付け足のジェスチャを認識

10.

関連研究 (足によるジェスチャ) • ShoeSoleSense: Proof of Concept for a Wearable Foot Interface for Virtual and Real Environments[2013 Matthies] 靴のソールに圧力センサを取り付け足のジェス新たにデバイスを取り付けるのはチャを認識手間がかかる • Exploring Subtle Foot Plantar-based Gestures with Sock-placed Pressure Sensors[2015 Fukahori] 靴下に圧力センサを取り付け足のジェスチャを認識

11.

関連研究 (足によるジェスチャ) • Sensing Foot Gestures from the Pocket [J.Scott 2010] • ズボンのポケット内のスマートフォンによるジェスチャ認識 • 片足のみ • 加速度センサのみ

12.

関連研究 (足によるジェスチャ) • Sensing Foot Gestures from the Pocket [J.Scott 2010] • ズボンのポケット内のスマートフォンによるジェスチャ認識前ポケットでの認識精度が低い • 片足のみ • 加速度センサのみ

13.

関連研究 (足によるジェスチャ) • Sensing Foot Gestures from the Pocket [J.Scott 2010] • ズボンのポケット内のスマートフォンによるジェスチャ認識前ポケットでの認識精度が低い • 片足のみ • 加速度センサのみ入れる向きや位置による認識精度への影響が未考慮

14.

背景 (両足ジェスチャ) 左右同じシンプルなジェスチャで前後移動的な操作が可能

15.

これまでの取り組みまとめポケット内のスマートフォンによる両足ジェスチャ認識手法の提案と分析 [田村 2017] 1. 両足ジェスチャにおけるセンサデータのデータセットを構築 →データセット構築手法に問題があった 2. 加速度・角速度・マイクセンサを用いた提案手法の両足ジェスチャの認識精度を評価 →提案手法における精度が十分ではなかった 3. 精度評価の結果をもとに実環境での使用実験 →認識時間が長く、評価が低かった →スマホの向きに制限があった

16.

本研究の目的ポケット内のスマートフォンを利用した日常的に利用可能な両足ジェスチャ操作手法の確立

17.

本研究のアプローチ 1 2 データセット作成手法の改善特徴量と分類器の再検討特徴量を増やすよ 3 4 認識時間の短縮様々な向きのスマホの向きに対応

18.

従来のデータセットの問題 • 切り替わりのタイミングが把握し辛い • センシング周波数が30[Hz]で、センシング回数が少ないジェスチャ開始タイミングのぶれを改善したデータセット構築システムを新たに提案

19.

データセット構築システム • 音楽ゲームのプレイ中のUIを参考に以下の様なタスク提示システムを実装 • スマホのセンシング周波数を50[Hz]に変更

20.

本研究のアプローチ 1 データセット作成手法の改善 2 特徴量と分類器の再検討特徴量を増やすよ 3 4 認識時間の短縮様々な向きのスマホの向きに対応

21.

精度改善のため認識手法の再検討ジェスチャ開始地点 [m/s^2] [フレーム]

22.

精度改善のため認識手法の再検討ジェスチャ開始地点最大値 [m/s^2] 最小値 [フレーム]

23.

精度改善のため認識手法の再検討ジェスチャ開始地点最大値中央値平均値 [m/s^2] 最小値 [フレーム]

24.

精度改善のため認識手法の再検討 • これまでの研究における認識 • 特徴量：最大値・最小値 • 分類器：SVM • センシング周波数：30[Hz] • 本研究における認識 • 特徴量：最大値・最小値・平均値・中央値 • 分類器：Random Forest • センシング周波数：50[Hz]

25.

データセット再構築 • 実験協力者：20歳～24歳の15人 • ジェスチャ回数 • 左右の足による踵の上げ下げをランダムに200回 • 使用センサ • 加速度センサ・角速度センサ・マイク • センシング周波数：【今回】約50[Hz]

26.

精度改善のため認識手法の再検討これまでの研究本研究 F-measure 0.933 0.986 特徴量と分類器、サンプリング周波数を変更したことにより認識精度が改善

27.

本研究のアプローチ 1 データセット作成手法の改善 2 特徴量と分類器の再検討特徴量を増やすよ 3 4 認識時間の短縮様々な向きのスマホの向きに対応

28.

望ましいシステム応答時間 [Miller 1968]の研究を参考に、ユーザがジェスチャを開始してから200[ms]（10フレーム）以内にジェスチャを認識ジェスチャ開始地点 [m/s^2] [フレーム]

29.

望ましいシステム応答時間 [Miller 1968]の研究を参考に、ユーザがジェスチャを開始してから200[ms]（10フレーム）以内にジェスチャを認識ジェスチャ開始地点 500[ms]（25フレーム） [m/s^2] [フレーム]

30.

望ましいシステム応答時間 [Miller 1968]の研究を参考に、ユーザがジェスチャを開始してから200[ms]（10フレーム）以内にジェスチャを認識ジェスチャ開始地点 500[ms]（25フレーム） [m/s^2] 200[ms]（10フレーム） [フレーム]

31.

予備動作を用いた認識仮説：ジェスチャを開始する直前の構えの動作を用いることで、認識精度の悪化を軽減可能ジェスチャ開始地点 [m/s^2] 予備動作 200[ms]（10フレーム） [フレーム]

32.

33.

精度改善のため認識手法の再検討 10フレーム[200ms] ジェスチャ開始タイミング後タイミング前 9 10 15 0 予備動作なし 0.870 0.881 0.925 10 予備動作使用 0.878 0.897 0.937 予備動作を利用して生成した特徴ベクトルの方が認識精度が高い

34.

精度改善のため認識手法の再検討 10フレーム[200ms] ジェスチャ開始タイミング後タイミング前 9 10 15 0 予備動作なし 0.870 0.881 0.925 10 予備動作使用 0.878 0.897 0.937 予備動作を利用して生成した認識精度には課題が残る特徴ベクトルの方が認識精度が高い

35.

本研究のアプローチ 1 データセット作成手法の改善 2 特徴量と分類器の再検討特徴量を増やすよ 3 4 認識時間の短縮様々な向きのスマホの向きに対応

36.

向きと位置による影響を考慮した認識手法スマホのポケット内での向きのパターン向きと位置の変化による影響を軽減するため傾斜情報を利用

37.

向きと位置による影響を考慮した認識手法比較する手法 • 従来手法：加速度・角速度・マイク • 提案手法：加速度・角速度・マイク・傾斜情報 • 特徴量：最大値・最小値・平均値・中央値 • 分類器：Random Forest • サンプリング周波数：約50[Hz]

38.

向きと位置による影響右足の前ポケットに4パターンの向きで入れたデータで学習させた分類器を用いた際のそれそれの向きでの認識精度向き平均手法 Precision Recall F-measure 従来手法 0.887 0.878 0.883 提案手法 0.900 0.895 0.898 傾きの特徴を用いることで向きによる影響を軽減

39.

総合考察 • 予備動作をセンシング可能なデータセット構築システムを実装し、予備動作を用いることで、認識精度が改善 • 他のジェスチャ認識の研究においても、予備動作を用いることで認識精度改善や認識時間短縮が可能 • 位置変化による認識精度の影響を、傾斜情報を用いることで影響を軽減可能 • 位置が固定されないデバイスを用いたジェスチャ認識の研究ではこの知見を活用可能

40.

まとめ位置変化に対応し、予備動作を用いた認識手法を用いた両足ジェスチャ認識手法を検討 • これまでの提案手法による認識精度が低い →再検討した特徴量を使用することで認識精度が改善 • 認識に時間がかかりすぎた →予備動作を使用することで認識精度が改善されたが認識精度は十分でない • 使用時のポケット内での向きと位置による影響が未考慮 →傾きの特徴量を使用することで向きと位置による影響を軽減