聴衆の知覚音量バランス推定と可視化によるドラム練習支援手法

1.1K Views

March 02, 22

#ドラム #音量バランス #可視化システム #リアルタイム #練習支援

スライド概要

複数楽器を同時に演奏するドラムにおいて，主要な3楽器の音量バランスが重要である．しかし，聴衆とドラマーで聴こえ方が異なるため自身の音量バランスを把握できず，演奏を録音し確認する方法は時間や手間がかかるという問題があり，個人練習が難しい．我々はこれまで，ドラム正面に設置した単一指向性マイクから演奏を認識し，聴衆が知覚する音量を推定・可視化するシステムを提案および実装してきた．しかし，使用実験の結果，音量バランスの推定精度や結果の可視化方法などに問題があった．そこで本研究では，様々な音量の組み合わせやリズムで作成したドラム音源256パターンに対する音量バランス評価実験を行い，聴衆の知覚する音量バランス推定手法を提案する．また，システムの改善と評価実験の結果，本システムによって音量バランス練習を支援でき，人や状況によって結果の更新頻度を切り替えることで汎用性が高まる可能性が示唆された．

Nakamura Laboratory (Meiji University)

@nkmr-lab

スライド一覧

明治大学総合数理学部先端メディアサイエンス学科中村聡史研究室

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

周辺視野に対するぼかしエフェクトが作業時の集中力に及ぼす影響の調査

Nakamura Laboratory (Meiji University) 29.3K

商品選択においてフォントがユーザの選択行動に及ぼす影響の調査

Nakamura Laboratory (Meiji University) 21.8K

手書きとフォントの文字形状の違いによる記憶効果の比較

Nakamura Laboratory (Meiji University) 19.4K

Make-up FLOW 2.0: 美容系YouTuberの化粧フローチャートの共有・取り入れ手法

化粧メイク化粧工程フローチャート美容系youtuber 取り入れ

Nakamura Laboratory (Meiji University) 17K

周辺視野における妨害刺激の減衰が集中度に及ぼす影響

Nakamura Laboratory (Meiji University) 16.6K

色覚特性を考慮したゲームの有利不利制御のAmong Usを用いた検証

色覚多様性者模擬フィルタ色のハンディキャップオンラインゲーム

Nakamura Laboratory (Meiji University) 13.8K

各ページのテキスト

聴衆の知覚音量バランス推定と可視化によるドラム練習支援手法明治大学大学院 M2 細谷美月中村聡史（明治大学）森勢将雅（明治大学）吉井和佳（京都大学） 1

研究概要個人練習が難しいドラムの音量バランス練習を聴衆の知覚音量バランスリアルタイム可視化システムで支援 2

システムイメージ 3

研究概要 • プロトタイプシステムを実装、評価実験を行い改善点を明らかに*1,2 • フィードバックをふまえ、システムを改善 …聴衆の知覚を加味した音量バランス推定手法を提案 …可視化手法を改善 • 改善後のシステムで評価実験を行い、有用性を検証 *1…細谷美月, 中村聡史, 森勢将雅, 吉井和佳. ドラム演奏の音量バランス習得に向けた音源分離を用いたリアルタイム叩打音量可視化システムの提案, 情報処理学会研究報告エンタテインメントコンピューティング（EC）, Vol.2021-EC-59, No.27, pp.1-8, 2021. *2…Mitsuki Hosoya, Masanori Morise, Satoshi Nakamura, Kazuyoshi Yoshii. A Real-time Drum-wise Volume Visualization System for Learning Volume-Balanced Drum Performance, 20th IFIP TC14 International Conference on Entertainment Computing (IFIP ICEC 2021), Vol.LNCS 13056, pp.154-166, 2021. 4

背景：ドラム上達に必要なことドラム上達において、リズム・音色・音量など様々な技術の習得が重要リズム音色複雑なリズムの習得様々な種類の音色の叩き分け複数楽器間の音量バランス音色を安定させる音量に差をつけて演奏するテンポ（速さ）を一定に保つ音量

背景：ドラム上達に必要なことドラムは手軽に・見様見真似で演奏でき、自力で練習する人が多いドラムスティックがあれば始められる演奏してみたや、教則の動画で学べる

背景：ドラム上達に必要なこと自身の演奏を自分で評価できない音量バランスは個人練習が難しく、ドラマーはつまずきがち・練習を後回しにしがちリズム音色複雑なリズムの習得様々な種類の音色の叩き分け複数楽器間の音量バランス音色を安定させる音量に差をつけて演奏するテンポ（速さ）を一定に保つ音量

背景：ドラム上達に必要なこと自身の演奏を自分で評価できない音量バランスは個人練習が難しく、ドラマーはつまずきがち・練習を後回しにしがちリズム音色音量様々な種類の複数楽器間の複雑なリズムの音色の叩き分け音量バランス習得音量バランスの練習支援に着目テンポ（速さ）を一定に保つ音色を安定させる音量に差をつけて演奏する

背景：音量バランスとは • 基本リズムにおける HI・SD・BD の音量の大小関係 • BD>SD>HIに“聴衆が知覚するように”演奏するが理想 • 曲やジャンル、好みによって目標とする音量バランスは異なるハイハット（HI）スネアドラム（SD）バスドラム（BD）小中大 10

10.

背景：音量バランスとは • 基本リズムにおける HI・SD・BD の音量の大小関係 • BD>SD>HIに“聴衆が知覚するように”演奏するが理想 • 曲やジャンル、好みによって目標とする音量バランスは異なるハイハット（HI）スネアドラム（SD）バスドラム（BD）小中大 11

11.

背景：音量バランスとは • 基本リズムにおける HI・SD・BD の音量の大小関係 • BD>SD>HIに“聴衆が知覚するように”演奏するが理想 • 曲やジャンル、好みによって目標とする音量バランスは異なるハイハット（HI）スネアドラム（SD）バスドラム（BD）小まとまりのあるいい演奏だ！中大 12

12.

背景：音量バランスとは • 基本リズムにおける HI・SD・BD の音量の大小関係 • BD>SD>HIに“聴衆が知覚するように”演奏するが理想 • 曲やジャンル、好みによって目標とする音量バランスは異なるハイハット（HI）スネアドラム（SD）バスドラム（BD）小まとまりのあるいい演奏だ！中大 13

13.

背景：音量バランスとは • 基本リズムにおける HI・SD・BD の音量の大小関係 • BD>SD>HIに“聴衆が知覚するように”演奏するが理想 • 曲やジャンル、好みによって目標とする音量バランスは異なるハイハット（HI）スネアドラム（SD）バスドラム（BD）小まとまりのあるいい演奏だ！中大 14

14.

背景：音量バランスとは • 基本リズムにおける HI・SD・BD の音量の大小関係 • BD>SD>HIに“聴衆が知覚するように”演奏するが理想 • 曲やジャンル、好みによって目標とする音量バランスは異なるハイハット（HI）スネアドラム（SD）バスドラム（BD）小まとまりのあるいい演奏だ！中大 15

15.

背景：音量バランスとは • 基本リズムにおける HI・SD・BD の音量の大小関係 • BD>SD>HIに“聴衆が知覚するように”演奏するが理想 • 曲やジャンル、好みによって目標とする音量バランスは異なるロックやメタルジャズ BD=SD>HI HI>SD>BD 16

16.

背景：音量バランスとは • 基本リズムにおける HI・SD・BD の音量の大小関係 • BD>SD>HIに“聴衆が知覚するように”演奏するが理想 • 曲やジャンル、好みによって目標とする音量バランスは異なるそれぞれ目標の音量バランスを目指して練習するが、ロックやメタルジャズ音量バランスを個人で練習することは難しい BD=SD>HI HI>SD>BD 17

17.

背景：個人での音量バランス練習は難しい理由①：聴衆が知覚する音量バランスをドラマーは把握できない • ドラマーと聴衆で、音の聴こえ方が異なる • 演奏するリズムによって、音量バランスの聴こえ方が異なる聴衆ドラマー知覚する音量バランスの差 18

18.

背景：個人での音量バランス練習は難しい理由①：聴衆が知覚する音量バランスをドラマーは把握できない • ドラマーと聴衆で、音の聴こえ方が異なる • 演奏するリズムによって、音量バランスの聴こえ方が異なる 8ビート HI SD BD 16ビート HI SD BD BD＞SD＞HI BD＞SD＞HI いい感じ！ HIが大きい 19

19.

背景：個人での音量バランス練習は難しい理由②：演奏を録音し確認する方法は、時間や手間がかかる各楽器にマイクを設置し、収録された波形を見ながら演奏スマートフォンなどで演奏を録音→聴く→反省→演奏… BD 大きくしよう 20

20.

関連研究ドラム練習支援の研究は様々あるが、音量バランスに着目したものは少ない • Kinectを利用した演奏動作検出によるドラム練習支援システム[越智 2017] • 聴覚フィードバックでスネアのタイミングやストロークを制御し演奏動作を矯正するシステム[池之上 2012] • 両手首足首に装着したデバイスからの触覚フィードバックで複雑なリズムパターンを習得するシステム[Simon 2010] 21

21.

目的ドラマー個人での音量バランス練習を容易で効率的にできるよう支援する 22

22.

どうすれば支援できる？ドラマー個人での音量バランス練習を容易で効率的にできるよう支援する演奏に対して聴衆が知覚する音量バランスをドラマーが演奏しながらリアルタイムに確認できる 23

23.

提案システム１本のマイクで入力したドラム演奏から聴衆が知覚する音量バランスをリアルタイム推定し可視化してドラマーへフィードバックするシステム 24

24.

システム実現に向けた問題マイク入力した演奏を３楽器に分離各楽器の音源から聴衆が知覚する音量バランスを推定音量バランスを可視化して提示 25

25.

プロトタイプシステム：音源分離 [EC59] 聴衆の知覚音量バランス推定演奏を３楽器に分離マイク入力したドラム演奏データ音量バランスの可視化音源分離 H HI I SSNMF （非負値行列因子分解） S SD D 各楽器の叩打音を基底とし音源分離が可能 B BD D 26

26.

プロトタイプシステム [EC59] 音声特徴量聴衆が知覚する音量バランス推定 H HI I RMS 0.14 S SD D RMS 0.02 B BD D 音量バランスの可視化聴衆の知覚音量バランス推定演奏を３楽器に分離音源分離：推定音量 RMS 0.03 RMSを聴衆の知覚へ筆者の主観でチューニング（HI 5倍・SD 1倍・BD 0.8倍） 27

27.

プロトタイプシステム [EC59] 聴衆の知覚音量バランス推定演奏を３楽器に分離聴衆が知覚する音量バランス：可視化音量バランスの可視化結果の可視化割合へ 0.25 19％ 0.47 34% 0.67 47% 28

28.

プロトタイプシステム [EC59] ：評価実験フィードバックを目的とし評価実験を行った結果… 改善点① 改善点② 音量バランス推定精度が低い結果可視化方法がわかりづらい BDほとんど音出してないのにおかしいな… どこの演奏に対する結果？ HI下げて BD上げる？ SD上げて BDさらに上げる？ 29

29.

プロトタイプシステム：問題 [EC59] 演奏を３楽器に分離聴衆の知覚音量バランス推定聴衆の知覚が加味されていなかった音量バランスの可視化割合表示や結果更新頻度が適切でなかった 30

30.

プロトタイプシステム：問題 [EC59] 演奏を３楽器に分離聴衆の知覚音量バランス推定音量バランスの可視化聴衆の知覚が加味されていなかった割合表示や結果更新頻度が適切でなかった聴衆の知覚を加味した音量バランス推定手法を提案可視化方法を改善 31

31.

プロトタイプシステム：問題 [EC59] 演奏を３楽器に分離聴衆の知覚音量バランス推定音量バランスの可視化聴衆の知覚が加味されていなかった割合表示や結果更新頻度が適切でなかった聴衆の知覚を加味した音量バランス推定手法を提案可視化方法を改善 32

32.

聴衆の知覚を加味した音量バランス推定手法ドラム演奏の各楽器の音源から得られる4種類の特徴量から音量評価値（聴衆が知覚する音量）を推定可能とする回帰式分離音源音声特徴量音量評価値 H I RMS 振幅ゼロ交差数スペクトル重心 0.51 S D RMS 振幅ゼロ交差数スペクトル重心 1.23 振幅ゼロ交差数スペクトル重心 1.97 B D 音量 RMS 33

33.

聴衆の知覚を加味した音量バランス推定手法ドラム演奏の各楽器の音源から得られる4種類の特徴量から音量評価値（聴衆が知覚する音量）を推定可能とする回帰式分離音源音声特徴量音量評価値 H I RMS 振幅ゼロ交差数 S D RMS 振幅ゼロスペクトル無声区間か交差数重心音の明るさ 1.23 ゼロ交差数 1.97 B D 音量 RMS 音の大きさ振幅有声区間かスペクトル重心（周波数）スペクトル重心 0.51 34

34.

聴衆の知覚音量バランスの正解データセット構築様々なリズム・音量バランスで作成した 256パターンのドラム演奏音源の音量バランス評価によって聴衆の知覚音量バランスの正解データセット構築を行った協力者：ドラムorDTM（MIX）経験者の大学生〜大学院生12名 35

35.

聴衆の知覚音量バランスの正解データセット構築：評価方法 • ドラム音源を聴取し音量が小さい順に3楽器の順序を回答 • 音源はランダムな順番で提示 HI SD BD 評価式例： • BD>SD>HIの場合 →HI=1 SD=2 BD=3 • BD=SD>HIの場合 →HI=1 SD=2 BD=2 1 1 1 1 1 1 2 2 2 2 2 3 3 1 1 2 2 2 3 1 1 1 2 3 1 2 1 2 1 2 3 2 1 2 3 1 1 2 1 HI=SD=BD BD>HI=SD SD>HI=BD SD=BD>HI BD>SD>HI SD>BD>HI HI>SD=BD HI=BD>SD BD>HI>SD HI=SD>BD SD>HI>BD HI>BD>SD HI>SD>BD 36

36.

聴衆の知覚音量バランスの正解データセット構築：結果 • 全256パターンの音源へ対する音量バランス評価データが 6セット分（1人128パターン評価×12人分）得られた • 評価にかかった時間は1時間〜1時間15分データセット C D A B 1 HI=SD=BD HI=BD>SD HI>SD=BD HI=SD=BD BD>HI>SD HI=BD>SD 2 BD>HI=SD BD>HI=SD BD>HI=SD BD>HI>SD BD>HI>SD BD>HI>SD … … … … F … E … … 音源番号 255 HI=SD=BD HI=SD=BD HI=SD>BD SD=BD>HI SD>HI=BD HI=SD=BD 256 HI>SD=BD HI=SD>BD HI=SD=BD HI=SD=BD SD>HI>BD HI>SD>BD 37

37.

聴衆の知覚音量バランスの正解データセット構築：正解データの定義詳しくは論文をご覧ください HI … 255 256 SD 0.37 0.31 0.29 0.33 1.20 … 0.58 0.44 0.46 0.42 0.40 BD 1.85 2.40 0.55 1.50 2.25 3.00 0.50 … 音源番号 1 2 3 4 5 … 256パターンの音源の各楽器について音量評価値（聴衆が知覚する音量）の正解データを定義 2.30 2.15 1.39 1.45 38

38.

39.

40.

聴衆の知覚を加味した音量バランス推定手法システムで使用する音源分離は完全でない分離音源ドラム演奏分離 H I S D B D →完璧な分離ができた状態を想定し回帰式定義する必要あり 41

41.

聴衆の知覚を加味した音量バランス推定手法完璧な分離ができた状態を想定し回帰式定義する必要あり →ピュアデータ（ドラム演奏音源のMIX前の3楽器の音源）を正解データとし、重回帰分析によって音声特徴量から音量評価値を推定可能な回帰式を定義音量評価値𝑯𝑰 ＝423.431 × 𝑅𝑀𝑆𝐻𝐼 + 2.521 × 𝐴𝑚𝑝𝑇𝐻𝐼 − 0.001 × 𝑆𝑝𝑒𝑐𝑡𝑟𝑎𝑙𝐶𝑒𝑛𝑡𝑟𝑜𝑖𝑑𝑠𝐻𝐼 + 0.000 × 𝑍𝑒𝑟𝑜𝐶𝑟𝑜𝑠𝑠𝑖𝑛𝑔𝐻𝐼 + 6.323 音量評価値𝑺𝑫 ＝117.051 × 𝑅𝑀𝑆𝑆𝐷 + 0.281 × 𝐴𝑚𝑝𝑇𝑆𝐷 − 0.281 × 𝑆𝑝𝑒𝑐𝑡𝑟𝑎𝑙𝐶𝑒𝑛𝑡𝑟𝑜𝑖𝑑𝑠𝑆𝐷 − 0.006 × 𝑍𝑒𝑟𝑜𝐶𝑟𝑜𝑠𝑠𝑖𝑛𝑔𝑆𝐷 + 9.566 音量評価値𝑩𝑫 ＝28.619 × 𝑅𝑀𝑆𝐵𝐷 + 6.857 × 𝐴𝑚𝑝𝑇𝐵𝐷 + 0.000 × 𝑆𝑝𝑒𝑐𝑡𝑟𝑎𝑙𝐶𝑒𝑛𝑡𝑟𝑜𝑖𝑑𝑠𝐵𝐷 + 0.000 × 𝑍𝑒𝑟𝑜𝐶𝑟𝑜𝑠𝑠𝑖𝑛𝑔𝐵𝐷 − 0.678 42

42.

聴衆の知覚を加味した音量バランス推定手法：精度詳しくは論文をご覧ください正解データにおいて、 2楽器ずつの組み合わせ（HIとSD・SDとBD・HIとBD）の間に音量の差があると聴衆が知覚しているものについて、回帰式でも同様にその組み合わせを推定できているかで評価 →ピュアデータをテストデータとした結果、 87.4%の精度で聴衆の知覚音量バランスを推定可能！ →音源分離後のデータをテストデータとした結果、 47.0％と低い精度 43

43.

聴衆の知覚を加味した音量バランス推定手法：システム版システム実装にあたり分離後の各楽器の音源を用いて再度回帰式の定義を行った • プロトタイプシステムと同様、音源分離はSSNMFを使用 • 回帰式算出後、影響が少ないかつ計算に時間がかかる特徴量について削除音量評価値𝐻𝐼 ＝843.896 × 𝑅𝑀𝑆𝐻𝐼 − 0.149 音量評価値𝑆𝐷 ＝349.734 × 𝑅𝑀𝑆𝑆𝐷 + 0.001 × 𝑆𝑝𝑒𝑐𝑡𝑟𝑎𝑙𝐶𝑒𝑛𝑡𝑟𝑜𝑖𝑑𝑠𝑆𝐷 − 2.899 音量評価値𝐵𝐷 ＝70.811 × 𝑅𝑀𝑆𝐵𝐷 + 10.930 × 𝐴𝑚𝑝𝑇𝐵𝐷 − 0.088 44

44.

プロトタイプシステムの問題演奏を３楽器に分離聴衆の知覚音量バランス推定音量バランスの可視化聴衆の知覚が加味されていなかった割合表示や結果更新頻度が適切でなかった聴衆の知覚を加味した音量バランス推定手法を提案可視化方法を改善 45

45.

改善：結果の可視化方法（表示形式）聴衆が知覚する各楽器の音量（音量評価値）を可視化 46

46.

改善：結果の可視化方法（更新頻度）更新頻度低：システムA いつの演奏の結果かわかりやすい更新頻度高：システムB 演奏の変化がわかりやすい 47

47.

システム評価実験システムを使用しながら音量バランス練習する実験 指定したリズムで指定した目標の音量バランスを目指し演奏し、目標に到達したと判断した後4小節演奏して演奏を終了するタスクを複数回行ってもらう タスク終了後に演奏の終盤の録音を聴きアンケートに回答 • 練習環境条件：結果更新頻度の低いシステムA・高いシステムB・システムなし • 実験協力者：ドラム経験者6名 48

48.

システム評価実験：アンケート Q1 Q2 Q3 Q4 Q5 Q6 Q7 Q8 Q9 内容システムor自分は聴衆が知覚する音量バランスを推定できていたと思うか自身の演奏の音量バランスの可視化を見ながら演奏することで音量バランス練習はしやすかったか結果が切り替わる頻度は適切だったか結果表示方法はわかりやすかったか音量バランスを変化させたときシステムにその結果が反映されていた感じがしたか今後このシステムを使って練習したいか自分の音量バランスに自信をもって練習できたかシステムA・B・システムなしについて練習しやすかった順に1〜3の番号を回答してくださいシステムや実験についての感想 49

49.

システム評価実験：アンケート Q1 Q2 Q3 Q4 Q5 Q6 Q7 Q8 Q9 内容システムor自分は聴衆が知覚する音量バランスを推定できていたと思うか自身の演奏の音量バランスの可視化を見ながら演奏することで音量バランス練習はしやすかったか結果が切り替わる頻度は適切だったか各練習環境条件において、結果表示方法はわかりやすかったか音量バランスを変化させたとき練習しやすさ・可視化のわかりやすさ・システムにその結果が反映されていた感じがしたか音量バランス推定精度などを評価今後このシステムを使って練習したいか自分の音量バランスに自信をもって練習できたかシステムA・B・システムなしについて練習しやすかった順に1〜3の番号を回答してくださいシステムや実験についての感想 50

50.

システム評価実験：明らかにしたいこと • システムが音量バランス練習を支援できるか →システムあり・システムなしを比較 • 結果更新頻度の違いによる練習のしやすさ →結果更新頻度が低いシステムA・頻度が高いシステムBを比較 • 音量バランス推定手法の精度 51

51.

考察：提案手法による音量バランス練習支援効果システムあり条件の方が練習しやすさの評価が高かったシステムなし「自分の感覚で叩いていたので，不安が多かった」システムあり「自身の演奏を客観的に確認することを実現でき良い」 →聴衆が知覚する音量バランスを確認しながらの練習により納得感をもって練習できる提案システムによって音量バランス練習を支援可能 52

52.

考察：推定結果の更新頻度による練習しやすさ可視化方法や練習しやすさに関する質問に対する評価が実験協力者によって様々であった更新頻度の低いシステムは「曲の一部分の練習」更新頻度の高いシステムは「一定の音量バランスを保つ練習」に使用したいといった意見も人や状況によって結果の更新頻度を切り替えることで、さらに音量バランス練習を支援できる 53

53.

考察：聴衆の知覚する音量バランス推定精度 SDにBDの結果が混同しているといった回答が多かった →周波数帯域が似ているため、音源分離の際にSDにBDの音が競合してしまったドラム演奏 HI 分離 SD BD 54

54.

考察：聴衆の知覚する音量バランス推定精度 SDにBDの結果が混同しているといった回答が多かった →周波数帯域が似ているため、音源分離の際にSDにBDの音が競合してしまった音源分離の精度を高める必要がある（他の分離手法の検討・SSNMFの適切な学習回数をみつける等） 55

55.

結果まとめ • 聴衆が知覚する音量バランスを確認しながら演奏することによって音量バランス練習を支援可能 • 人や状況によって結果の更新頻度を切り替えることでさらに支援 • 音量バランス推定精度を高めるため、音源分離の精度の改善が必要 56

56.

展望 • 音量バランス推定手法について、精度向上・幅広い演奏へ対応 • 練習したい内容によって音量バランス推定の可視化方法を切り替える機能を追加より容易で効率的な音量バランス練習を支援可能に 57

57.

まとめ背景：個人での音量バランス練習難しい目的：個人での音量バランス練習を容易・効率的にしたい提案システム：マイク入力した演奏から聴衆の知覚音量バランスを推定し可視化音量バランス推定手法：音源分離し、各楽器の特徴量から聴衆が知覚する音量バランスを推定システム評価実験の結果：システムにより音量バランス練習を支援可能結果の更新頻度を変化させることで様々な練習を支援できる可能性 58