イラストで学ぶ音声認識 3章

150 Views

August 26, 23

スライド概要

profile-image

機械学習や音声認識に関する書籍を執筆しています。

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

3. 統計的パターン認識 3.1 パターン認識とは 3.2 統計的パターン認識の考え方 3.3 生成モデルの学習 3.4 識別モデルの学習 3.5 統計的音声認識の概要 • 荒木雅弘 :『イラストで学ぶ音声認識』 (講談社, 2015年) • サポートページ

2.

3.1 パターン認識とは • パターン認識の定義 • 人間が五感によって知覚することができる信号を、予め持っている 概念の一つに対応させる技術

3.

3.1 パターン認識とは • パターン認識の難しさの分類 • 1入力1出力 • 最も基本的な設定 • 1つのベクトルを引数とするクラス毎の識別関数を設定し、最大値を出力する ものを求める • 複数入力1出力 • 入力が不定長の場合は、識別関数の構造に工夫が必要 • 1入力複数出力 • 出力毎に識別器を作成すればよい • 複数入力複数出力 音声認識 • 探索処理が必要になり、最も複雑

4.

3.2 統計的パターン認識の考え方 • 1入力1出力のパターン認識 • 入力:特徴ベクトル(d次元空間上の点) • 出力:クラス ω1,...,ωc のいずれか

5.

3.2 統計的パターン認識の考え方 • 統計的パターン認識 • 事後確率 P(ωi |x) が最大となるクラス を求める • 生成モデル • 事後確率の式をベイズの定理で求めやすい確率に変形する • 識別モデル • 事後確率の値を関数の形を仮定して求める

6.

3.2 統計的パターン認識の考え方

7.

3.3 生成モデルの学習 • 最尤推定法 パラメータθのモデルが データDを生成する確率 • 学習データ D に対する尤度 P(D; θ) が最大になるようにモデルのパラ メータ θ を定める • 事前確率の推定 • 学習データ中のクラス ωi のデータの個数 ni を、全データ数 n で割っ たものが最尤推定値

8.

3.3 生成モデルの学習 • 尤度関数の推定 • 正規分布を仮定し、学習データから求まる平均と共分散行列を そのパラメータとする

9.

3.4 識別モデルの学習 • 対数線型モデルで事後確率の値を推定 • 素性関数 Φ(x, ωi ) • 特徴とクラスの間にある関係が成り立つときに1となる • 正規化係数 Z • 全クラスに対する計算結果の和を Z とすることで、事後確率の値を全クラスに 対して足すと1となる

10.

3.5 統計的音声認識の概要