次へ:
序論
上へ:
確率的言語モデルによる自由発話認識に関する研究
戻る:
確率的言語モデルによる自由発話認識に関する研究
目次
目次
序論
研究の背景
本研究の目的
論文の構成
連続音声認識システムに使用するアルゴリズム
HMM(Hidden Markov Model,隠れマルコフモデル)
HMMの基本問題
HMMの基本アルゴリズム
Forward-Backward アルゴリズム
Forward probability
Backward probability
Baum-Welch アルゴリズム
Viterbi アルゴリズム
スケーリング
連続分布型HMM
HMMのエントロピー
連続音声認識のアルゴリズム
tree-trellisサーチ
Viterbi サーチ ( one-pass DP )
tree-trellisサーチとViterbiサーチの比較
アルゴリズムの改良
ビームサーチ
ビームの絞り方
近接したフレームにおける言語モデルの類似性の利用
単語trigramの値の検索方法
対数の加算の計算方法
音素HMM
遅延言語処理
Viterbi サーチにおけるN-bestサーチ
Viterbiサーチの経路計算
単語のtrigramを使用したときのViterbiサーチ
まとめ
日本語の
-gramによるモデル化
新聞記事
新聞記事における音節のマルコフ連鎖確率の収束率
新聞記事における漢字仮名文字のマルコフ連鎖確 率の収束率
新聞記事における品詞のマルコフ連鎖確率の収束 率
X線CT所見作成のデータ
X線CT所見作成における音節のマルコフ連鎖確率の収束率
X線CT所見作成における漢字仮名のマルコフ連鎖確率の収束率
X線CT所見作成における単語のマルコフ連鎖確率の収束率
ATRの国際会議のデータベース
ATRの国際会議における単語trigramの値の収束率
まとめ
-gram を用いた音声認識
trigramの有効性について
実験システムの構成
文節候補生成アルゴリズム
実験条件
実験結果
考察
まとめ
単語のHMMとbigramを利用した文節音声認識
認識単位を単語とした文節音声認識
文節音声認識実験
実験結果
考察
まとめ
tree-trellisサーチと単語のtrigramモデルを用いた文音声認識
単語のtrigramモデルを用いた文音声認識実験
ポーズの処理
各種パラメータの検討
考察
まとめ
まとめ
自由発話の音声認識
間投詞や言い直しの対策
garbageモデル(音響モデルによる対策)
音素スキップ (言語モデルによる対策)
自由発話の文認識実験条件
自由発話の音声データ
単語のtrigramの平滑化
自由発話の文認識実験結果
考察
まとめ
自由発話音声における音響的・言語的な特徴
自由発話の言語的な特徴
研究に用いたデータベース
自由発話の文例
自由発話の文の長さ
自由発話における間投詞および言い直しの出現頻度
自由発話における間投詞の種類と出現確率
自由発話における言い直しの種類と出現頻度
話者ごとの自由発話の言語的な特徴
話者ごとの間投詞や言い直しの出現頻度
間投詞の種類と出現頻度
話者ごとの自由発話の音響的な特徴
ラベリング作業からみた自由発話
融合ラベルの付与率から見た自由発話
発話速度からみた自由発話
認識精度(phone accuracy)から見た自由発話
まとめ
音声におけるアクセント情報の持つ情報量の考察
アクセント情報の持つ情報量の基本的な測定方法
情報量の定義
アクセント情報の持つ情報量の基本的な測定方法の考え方
基本的な測定方法のフローチャート
漢字ー音素・アクセント変換を利用したアクセント情報の持つ情報量 の測定方法
基本的な方法の問題点
漢字ー音素・アクセント変換を利用した測定方法
漢字ー音素・アクセント変換を利用した測定方法のフローチャート
実験結果
実験条件
実験結果
アクセント情報の情報量の値の信頼性
生成確率によるアクセント句境界の位置の持つ情報量の値
他の論文におけるアクセント核の位置の持つ情報量の値
アクセント情報の情報量の値の信頼性について
考察
漢字の読みの知識の情報量とアクセント情報の情報 量の比較
文法規則の情報とアクセント情報の情報量の比較
アクセント情報と文法の関係
音声認識におけるアクセント情報の持つ情報量
まとめ
Ergodic HMMを用いた未知・複数信号源クラスタリング問題の検討
未知・複数信号源クラスタリング問題
問題の定式化
Ergodic HMM を用いた解法
Ergodic HMM
HMMのパラメータ推定
最適状態遷移系列の推定について
複数話者発話の識別実験
音声資料
音響パラメータ
HMMの初期パラメータ
識別率の評価方法
Ergodic HMM による複数話者発話の識別の実験結果
基本手法の実験結果
話者特徴量と長時間窓分析
コードブックサイズ
対数尤度に対する識別率の変化
初期モデルの選択
考察
まとめ
Ergodic HMMを用いた確率付きネットワーク文法の自動獲得
品詞列を入力とした文節内文法の獲得
文節データについて
対話データ
まとめ
単語を入力単位とした日本文文法の自動獲得
HMMによる言語のモデル化
言語データ
Ergodic HMMを用いた確率つきネットワーク文法の自動獲得の実験
実験結果
連続音声認識への適用
考察
まとめ
メモリ量および計算量を削減したBaum-Welchアルゴリズムの提案と言語モデルへの適用
メモリ量および計算量を削減したBaum-Welchアルゴリズム
Ergodic HMMを用いた確率つきネットワーク文法の獲得
連続音声認識実験
考察
まとめ
まとめ
結論
文献目録
品詞の出現頻度
8状態Ergodic HMMの特徴
16状態Ergodic HMMの特徴
この文書について...
Jin'ichi Murakami 平成13年1月5日