日本文音声認識の処理手順

次へ: 文節処理の方法 上へ: 実験システムの構成 戻る: 実験システムの構成目次

日本文音声認識の処理手順

日本文の音節や文字連鎖の持つ情報量を応用した「文節処理」の効果を研究するため、音声の持つ物理的特性に着目した音声認識処理と、それ以外の言語処理的な部分とを分け、図4.1に示すような日本文音声認識手順を考える。日本文の音声入力のマンマシーンインターフェースとしては、単音節単位、文節単位および連続音声の入力などが考えられるが、ここでは音声認識装置は一音節単位ごとに区切って発声したものを認識した複数の音節候補を文節の単位で出力、つまり文節単位の音節マトリックスの形態で出力するものとする（図4.2参照）。

「文節処理」では、音声認識装置から出力された音節マトリックスから単語候補を生成し、その中で適切と見られる漢字かな混じりの文節候補を、その数を限定して出力する。最後に「文処理」において文節候補を文単位に結合して得られる最も適切な文節の組を入力文に対する認識結果として出力する。

以下では、以上の日本文認識手順の中の「文節処理」において、日本文の音節や漢字かなのtrigram モデルを用いた認識候補絞り込みの方法を提案し、その効果を実験的に示す。

**図 4.1:** 仮想的な音声認識システムのフローチャート
$\begin{figure}\begin{center} \fbox{\epsfile{file=FIGURE/figure5.1.ps,width=140mm}}\end{center}\end{figure}$

Jin'ichi Murakami 平成13年1月5日