日本文の音節や文字連鎖の持つ情報量を応用した「文節処理」の効果を研究する ため、音声の持つ物理的特性に着目した音声認識処理と、それ以外の言語処理 的な部分とを分け、図4.1に示す ような日本文音声認識手順を考える。日本文の音声入力のマンマシーンイン ターフェースとしては、単音節単位、文節単位および連続音声の入力などが考 えられるが、ここでは音声認識装置は一音節単位ごとに区切って発声したもの を認識した複数の音節候補を文節の単位で出力、つまり文節単位の音節マトリッ クスの形態で出力するものとする(図4.2参照)。
「文節処理」では、音声認識装置から出力された音節マトリックス から単語候補を生成し、その中で適切と見られる漢字かな混じりの文節候補を、 その数を限定して出力する。最後に「文処理」において文節候補を文単位に結 合して得られる最も適切な文節の組を入力文に対する認識結果として出力する。
以下では、以上の日本文認識手順の中の「文節処理」において、日本文の音節 や漢字かなのtrigram モデルを用いた認識候補絞り込みの方法を提案し、 その効果を実験的に示す。