「音声認識処理」と「文節処理」は図4.2 に示すような文節単位の音節マトリックスで結合されるものとし、「文節処理」 の結果としては、文節毎の漢字かな混じり文を出力する。
大語彙を対象とする漢字かな混じり文の生成では、同音異義語が多数存在 し、同一のかな列に対して複数の漢字が対応するため、音節列の場合[3]に 比べて曖昧さが桁違いに大きく、通常、数億個以上の候補が出力される。従っ て、「文節処理」の課題は、このような膨大な文節候補の中から、正解を含む 少数の文節候補を選択することである。 以下では、このような「文節処理」 の方法として図4.3に示す二つの方法を考える。
入力された文節単位の音節マトリックスから、次節で述べる3段階の処理を経て、 文節候補を生成する。すなわち、まず初めに、音節マトリックスに対して日本語の持 つ音節の-gram モデルを適用して音節の組み合わせ候補を絞り込む。次に、その結 果に対して単語辞書を適用して文節を構成する単語候補を生成する。最後に、漢字か なの-gram モデルを使用して、文節を出力する。
上記の方法が、はじめに音節連鎖情報を使用するのに対して、この方法は、音節マト リックスに直接単語辞書を適用するもので、2段階で文節候補を生 成する。はじめに単語認定においては音節マトリックス内の音節候補を組み合わせな がら辞書引きを行い、単語として解釈可能な候補の組み合わせをすべて抽出する。次 に漢字かなの-gram モデルを使用して文節候補を生成する。