next up previous
次へ: 文法的に不適切な文の削除 上へ: 仮名漢字変換アルゴリズム 戻る: アルゴリズムの概要

単語連鎖確率を用いた変換候補作成

(手順1)では,文献[2]の単語連鎖確率を用いた仮名漢字変換を行う.

具体的にはまず,入力文を単語列に分割する. そして,単語列で隣接する単語間の連鎖確率を計算し, その組み合せから出現確率を求める. 次に出現確率の高い文から順に,候補として出力する.

最後に,入力された平仮名文に対して,単語連鎖確率を用いた仮名漢字変換を行い, 出現確率の高い上位32文の変換候補を作成する.

ここで,日本語語彙大系から約35万語の単語辞書を, EDRコーパス約20万文から接続辞書をそれぞれ作成した.



平成16年4月15日