next up previous
次へ: 実験結果 上へ: 実験条件 戻る: 単語辞書

単語選択部

本論文では、単語抽出部で出力された複数の候補選択するために、漢字仮名の $N$-gramを用いた。また、アクセント句境界および単語境界および接辞境界は 1単語として計算した。

例えば$2$-gram(bigram)では、``くるま$\vert$や+ラーメン''の連鎖確率値は

$P($ $/start) \times
P($$/$$) \times
P($$/$$) \times
P(\vert/$$) \times
P($ $/\vert) \times
P(+/$$) \times
P($$/+) \times
P($$/$$) \times
P($$/$$) \times
P($$/$ $) \times
P(end/$$)
$

と計算した。

実験では$N$の次数を$2$(bigram)から$6$まで変化させて正解率を調査した。



平成15年9月30日