単語のtrigramの値を平滑化した場合の認識率

次へ: 考察 上へ: 各種パラメータの検討 戻る: text-open data における認識率目次

単語のtrigramの値を平滑化した場合の認識率

単語のtrigramの値にdeleted-interpolationを利用して平滑化した場合の認識率の変化を表4.11に示す。

なお、平滑化の値は、次式のtrigram,bigram,unigram,フロアリングに対して各々
$\lambda_3 = 0.35, \lambda_2 = 0.48, \lambda_1 = 0.11, \lambda_0 = 0.06$
である。

$\begin{displaymath} \hat{ P } (w_i \vert w_{i-2},w_{i-1} ) = \lambda_3 P (w_i... ... \lambda_2 P (w_i \vert w_{i-2},w_{i-1} ) + \lambda_1 P (w_i) \end{displaymath}$

(4.3)

これから単語のtrigramを平滑化することでtext-open dataにおいて認識性能が向上することがわかる。

**表 4.11:** 認識実験の結果（単語のtrigramの値を平滑化したとき）文認識率(%)
言語model		text open data		text closed data
		特定話者	不特定話者	特定話者	不特定話者
base line		35.6%	33.7%	90.8%	85.1%
	$\sim2$	37.5%	36.8%	96.6%	93.5%
	$\sim8$	38.3%	37.9%	98.8%	97.7%
interpolation		51.7%	43.3%	79.3%	78.2%
	$\sim2$	58.6%	47.9%	88.5%	86.2%
	$\sim8$	62.4%	53.6%	91.9%	90.0%

text-closed; ビーム幅:4,096; $\alpha$ :1

Jin'ichi Murakami 平成13年1月5日