単語のtrigramの値にdeleted-interpolationを利用して平滑化した場 合の認識率の変化を表4.11に示す。
なお、平滑化の値は、次式のtrigram,bigram,unigram,フロアリングに対して各々
である。
(4.3) |
これから単語のtrigramを平滑化することでtext-open dataにおいて 認識性能が向上することがわかる。
言語model | text open data | text closed data | |||
特定話者 | 不特定話者 | 特定話者 | 不特定話者 | ||
base line | 35.6% | 33.7% | 90.8% | 85.1% | |
37.5% | 36.8% | 96.6% | 93.5% | ||
38.3% | 37.9% | 98.8% | 97.7% | ||
interpolation | 51.7% | 43.3% | 79.3% | 78.2% | |
58.6% | 47.9% | 88.5% | 86.2% | ||
62.4% | 53.6% | 91.9% | 90.0% |