Next: ヌルトークンへの品詞情報付加
Up: thesis_B14T2044U
Previous: 低頻度語の高頻度語への置き換え
目次
本研究では,入力側(原言語)のみにおいて低頻度語処理を行う.
これにより,出力にCopyable Modelでナンバリングを行ったトークン以外の未知語は出力されなくなり,
評価が容易となる.
また,未知語が出力されないことにより,同じく未知語が出力されない手法である
低頻度語処理を行わない手法との精度の比較を正確に行うことができる.
学習時間は考慮に入れず,出力の精度と多様性のみを評価対象とする.
Subsections
2018-02-28