次へ: おわりに
上へ: B07T2046B_soturon
戻る: 出力文の解析
目次
今後の課題として,以下を考えている.
- 抽出文対の精度向上
提案手法において,抽出文対の精度を向上させることを考えている.
現在検討している手法としては,以下の2つが挙げられる.
まず,1つめは,デコーダの翻訳確率を用いる手法である.
-gramモデルでは,単語の並びでのみ文を評価する.そこで,翻訳の際の翻訳確率を用いることで,
翻訳文として確からしい文も選出できると考える.
次に,構文解析器を用いる手法である.抽出文対には,用言が含まれていない文がみられる.よって,構文解析器によって
用言がない文などを取り除けば,より精度の高い文の選出が可能であると考えている.
- 学習データ中の誤り割合による精度変化の調査
学習データ中に含まれる誤りデータの割合で,どのように翻訳精度が変化するかを調査することを予定している.
抽出文対中の誤りを完全に取り除くことは非常に困難である.そのため,学習データ中に,わずかでも誤りがあるだけで,
翻訳精度が大きく減少するのであれば,抽出文対を加えて対訳コーパスを増加させることは困難であると考えられる.
- より大量のモノリンガルコーパスを用いた研究
より大量の日本語学習文を用いて,本研究を行うことを考えている.モノリンガルコーパスの翻訳文から
精度の高い文を抽出すると,対訳コーパスに付与できる文の数は減少する.よって,大量のモノリンガルコーパスを用いること
で精度の高い対訳文対が大量に得られる可能性があると考えている.
平成23年3月3日