Next: 過去発話の付与
Up: 提案手法
Previous: 提案手法
目次
本実験では低頻度語処理の際,Copyable Modelの未知語処理を行った後,
品詞情報を用いて
ヌルトークンを少数のグループへ分割する.
これにより,低頻度語処理後のコーパスに残すことができる情報が増加する.
品詞情報の付加はMecab[9]で容易に行うことができるため,
細分化の方法として採用した.
表4.1.1は本研究の手法での低頻度語処理例である.
表 4.1.1:
提案手法の変換例
低頻度語 |
ソース文 |
ターゲット文 |
:独自,:重ねる |
に かも しれ ない |
に 心の哲学 を 研究 なさっ て いる の です ね |
:A(人名),: 市ヶ谷 |
ね な ん だ よ ね |
か ー |
:2月11日,: 建国 |
は ー なんだろう 記念 か |
記念 か |
2018-02-28