次へ: 鳥バンク
上へ: 実験環境
戻る: 言語モデルの学習
目次
英辞郎は,EDP(Electronic Dictionary Project)がアップデートし続けている英和・和英辞書である.英辞郎のデータには対訳フレーズ対の他に翻訳例や注釈など,本来の文に出てこない"〜"等の記号が含まれる.本実験では,英辞郎のクリーニングを行い,必要な英語と日本語のフレーズ対のみにした1,366,575フレーズ対を使用する.表2.4にクリーニング後の英辞郎のフレーズ対の例を示す.
=23pt
表:
クリーニング後の英辞郎のフレーズ対の例
日本語文 |
から 出て くる |
英語文 |
come out from |
日本語文 |
の 結果 として 生じる |
英語文 |
come out from |
日本語文 |
に 関する 情報 を 得る |
英語文 |
obtain infomation on |
平成25年2月12日