next up previous contents
次へ: 鳥バンク 上へ: 実験環境 戻る: 言語モデルの学習   目次

英辞郎

英辞郎は,EDP(Electronic Dictionary Project)がアップデートし続けている英和・和英辞書である.英辞郎のデータには対訳フレーズ対の他に翻訳例や注釈など,本来の文に出てこない"〜"等の記号が含まれる.本実験では,英辞郎のクリーニングを行い,必要な英語と日本語のフレーズ対のみにした1,366,575フレーズ対を使用する.表2.4にクリーニング後の英辞郎のフレーズ対の例を示す.


=23pt
表: クリーニング後の英辞郎のフレーズ対の例
日本語文 から 出て くる
英語文 come out from
日本語文 の 結果 として 生じる
英語文 come out from
日本語文 に 関する 情報 を 得る
英語文 obtain infomation on



平成25年2月12日