次へ:
実験結果
上へ:
英辞郎の日本語動詞活用
戻る:
英辞郎の日本語動詞活用
目次
実験方法
英辞郎の動詞句を活用させ,翻訳実験を行う. 活用させた動詞句を用いた翻訳実験を英辞郎(動詞活用)と呼ぶ.
手順を以下に示す.
手順1
日英対訳コーパスを学習データとして言語モデルを作成する
手順2
英辞郎の日本語フレーズをMeCabを用いて形態素解析をする
手順3
手順2の結果から,フレーズの最後の単語が動詞である対訳句を抽出する
手順4
動詞を語幹のみ(なし),未然1,未然2,連用1,連用2,連用3,終止,
連体,仮定,命令,可能の11種類にそれぞれに活用させる
手順5
日英対訳コーパスに英辞郎と手順4で作成した動詞フレーズを追加する
手順6
手順5で作成したコーパスを学習データとして翻訳モデルを作成する
手順7
手順1と手順6で作成したモデルを用いて統計翻訳を行う
手順3で抽出できた動詞フレーズは286,828句であった. 手順4で動詞の活用例を表
に示し,手順4で作成した対訳句対数を表
示す.
英辞郎の動詞活用例
動詞活用後の対訳句コーパスの数
表:
英辞郎の動詞活用例
活用形
動詞フレーズ
基本形
外へ伸ばす
なし
外へ伸ば
未然1
外へ伸ばそ
未然2
外へ伸ばさ
連用1
外へ伸ばし
連用2
外へ伸ばし
連用3
外へ伸ば
終止
外へ伸ばす
連体
外へ伸ばす
仮定
外へ伸ばせ
命令
外へ伸ばせ
可能
外へ伸ばせる
表:
動詞活用後の対訳句コーパスの数
対訳句コーパス名
対訳句対数
英辞郎
1,350,299
英辞郎(動詞活用)
3,155,108
平成25年2月12日