next up previous contents
次へ: 実験結果 上へ: 英辞郎の日本語動詞活用 戻る: 英辞郎の日本語動詞活用   目次

実験方法

英辞郎の動詞句を活用させ,翻訳実験を行う. 活用させた動詞句を用いた翻訳実験を英辞郎(動詞活用)と呼ぶ.

手順を以下に示す.

手順1
日英対訳コーパスを学習データとして言語モデルを作成する
手順2
英辞郎の日本語フレーズをMeCabを用いて形態素解析をする
手順3
手順2の結果から,フレーズの最後の単語が動詞である対訳句を抽出する
手順4
動詞を語幹のみ(なし),未然1,未然2,連用1,連用2,連用3,終止,
   連体,仮定,命令,可能の11種類にそれぞれに活用させる
手順5
日英対訳コーパスに英辞郎と手順4で作成した動詞フレーズを追加する
手順6
手順5で作成したコーパスを学習データとして翻訳モデルを作成する
手順7
手順1と手順6で作成したモデルを用いて統計翻訳を行う

手順3で抽出できた動詞フレーズは286,828句であった. 手順4で動詞の活用例を表[*]に示し,手順4で作成した対訳句対数を表[*]示す.


  • 英辞郎の動詞活用例
  • 動詞活用後の対訳句コーパスの数
  • 表: 英辞郎の動詞活用例
    活用形 動詞フレーズ
    基本形 外へ伸ばす
    なし 外へ伸ば
    未然1 外へ伸ばそ
    未然2 外へ伸ばさ
    連用1 外へ伸ばし
    連用2 外へ伸ばし
    連用3 外へ伸ば
    終止 外へ伸ばす
    連体 外へ伸ばす
    仮定 外へ伸ばせ
    命令 外へ伸ばせ
    可能 外へ伸ばせる
    表: 動詞活用後の対訳句コーパスの数
    対訳句コーパス名 対訳句対数
    英辞郎 1,350,299
    英辞郎(動詞活用) 3,155,108
     



    平成25年2月12日