next up previous
Next: 変数化の改良点 Up: 変数化の問題点 Previous: 変数化の問題点

変数化失敗の原因


本研究では,単語の変数化を自動的に行った.変数化に失敗した原因を検証するた め,ランダムに抽出した100件の単文において、変数化できなかった単語を調査し た.以下に名詞について変数化に失敗した原因の分類を示す.

  1. 分類A:対訳単語
    日本語単語は辞書にあるが,対応する英語単語が英語文の単語と異なっている場合.例文に関して,辞書には,株価⇔stock price と載っている.

  2. 分類B:複数単語
    対訳の英語単語が複数単語である場合.例文に関して辞書には,一塁⇔first base と載っているが,本研究では複数単語の変数化に対応できていない.

  3. 分類C:表現の異なり
    日本語側では名詞扱いだが,英語文では動詞など異なる品詞で表現されている場合.例文に関して「裸」が日本語側では名詞と判断されているが英語側では''be naked''と表現されている.

  4. 分類D:不足単語
    日本語単語が全く辞書に載っていない場合.例文の名詞「しきたり」は,本研究で用いた日英対訳辞書に載っていない.
  5. 分類E:形態素解析ミス
    形態素解析ミスの場合.例文の「非常」が形態素解析によって名詞と判断されていた.



Jin'ichi Murakami 2006-03-11