Next: 変数化の改良点
Up: 変数化の問題点
Previous: 変数化の問題点
本研究では,単語の変数化を自動的に行った.変数化に失敗した原因を検証するた
め,ランダムに抽出した100件の単文において、変数化できなかった単語を調査し
た.以下に名詞について変数化に失敗した原因の分類を示す.
- 分類A:対訳単語
日本語単語は辞書にあるが,対応する英語単語が英語文の単語と異なっている場合.例文に関して,辞書には,株価⇔stock price と載っている.
- (Aの例)
- 日本文…株価が2割5分下がった。
- 英語文…Stocks went down 25 percent.
- 分類B:複数単語
対訳の英語単語が複数単語である場合.例文に関して辞書には,一塁⇔first base と載っているが,本研究では複数単語の変数化に対応できていない.
- (Bの例)
- 日本文…吉田選手が一塁を守っている。
- 英語文…Yoshida plays first base.
- 分類C:表現の異なり
日本語側では名詞扱いだが,英語文では動詞など異なる品詞で表現されている場合.例文に関して「裸」が日本語側では名詞と判断されているが英語側では''be naked''と表現されている.
- (Cの例)
- 日本文…上半身裸であった。
- 英語文…She was nakes to the waist.
- 分類D:不足単語
日本語単語が全く辞書に載っていない場合.例文の名詞「しきたり」は,本研究で用いた日英対訳辞書に載っていない.
- (Dの例)
- 日本文…西洋流の教育によって村人たちのしきたりは衰えている。
- 分類E:形態素解析ミス
形態素解析ミスの場合.例文の「非常」が形態素解析によって名詞と判断されていた.
Jin'ichi Murakami
2006-03-11