next up previous
Next: 日英対訳パターンの作成 Up: 単文抽出 Previous: 単文抽出

単文の条件


本研究では,単文の条件を定義してCREST対訳例文100万件[3]より単文を 自動的に抽出する.一般的には,単文とは「述語が一つだけから成る文」である と認識されているが,定義は曖昧であることが多い.そこで,本研究では,単文の条件を日本語側からみて以下のように定義する.

  1. 文中に動詞がひとつだけある文.
  2. 文中に動詞がなく,複合動詞がひとつだけある文.
  3. 文中に動詞,複合動詞,形容詞がひとつもなく,形容詞がひとつだけある文.
  4. 文中に動詞,複合動詞,形容詞,形容動詞がひとつもなく,形容動詞がひとつ だけある文.
  5. 文中に動詞,複合動詞,形容詞,形容動詞がひとつもなく,文末が'名詞+付 属語'で終わっている文.
  6. 疑問文,命令文,会話文は対象外とする.



Jin'ichi Murakami 2006-03-11