next up previous contents
Next: 単文抽出手順 Up: 単文抽出とデータベース作成 Previous: 単文抽出とデータベース作成   Contents

単文の条件

本研究では,単文の条件を定義してCREST対訳例文100万件[3]より単文を 自動的に抽出する.一般的には、単文とは「述語が一つだけから成る文」である と述べられているが,本研究では、単文の条件を日本語側からみて定義する.
  1. 文中に動詞がひとつだけある文.
  2. 文中に動詞がなく,複合動詞がひとつだけある文.
  3. 文中に動詞,複合動詞,形容詞がひとつもなく,形容詞がひとつだけある文.
  4. 文中に動詞,複合動詞,形容詞,形容動詞がひとつもなく,形容動詞がひとつ だけある文.
  5. 文中に動詞,複合動詞,形容詞,形容動詞がひとつもなく,文末が'名詞+付 属語'で終わっている文.
  6. 疑問文,命令文,会話文は対象外とする.


Jin'ichi Murakami 2006-03-11