next up previous contents
次へ: 分析2:「に・へ」使い分け 上へ: 素性の取捨に基づく分析による効果的な素性の俯瞰 戻る: 分析:手順   目次

分析1:「は・が」使い分け

素性の取捨に基づく分析により「は・が」の分析を行った.表6.1に取り除いた素性ごとの正解率を示す. 分析の結果,「は・が」の分類の際に素性群「述部$V$,体言の文節$N$,N以外体言,品詞,直,文脈情報」が有効であるとわかった. 最も効果の高い述部$V$に関する例文を次に示す.
述部$V$がなくても判断可能
 党首選のしこり【がorは】[述部$V$]とすれば、羽田氏人気は新進党にとってかえって波乱要因となるかもしれない。
 述部$V$=のこっている;【】=が
述部$V$がないと判断困難
 穏健派【がorは】、統一地方選前を[述部$V$]。
 述部$V$=主張する;【】=は
述部$V$がなくても判断可能な文は,文章の工夫で「は」をいれることも可能だが,「とすれば」が続く場合,一般的には「が」を使うことが多いだろうと判断できる.この問題に関しては,述部$V$に付く付属語からも人は予測している可能性がある. 判断困難な文は,使い分けを推定することは難しい. 一方の文は助詞がある程度予測可能であるものの,他の情報(「とすれば」)から読み取る必要がある. どちらの例文も,述部$V$の情報がないために判断が難しくなっていることから, 述部$V$が「は・が」の使い分けの判断に重要であることがうかがえる.


  • 素性の取捨に基づく分析:「は・が」
  • 表: 素性の取捨に基づく分析:「は・が」

    取り除いた素性 正解率
    なし 0.7467
    述部$V$ 0.7091
    体言の文節$N$ 0.7359
    共起 0.7610
    係り先 0.7468
    N以外体言 0.7298
    品詞 0.7392
    分類 0.7521
    0.7301
    他助詞 0.7477
    文脈情報 0.7430



    平成25年2月12日