next up previous contents
Next: 使用ツール Up: パターンの運用 Previous: Step2   目次


機械学習を利用した照合結果の選択

4.1のパターン化基準を参考に作成した素性生成ルール(表 5.1)で照合結果毎に真理値ベクトルを作成する(図 5.1).このベクトルを利用し,機械学習で各照合結果を採用すべ きか破棄すべきかの識別を行う.
図 5.1: 真理値ベクトルのイメージ


表 5.1: 素性生成ルール
素性ID 素性生成ルール(T/F)
g1-1 パターンの原文は,はが構文か
g1-2 マッチした文は,はが構文か
g1-3 g1-1およびg1-2の判定は一致しているか
g2 主語はあるか
g3 パターン原文の主語の前に連体修飾節があるか
g4-1 マッチした文の主語の前に連体修飾節があるか
g4-2 g3およびg4-2の判定は一致しているか
g5 はが構文かつ,助詞「は」および「が」があるか
g6 非はが構文かつ,助詞「は」または「が」があるか
g7 述語はあるか
g8-1 パターン原文に追加情報はあるか
g8-2 マッチした文に追加情報はあるか
g8-3 g8-1およびg8-2の判定は一致しているか
g9 文末に判定詞はあるか
g10 マッチしたパターンに名詞の字面が残っているか
g11 照合結果で想定されている型名は何か(非真理値)
a4-1 属性の意味属性コードは全て抽象か
a4-2 属性の意味属性コードは全て具体か
a4-3 属性の接尾辞は ``数え方の辞典''[7]にあるか
a4-4 属性の品詞は用言性名詞か
a4-5 属性の品詞は形容動詞転成型名詞か
ec4-1 意味属性コード上で主語は述語の上位か(不明はF)
ec4-2 意味属性コード上で主語は述語の下位か(不明はF)
ec4-3 主語と述語の共通する意味属性コードはあるか
ec4-4 主語に意味属性コードはあるか
ec4-5 述語に意味属性コードはあるか
e5-1 述語は固有名詞か
e5-2 述語はカギ括弧で囲われているか
e5-3 述語はアルファベットの単語か
e6 主語は形式名詞か
e7 主語の前に連体修飾表現があり,追加情報がないか
c5-1 主語は固有名詞か
c5-2 主語はカギ括弧で囲われているか
c5-3 主語はアルファベットの単語か
c6 主語の直前に指示詞があるか
c7 マッチしたパターンに定形表現があるか



Subsections
next up previous contents
Next: 使用ツール Up: パターンの運用 Previous: Step2   目次
2015-03-14