next up previous contents
Next: 作成の様子 Up: パターンの作成 Previous: パターンの作成   目次


パターン化基準

パターンの作成にあたって,3章の調査を基にパターン化基準を作成 する.これにより,パターン作成者個人に依存する揺れを抑える.全ての型名で 共通する基準と,各型名での基準があるので,共通(G),属性叙述型(A),外延叙 述型(E),範疇叙述型(C)の順で記述する(表4.1).パターン化 基準は,作業者に対する指示であり,「確認する」こと,「記述する」こと,お よび,「注意する」ことが混在している.

パターン作成の成果物はパターン辞書である.パターン辞書は多数のエントリで 構成する.1つのエントリは,「原文(1文以上)」,「パターン」,「選択条 件」,および,「応用情報」で構成される.

原文は,パターン,選択条件,および,応用情報を作成する際に参照する文であ る.

パターンは,1.2.2節を参照.本研究では,変数に,ANはア ルファベットと数字の連続,MTは連体修飾表現,MDは判定詞を含む モダリティ表現を表す変数を追加している.

選択条件は,照合結果の選択を行う際に使用する条件で,「修飾表現が主語の前 にあるか」というフラグである(3.4節参照). また,変数の意味属性制約もここに該当する.

応用情報とは,パターンを照合した際,出力される情報であり,意味解析結果と して得たい情報のテンプレートである.名詞述語文の場合,名詞述語文の叙述の 型名,および,3つ組がある. 3つ組の情報は,上位語,下位語,追加情報,実体,属性,および,属性値であ り,この組み合わせを3つ組とする. 追加情報は,述語の前にある連体修飾表現である(3.5節参 照).


表 4.1: パターン化基準
基準ID パターン化基準
G1 はが構文と非はが構文の2種類が存在する.
G2 主語はパターンでは名詞(連続した名詞の場合一つの名詞とみなす)と前 後の接辞まで含め変数化する.
G3 主語の前に連体修飾表現がある場合,変数化し,選択条件にフラグTを記す. また,連体修飾表現の変数の前に離散記号を記す.
G4 主語の前に連体修飾表現がない場合,選択条件にフラグFを記す.また,主 語の変数の前に離散記号を記す.
G5 はが構文の場合,助詞は,1つ目は「は」で2つ目が「が」で,助詞の直 後の読点まで字面に残す.
G6 非はが構文の場合,助詞は,「は」または「が」で,助詞の直後の読点ま で字面に残す.また,「は」および「が」の選択化,読点の任意化を行う.
G7 述語はパターンでは名詞(連続した名詞の場合一つの名詞とみなす)と前 後の接辞まで含め変数化する.
G8 述語の前に連体修飾表現がある場合,それが追加情報で,変数化し,そう でない場合,追加情報は付けない.また,助詞と追加情報の間の単語を 削除し,離散記号を記す.
G9 文末の判定詞を変数化し,以降を削除する.
G10 主語または述語の具体性が低い名詞と判断した場合は,該当名詞を字面 に残したパターンを別に作成し,計2パターン用意する.
G11 型名を確認し,応用情報に記す.
A1 属性叙述型から取り出される情報は,実体,属性,属性値の3つであり, 型名および3つ組を応用情報とする.
A2 主語は実体を表す.
A3 追加情報および述語は事例によってそれぞれが属性または属性値になり 得る.
A4 取り出される情報の述語は,抽象的な意味を持つ単語である.
E1 外延叙述型から取り出される情報は,上位語,下位語,追加情報の3つで あり,型名および3つ組を応用情報とする.
E2 主語は上位語を表す.
E3 述語は下位語を表す.
E4 相対的に見て主語が上位語で,述語が下位語である.
E5 述語が固有名詞で,主語は固有名詞でない場合は外延叙述型といえる.
E6 主語が形式名詞のように抽象度が高い場合は,外延叙述型といえる.
C1 範疇叙述型から取り出される情報は,下位語,上位語,追加情報の3つで あり,型名および3つ組を応用情報とする.
C2 主語は下位語を表す.
C3 述語は上位語を表す.
C4 相対的に見て主語が下位語で,述語が上位語である.
C5 主語が固有名詞で,述語は固有名詞でない場合は範疇叙述型といえる.
C6 主語の前に指示詞がある場合は,主語の抽象度が低いとみなすことがで きる.
C7 判定詞の前に単語自体で文を範疇叙述型と判定できる定形表現がある場合は, 該当部分を字面に残し,直前の名詞と接辞までを述語のように扱う.


next up previous contents
Next: 作成の様子 Up: パターンの作成 Previous: パターンの作成   目次
2015-03-14