next up previous
次へ: NLP_sentaku2 上へ: NLP_sentaku2 戻る: NLP_sentaku2

startsection subsubsection3@0.20.1*(4)既存の選択記号から, 新たに作成した選択記号に均一化したパターン辞書(新作成)

例えば, 例5の選択記号と例6の選択記号は, 一部同じ表現要素を持っている. この 2つの選択記号は例7のように一つにまとめることができる.

このように一部同じ表現要素を持っている選択記号どうしを組み合わせて新たに選択 記号を作成し, 文型パターンに付与することで新たなパターン辞書を作成する.

<例5>
(上がっ|上っ|あがっ|のぼっ|上ぼっ|躋っ|躋ぼっ|隲っ| 隲ぼっ)

<例6>
(挙がっ|あがっ|挙っ|上がっ|上っ|擧がっ|擧っ|舉がっ| 舉っ|驤がっ|驤っ)

<例7>
(上がっ|上っ|あがっ|のぼっ|上ぼっ|躋っ|躋ぼっ|隲っ| 隲ぼっ|挙がっ|挙っ|擧がっ|擧っ|舉がっ|舉っ|驤がっ|驤っ)

作成手順を以下に示す.

手順1〜3
パターン辞書(3)の作成手順1〜3に同じ.
手順4
既存の選択記号のうち, 同じ表現要素を一つでも持っている選択記号 があれば選択記号どうしを合わせ新たな選択記号を作成する.

ここで, 変数を含む選択記号は, 同じ表現要素を持つものが多く非常に長い 選択記号となることが予想されたため, 2669種類の選択記号から変 数を持たない選択記号2131種類を使用し新たに選択記号を作成した.

手順5
手順4で作成した選択記号と既存の選択記号を合わせ, (3)のパ ターン辞書の作成手順と同様に選択記号に置き換える辞書を作成する.

手順6
辞書に従い, 選択記号を置き換える.
このパターン辞書において,選択記号の述べ数は190239個であり, 種 類数は新たに779種類作成し合計3448種類になった.



root 平成18年3月24日