next up previous contents
次へ: 選択記号の変数化 上へ: 調査対象 戻る: (3)既存の選択記号で最も表現要素数が長い選択記号に均一化した単語レベル文型パターン辞書(最長均一化)   目次

(4)既存の選択記号から, 新たに作成した選択記号に均一化した単語レベル文型パターン辞書(新作成)

例えば, 例5の選択記号と例6の選択記号は, 一部同じ表現要素を持っている. この 2つの選択記号は例7のように一つにまとめることができる.

このように一部同じ表現要素を持っている選択記号どうしを組み合わせて新たに選択 記号を作成し, 日本語文型パターンに付与することで新たな単語レベル文型パター ン辞書を作成する.

<例5>
 

(上がっ|上っ|あがっ|のぼっ|上ぼっ|躋っ|躋ぼっ|隲っ| 隲ぼっ)

<例6>
 

(挙がっ|あがっ|挙っ|上がっ|上っ|擧がっ|擧っ|舉がっ|舉っ|驤がっ|驤っ)

<例7>
 

(上がっ|上っ|あがっ|のぼっ|上ぼっ|躋っ|躋ぼっ|隲っ|隲ぼっ|挙がっ|挙っ|擧がっ|擧っ|舉がっ|舉っ|驤がっ|驤っ)

作成手順を以下に示す.

手順1〜3
単語レベル文型パターン辞書(3)の作成手順1〜3に同じ.
手順4
既存の選択記号のうち, 同じ表現要素を一つでも持っている選択記号 があれば選択記号どうしを合わせ新たな選択記号を作成する.

ここで, 変数を含む選択記号は, 同じ表現要素を持つものが多く非常に長い 選択記号となることが予想されたため, 2,669種類の選択記号から変 数を持たない選択記号2,131種類を使用し新たに選択記号を作成した.

<例>
 

(空い@2114@|すい@2114@)

(空い@2114@|あい@2114@|開い@2114@|明い@2114@)

(空い@2114@|あい@2114@|すい@2114@|明い@2114@|開い@2114@)

手順5
手順4で作成した選択記号と既存の選択記号を合わせ, 単語レベ ル文型パターン辞書(3)の作成手順と同様に選択記号に置き換える辞書を 作成する.

<例>
 

(空い@2114@|あい@2114@|すい@2114@|明い@2114@|開い@2114@)→(空い@2114@|あい@2114@|すい@2114@|明い@2114@|開い@2114@)

(空い@2114@|あい@2114@|開い@2114@|明い@2114@)→(空い@2114@|あい@2114@|すい@2114@|明い@2114@|開い@2114@)

(空い@2114@|すい@2114@)→(空い@2114@|あい@2114@|すい@2114@|明い@2114@|開い@2114@)

;空い@2114@;→(空い@2114@|あい@2114@|すい@2114@|明い@2114@|開い|@2114@)

;あい@2114@;→(空い@2114@|あい@2114@|すい@2114@|明い@2114@|開い@2114@)

;すい@2114@;→(空い@2114@|あい@2114@|すい@2114@|明い@2114@|開い@2114@)

;明い@2114@;→(空い@2114@|あい@2114@|すい@2114@|明い@2114@|開い@2114@)

;開い@2114@;→(空い@2114@|あい@2114@|すい@2114@|明い@2114@|開い@2114@)

手順6
辞書に従い, 選択記号を置き換える.
この単語レベル文型パターン辞書において,選択記号の述べ数は 190,239個であり, 種類数は新たに779種類作成し合計3,448種類になっ た. 種類の詳細は付録3に示す.



平成18年3月24日