next up previous contents
次へ: 調査結果 上へ: 調査対象 戻る: (4)既存の選択記号から, 新たに作成した選択記号に均一化した単語レベル文型パターン辞書(新作成)   目次

選択記号の変数化

文型パターンパーサで選択記号のある日本語パターンを照合する際, 選択記号の表 現要素を全て展開し, 全ての組合せの日本語パターンを作成してから圧縮をする 作業を行う. しかし, その圧縮のルーチンにバグが有るため, 本研究のように表現要素数 が多い選択記号を扱う際は圧縮をしない方が良いと考えられる.

そこで, 各辞書に付与された選択記号を, [5]で示された「S型変数」および「A 型変数」に置き換えた. ただし,^関数をA型変数で定義することが困難な ことから, 変数を含んだ選択記号は変数化せず全て字面の表現要素のみで構成さ れている選択記号のみを変数化した. 手順を以下に示す.

手順1
まず, 最も選択記号の種類数が多い単語レベル文型パターン辞書 (4)において使用している選択記号から, 変数を含まない全ての選択 記号を抜き出す.

なお, 抜き出した選択記号の種類数は2,910個であった.

手順2
A型およびS型変数の定義ファイルを作成する.

<例:選択記号(NO|No|no|ノー)の場合>
 

A型変数の定義ファイル

SENAAA

arc(1,2,SSENAAA)

arc(2,0,pop)

end

S型変数の定義ファイル

SSENAAA

NO

No

no

ノー

end

なお, A型変数は「SEN+アルファベット3文字」で名前を付けており, アルファ ベット3文字の箇所は「AAA」から順にAAB,AAC・・・と26進数で番号を 示している. また, S型変数にはA型変数の名前の頭にSを付けてある.

手順3
選択記号をA型変数に置き換える辞書を作成する.

<例>
 

(NO|No|no|ノー) → SENAAA

手順4
手順3で作成した辞書を用い, 各単語レベル文型パターン辞書の 選択記号をA型変数に置き換える.

以上の手順を日本語パターンに使用した例を以下に示す.

単語レベル文型パターン辞書(2)の日本語パターン
 

$/y$1/tk\char93 1[N2の]/kN3を/cf(食っ|くっ)て$1$^{$!この$} $/kあたりは/cfどの/kN4も/cf(V5.teiru|ND5をしている)。$

単語レベル文型パターン辞書(4)の日本語パターン
 

$RSNY6$1RSNTK7\char93 1[N2の]RSNK8N3をRSNCF9(食っ|喰っ|くっ|くらっ|喰らっ|食らっ)(て|で)$1$^{$!この$} $RSNK10あたりはRSNCF11どのRSNK12N4も$


$RSNCF13(V5.teiru|ND5をしている)。$

単語レベル文型パターン辞書(4)の日本語パターンの選択記号を変数化
 

$RSNY6$1RSNTK7\char93 1[N2の]RSNK8N3をRSNCF9SENCWR15SENANJ14$1$^{$!この$} $RSNK10あたりはRSNCF11どのRSNK12N4もRSNCF13(V5.teiru|ND5をしている)。$

また, 今回作成したA型変数およびS型変数の定義ファイルの例を以下に示す.

A型変数の定義ファイルの例
 

SENAAB

arc(1,2,SSENAAB)

arc(2,0,pop)

end

SENAAC

arc(1,2,SSENAAC)

arc(2,0,pop)

end

S型変数の定義ファイルの例
 

SSENAAB

あい

すい

空い

明い

end

SSENAAC

あい

すい

空い

明い

開い

ひらい

啓い

拆い

擺い

攤い

闡い

end



平成18年3月24日