next up previous
次へ: NLP_sentaku2 上へ: NLP_sentaku2 戻る: NLP_sentaku2

startsection subsection2@0.20.05選択記号の表現要素を新たに発見する方法 選択記号内の表現要素を発見する方法として, 現在のパターン内の選択記号が付与され ている箇所を2形態素までならパターンパーサで受理できるようにし, 置き換えた表現要素が選択記号の表現要素として使用可能かどうかを調査した.

<例12>
日本語原文:そこで笑ってはだめだ。

日本語パターン:$/y\char93 1[$そこで$]/fV2$(て|で)は$/cf$だめだ。

$/y\char93 1[$そこで$]/fV2*$$/cf$だめだ。

具体的な例を示す. 例12において, パターン中の選択記号(て|で)のかわりにどのような表現要素 でも受理可能である$*$の記号をつけ, 入力文12万文と照合を行った.

$*$で受理された表現要素を受理された回数 でソートし, 上位100件ほどを調べたところ, 「ていて」という表現要素を発見した. この表現要素は, 例13の文を入力しても受理するよう(て|で|ていて)のように新 たに選択記号の表現要素として追加しても構わないと考えられる.

<例13>
そこで笑っていてはだめだ。

しかし, 選択記号(て|で)の箇所のかわりに受理された表現要素は本来103964件あり, そ の中から人手で追加可能な表現要素を捜すのは困難であった.



root 平成18年3月24日