次へ: 実験の結果
上へ: 汎化・無効化の効果の実験
戻る: 実験の方法
目次
文型パターンパーサ[5]を使用した時の入力文と照合結果の例を示す.
入力文を以下に示す.
「海上保険業者は委付を受諾することに決定した。」
照合結果の出力ファイルの形式の仕様を以下に示す.
- INPUT=「入力形態素ファイル名」=「文字位置ビット」=「形態素位置ビット」
- 入力文
- 形態素情報
- 入力情報の区切り記号
- PATTERN=「適合パターン番号」=「パターン記述」=「経路情報」=「適合文字位置ビット」=「適合形態素位置ビット」
- 変数名=「標準形表記」=「原文表記」=「経路情報」=「適合文字位置ビッ
ト」=「適合形態素位置ビット」
照合結果の出力ファイルを以下に示す.
- INPUT=BA000002-00=0x3fffff=
海上保険業者は委付を受諾することに決定した。
1. /海上保険(1100,{NI:1170,NK:88})
2. +業者(1100,{NI:273,NI:268,NI:374,KR:4308s05})
3. +は(7530)
4. /委付(1220,NI:1725)
5. +を(7430)
6. /受諾する(2437,NI:1732,NY:32,KR:4208a65)
7. /こと(1800,事,NI:1235,KR:9904h00)
8. +に(7430)
9. /決定し(2433,決定する,NI:1442,NI:1022,NY:20,NY:32,NY:5,KR:1700a02)
10. +た(7216)
11. +。([P]0110)
12. /nil
---
PATTERN=
-01= /y </tk
は> /cf を
/cf(^rentai|.kakodarou^rentai) ! ことに /cf
(|.kakodarou|.teinei|.teinei.kakodarou|をしました)。
=[/y , /tk ,,は, /cf,,を, /cf ,, ! ,ことに,/cf ,,.kakodarou,。]
=
=
/y===?=0x000000=0x000
/tk===?=0x000000=0x000
N1=海上保険業者=海上保険業者=n(ncx(1),ncxmk(1),ncx(2))=0x00003f=0x003
/cf===?=0x000000=0x000
N2=委付=委付=n(ncx(4))=0x000180=0x008
/cf===?=0x000000=0x000
V3=受諾する=受諾する=v(ve(6))=0x003c00=0x020
/cf===?=0x000000=0x000
V4=決定する=決定し=v(ve(9))=0x0e0000=0x100
---
PATTERN=
-01=/y</tkは>#1[/cf]/kは/cf
(^rentai|.kakodarou^rentai|をする) ! ことに /cf
#2[.kakodarou]。=[/y , /k ,,は, /cf ,,! ,ことに, /cf ,,.kakodarou,。]
=
=
/y===?=0x000000=0x000
/tk===?=0x000000=0x000
N4=海上保険業者=海上保険業者=n(ncx(1),ncxmk(1),ncx(2))=0x00003f=0x003
V5=受諾する=受諾する=v(ve(6))=0x003c00=0x020
/cf===?=0x000000=0x000
V6=決定する=決定し=v(ve(9))=0x0e0000=0x100
#2=[.kakodarou]=0x100000=0x200
---
照合結果の出力ファイルから評価パラメータを求めるには,
まず照合結果の適合パターンの中から,自己パターンと他パターンを分
ける.
自己文型パターンと他文型パターンを分けるには,入力形態素ファイル名と入力文の自己
パターンのパターン番号があるDBを用い,照合結果のアンダーライン(1)と
比べ,適合パターン番号が同じなら自己パターン,適合パターン番号が異な
るなら他パターンとなる.
そして,以下の方法で照合結果から評価パラメータの式の値を求める.
は,照合結果に他パターンあればの値が1つ増える.
は,照合結果の中で,自己パターン以外のアンダーライン(2)の値(16進数)
を調べ,その中で最も高い値をとする.
アンダーライン(3)とアンダーライン(4)を比べ,値が同じならが1つ,
値が異なるのならが1つ増える.
このように,入力文毎の照合結果から求めた値を(1)〜(4)式に
代入し,それぞれの評価パラメータを求める.
平成17年3月22日