next up previous contents
次へ: 実験の結果 上へ: 汎化・無効化の効果の実験 戻る: 実験の方法   目次

実験の様子

図 3: 文型パターンパーサの構成図
\includegraphics[width=17.0cm,clip]{rei.eps}
文型パターンパーサ[5]を使用した時の入力文と照合結果の例を示す.

$\bullet$入力文を以下に示す.
「海上保険業者は委付を受諾することに決定した。」
照合結果の出力ファイルの形式の仕様を以下に示す.

  1. INPUT=「入力形態素ファイル名」=「文字位置ビット」=「形態素位置ビット」
  2. 入力文
  3. 形態素情報
  4. 入力情報の区切り記号
  5. PATTERN=「適合パターン番号」=「パターン記述」=「経路情報」=「適合文字位置ビット」=「適合形態素位置ビット」
  6. 変数名=「標準形表記」=「原文表記」=「経路情報」=「適合文字位置ビッ ト」=「適合形態素位置ビット」
$\bullet$照合結果の出力ファイルを以下に示す.

INPUT=BA000002-00=0x3fffff= $\underline{0x7ff}_{(3)}$
海上保険業者は委付を受諾することに決定した。
1. /海上保険(1100,{NI:1170,NK:88})
2. +業者(1100,{NI:273,NI:268,NI:374,KR:4308s05})
3. +は(7530)
4. /委付(1220,NI:1725)
5. +を(7430)
6. /受諾する(2437,NI:1732,NY:32,KR:4208a65)
7. /こと(1800,事,NI:1235,KR:9904h00)
8. +に(7430)
9. /決定し(2433,決定する,NI:1442,NI:1022,NY:20,NY:32,NY:5,KR:1700a02)
10. +た(7216)
11. +。([P]0110)
12. /nil

---

PATTERN= $\underline{WJ161968}_{(1)}$-01= /y </tk $N1$は> /cf $N2$
/cf($V3$^rentai|$V3$.kakodarou^rentai) ! ことに /cf
($V4$|$V4$.kakodarou|$V4$.teinei|$V4$.teinei.kakodarou|$ND4$をしました)。
=[/y , /tk ,$N1$,は, /cf,$N2$,を, /cf ,$V3$, ! ,ことに,/cf ,$V4$,.kakodarou,。]
= $\underline{0x3fffff}_{(2)}$= $\underline{0x7ff}_{(4)}$
/y===?=0x000000=0x000
/tk===?=0x000000=0x000
N1=海上保険業者=海上保険業者=n(ncx(1),ncxmk(1),ncx(2))=0x00003f=0x003
/cf===?=0x000000=0x000
N2=委付=委付=n(ncx(4))=0x000180=0x008
/cf===?=0x000000=0x000
V3=受諾する=受諾する=v(ve(6))=0x003c00=0x020
/cf===?=0x000000=0x000
V4=決定する=決定し=v(ve(9))=0x0e0000=0x100

---

PATTERN= $\underline{WJ188987}_{(1)}$-01=/y</tk$N1$は>#1[/cf$GEN3$]/k$N4$は/cf
($V5$^rentai|$V5$.kakodarou^rentai|$ND5$をする) ! ことに /cf
$V6$#2[.kakodarou]。=[/y , /k ,$N4$,は, /cf ,$V5$,! ,ことに, /cf ,$V6$,.kakodarou,。]
= $\underline{0x3ffc7f}_{(2)}$= $\underline{0x7e7}_{(4)}$
/y===?=0x000000=0x000
/tk===?=0x000000=0x000
N4=海上保険業者=海上保険業者=n(ncx(1),ncxmk(1),ncx(2))=0x00003f=0x003
V5=受諾する=受諾する=v(ve(6))=0x003c00=0x020
/cf===?=0x000000=0x000
V6=決定する=決定し=v(ve(9))=0x0e0000=0x100
#2=[.kakodarou]=0x100000=0x200

---

照合結果の出力ファイルから評価パラメータを求めるには, まず照合結果の適合パターンの中から,自己パターンと他パターンを分 ける. 自己文型パターンと他文型パターンを分けるには,入力形態素ファイル名と入力文の自己 パターンのパターン番号があるDBを用い,照合結果のアンダーライン(1)と 比べ,適合パターン番号が同じなら自己パターン,適合パターン番号が異な るなら他パターンとなる. そして,以下の方法で照合結果から評価パラメータの式の値を求める.
$\bullet$$R1$は,照合結果に他パターンあれば$M$の値が1つ増える.
$\bullet$$R2$は,照合結果の中で,自己パターン以外のアンダーライン(2)の値(16進数) を調べ,その中で最も高い値を$Mj$とする.
$\bullet$アンダーライン(3)とアンダーライン(4)を比べ,値が同じなら$P_{N1}$が1つ, 値が異なるのなら$P_{N2}$が1つ増える.

このように,入力文毎の照合結果から求めた値を(1)〜(4)式に 代入し,それぞれの評価パラメータを求める.


平成17年3月22日