next up previous contents
次へ: 規模の異なるパターン辞書の汎化による推定法 上へ: 考察 戻る: の積の関係   目次

パターン辞書を汎化しない推定法

${\eta}_{R1}$${\eta}_{N}$のように近似的に対象辞書を構築せず,汎化の効 果を予想する推定法を検討する. そこで,本稿では,「時制・相・様相」のパターン辞書上の使用頻度 に関して求めた${\eta}_{d}$を提案する.

${\eta}_{d}$を求めるには,1パターンに対する汎化した箇所を求める.例えば,1パターンに対し1箇所汎化をした時,そのパターンは2倍 に増えたことになる.また,2箇所汎化をした時は,そのパターンは4倍に増えた ことになる.

以下に2箇所汎化した時の具体例を示す.
(汎化前)$N$1が$V$2.teiru.hitei
(汎化後)$N$1が$V$2$\sharp$1[.teiru]$\sharp$2[.hitei]。
(汎化後のパターンの展開1) $N$1が$V$2。
(汎化後のパターンの展開2) $N$1が$V$2.teiru
(汎化後のパターンの展開3) $N$1が$V$2.hitei
(汎化後のパターンの展開4) $N$1が$V$2.teiru.hitei

このように,汎化したことによって増えたパターンの総数を求め, その総数を基準パターンのパターン数で割ったものを${\eta}_{d}$とする. 汎化したことによって増えたパターンの総数は,すでに表4にまとめている. それぞれのパターン辞書の${\eta}_{d}$の値を表7にまとめる.

表7より,辞書(3)から辞書(13)の${\eta}_{R1}$${\eta}_{N}$の値は ${\eta}_{d}$の値と近似している. しかし,辞書(2)と辞書(14)の${\eta}_{R1}$${\eta}_{N}$${\eta}_{d}$と値 がかなり異なっている.これは,可能な限り時制を汎 化したので,入力文と照合しないパターンが多数存在したためだと考えら れる.

これより${\eta}_{d}$は相・様相の汎化では汎化の効果の予測ができる.しかし, 時制の汎化では汎化の効果の予測はできないと考えられる.


平成17年3月22日