next up previous contents
次へ: 句パターン辞書の記述の分析 上へ: 動作実験による問題分析 戻る: パターン照合実験の結果   目次

原因分析

前節のパターン照合実験の結果の原因を調査すると,次の2点が明らかになった.
  1. 前節1の結果は,結果出力できない日本語パターンと同一の日本語パター ンを持つ,他の句パターンが多く存在していることが原因であった.
  2. 前節2の結果は,日本語パターン中の形容詞,形容動詞に付された様相関 数が,照合データとして参照されないことが原因であった.
同一の日本語パターンを持つ,句パターンの例を図4.5に示す.
図 4.5: 同一の日本語パターンをもつ例
\begin{figure}\par
\hrule width 16cm
\vspace*{1em}
\begin{verbatim}AC000004-0...
...fkN1の/kN2。 WE000122-00:N2 of N1.\end{verbatim}
\hrule width 16cm\end{figure}

4.5の2例とも,同一の日本語パターン「/tcfkN1の/kN2。」を持っている.しかし, 日本語字面,英語字面,英語パターンは異なっているため,一例めの日本語パター ンIDは「WJ000002-00」,二例めの日本語パターンIDは「WJ000122-00」の異なる 日本語パターンIDを割り当てている.

パターン照合に,例えば,「少女の帽子。」を用いると,上記2例とも,「少女」 が日本語変数N1に当たり,帽子が日本語変数N2に当たることから,どちらのパターンも マッチする. しかし,照合にマッチするパターンが多すぎると,パターン照合プログラム SPMへの負担が大きく,結果出力に失敗する.

4.1に同一日本語パターンが多数見られる日本語パターンの例を 示す.


表 4.1: NPの日本語パターンでよく現れるパターンの例
日本語パターン パターン数
$\char93 $1[GEN2]/kN3。 3088
$\char93 $1[/cfGEN2]/kN3。 2928
/cfGEN1/kN2。 2911
/tcfkN1の/kN2。 2313
$\char93 $1[/tcfkN2の]/kN3。 2223
   

4.1では,「#1[〜]」が任意要素記号を示しており,「[ ]」内 の記述があってもなくても,パターン照合にマッチすることを示している. よって,入力日本語文「少女の帽子。」に対する照合では,「/tcfkN1の/kN2。」, 「#1[/tcfkN2の]/kN3。」のどちらもマッチすることになる.

次に,形容詞,形容動詞に付された様相関数が,照合データとして参照されない パターンの例を,図4.6に示す.

図 4.6: 様相関数が照合データとして参照されない例
\begin{figure}\par
\hrule width 16cm
\vspace*{1em}
\begin{verbatim}AG015398-0...
...WE000310-00:needed N1's
N(AJV2).\end{verbatim}
\hrule width 16cm\end{figure}
日本語パターンWJにおいて,「.joutaihenka」が様相関数であり,例えば,日本 語入力文の「医者の厄介になる」に対して,「になる」の部分に照合される関数である. 句レベルパターン照合を行う際,様相関数は句変数の外 で照合され,句変数には様相関数に相当する日本語表現は含まれない. よって,句変数相当部分として「医者の厄介」が指定され,日本語パター ンにおける「.joutaihenka」にあたる日本語表現「になる」が句変数相当部分に含まれないため, 照合に失敗する.

平成21年3月24日