next up previous contents
次へ: その他の改良点 上へ: 句パターン辞書の改良 戻る: 句パターン辞書の改良   目次

パターン照合結果出力失敗に対する改良

第4章のパターン照合結果出力失敗の問題を解決するため,以下の改良を行う.
  1. 名詞句において,パターン照合に使用する日本語パターンでは,日本語パターンの記述が重 複する場合は,それら全ての日本語パターンに対して,同一の日本語パターンIDを使用する.
  2. 日本語,英語の両パターンにおける変数に対して,字面や意味属性に よる制約条件を追加する.

1の改良により,日本語パターンの数を縮小し,パターン照合におけるSPMの負荷 を減少させる. このことにより,これまで照合結果を出力できなかった入力句表現に対しても, 照合結果を出力できるようにする.

1の改良で,1つの日本語パターンが複数の英語パターンを持つこととなる. そこで,ITMによる翻訳において,多数の英語パターンの候補の中から, 使用するパターンの絞り込みを行えるよう,2の記述を追加する. 図5.1に改良前の句パターン辞書の例を示す. また,図5.2に改良前の句パターン辞書の例を示す.

図 5.1: 改良前の名詞句パターン例
\begin{figure}\par
\hrule width 16cm
\vspace*{1em}
\begin{verbatim}LJ000001-0...
...ytcfkN1の/kN2 WE005270-00:N2 in N1\end{verbatim}
\hrule width 16cm\end{figure}

図 5.2: 改良後の名詞句パターン例
\begin{figure}\par
\hrule width 16cm
\vspace*{1em}
\begin{verbatim}LJ000001-0...
...1 N2(OR:The fire) N1(OR:the stove)\end{verbatim}
\hrule width 16cm\end{figure}
5.1では,日本語パターンは両パターンどちらも「/tcfkN1の/kN2」 で同一であるが,日本語パターンIDは,上の例が「WJ000002-00」,下の例が 「WJ005270-00」であり異なっている. 図5.2では,日本語パターンは,両パターンどちらも「/tcfkN1の/kN2」 で同一であり,同一の日本語パターンID「JNP000001」を割り当てている.英語 パターンは,上の例では「N1^poss N2」,下の例では「N2 in N1」で異なってい るため,英語パターンIDは,上の例では「ENP000001」,下の例では, 「ENP000002」であり異なる英語パターンIDを割り当てている.



平成21年3月24日