next up previous contents
次へ: 改良後の句パターン辞書の記述例 上へ: 句パターン辞書の改良 戻る: パターン照合結果出力失敗に対する改良   目次

その他の改良点

その他,以下の改良を行う.
  1. 日本語原文および日本語パターン末部の句点を削除する.また,英語原文 および英語パターン末部のピリオドを削除する.
  2. 日本語パターン末部の読点を削除する.
  3. 句パターン全体が任意要素として含まれている場合は任意要素記号を削除 する.

1の改良は句の見栄えを良くするためである.句の終わりに句点とピリオドがあ ると,一文の終わりと区別がつかないので,句パターン辞書の記述からは削除す る.

2の改良は,そのパターンに対して,パターン照合にマッチする条件を緩和する ためである. 日本語パターンに読点があると,句として指定された日本語表現に読点がない場 合,パターン照合にマッチしない. 日本語では,読点の振り方には個人差があるため,読点の位置を一意には決定で きない. よって,日本語末部の読点は削除することとする. 図5.3に改良前と改良後の例を示す.上が改良前,下が改良後を示す.

図 5.3: 日本語末部の読点を削除した例
\begin{figure}\par
\hrule width 16cm
\vspace*{1em}
\begin{verbatim}AC002980-0...
...に/tcfkNUM2 WE000006-00:NUM2 in N1\end{verbatim}
\hrule width 16cm\end{figure}

3の事例を図5.4に示す.

図 5.4: 句パターン全体にかかる任意記号の例
\begin{figure}\par
\hrule width 16cm
\vspace*{1em}
\begin{verbatim}AC004501-0...
...の/kあと] WE000007-00: ...
日本語パターン,英語パターン共に,パターン全体が任意要素として含まれている. この状態では,パターン照合時に,どの入力句表現ともマッチすることになる. よって,任意記号を削除することとする. 日本語パターンは「#1[/tcfkN2の/kあと]」から「/tcfkN2の/kあと」となり, 英語パターンは「#1[after N2]」から「after N2」となる.



平成21年3月24日