Next: 日本語選択
Up: 変換テーブル選択
Previous: 変換テーブル選択
目次
本研究は誤った変換テーブルの削除を目的とする.
変換テーブルはAとC, またBとDの置き換えを想定している.
正しい変換テーブルはAとC, またBとDの文中での置き換えが可能である場合が多い.
そこで本手法は, 文中における句の置き換え可否を検証し, 誤った変換テーブルを削除する.
本手法は, 分布仮説[9]を利用し, 前後環境が等しい句は置き換えが文中において可能という考えに基づく.
前後環境は文中における句の前後の単語を利用する.
具体的には, 前後の単語の比較を学習文対内にて行う.
そして, 一致する前後の単語の組み合わせが存在しなければ変換テーブルを削除する.
変換テーブル選択は日本語と英語を利用する.
以下は提案手法の手順である.
なお, 変換テーブル選択は2.3.4節で述べたABCDテーブルを対象とし, 提案手法を行なう.
- 手順1
- 変換テーブルの句(A,B,C,Dに相当)の前後の単語を学習文対から取り出す
- 手順2
- 手順1で取り出した前後の単語を比較する
日本語選択 : A と C の前後の単語を比較する
英語選択 : B と D の前後の単語を比較する
- 手順3
- 合致する前後の単語が無ければ変換テーブルを削除する
なお, 提案手法はモノリンガルコーパスのみを利用して行うことが可能である.
Subsections
2020-03-11