next up previous contents
次へ: 利用するデータベースと文型パターンとプログラムと用言意味属性 上へ: syuron_hmaeta 戻る: 表一覧   目次

はじめに

日英機械翻訳において, 用例翻訳, 統計翻訳など様々な翻訳方式が提案されてい る. 提案されている多くの翻訳方式の1つにパターン翻訳がある. パターン翻訳は, 大量の文型パターンを用いて翻訳を行う翻訳方式である[1]. 従来, パターン翻訳を行う際, 使用する文型パターン数が少なかったが, 近 年, 大量の文型パターンを持つ文型パターン辞書が構築された[2]. また, [2]により, 日本語入力文12万文に対して60%以上の再現 率が示されている. しかし, 入力文の翻訳に使用できない 文型パターンが正解パターンと共に多く抽出されてしまい, 正解率が下がってし まう問題がある.

そこで, 本研究では, 用言意味属性を利用して文型パターンの絞り込みを行 い, 使用する用言意味属性の条件の違いによる適合率および正解率の変化を調査す る. また, 調査結果より考察を行い, 適合率を低下させず, 正解率を上げる為に 最適な用言意味属性の条件を明確にする. 具体的な調査方法として,まず文型パターンパーサを利用して文型パターンを 抽出する. 次に, 抽出された文型パターンの日本語パターンを用言意味属性を用 いてパターンの絞り込みを行う. そして, 残ったパターンに対して人手で評価を 行う. 最後に適合率および正解率を算出する.

調査の結果,入力文110文中, 実験1(jpp_20040816, 3LevelPattern_ver5.3.1)では38文, 実験2(jpp_20050627, 3LevelPattern_ver9.0.0)では62文が1つ 以上の日本語パターンの候補を抽出できた.次に, 用言意味属性を用いたパター ンの絞り込みを行った後, 正解率を算出した所, 実験1では用言意味属性を使用 しない場合の正解率は12%, 用言意味属性(IK第1分類)を使用し た場合の正解率は17%であった. また, 実験2では用言意味属性を使用しない場 合の正解率は14%, 用言意味属性(IK第1分類)を使用した場合の 正解率は18%であった. よって,本研究ではIK用いた文型パターンの絞り込みによって, 正解率が向上した事を確認した.

本稿は以下の章で構成されている. 2章では, 実験で使用するデータベー スとパターンとプログラムと用言意味属性について説明する. 3章では用言意味属性を用いたパターンの絞 り込み実験の実験手順について説明する. 4章では実験結果 を示す. 5章では, 実験結果より考察を行い, 最後に6章で本研究の結論を述べる.



平成18年3月24日