next up previous contents
次へ: 目次 上へ: mysoturon 戻る: mysoturon   目次

概要

機械翻訳の分野では、翻訳精度を向上させるため、用例を利用する 方法が提案されている。用例翻訳に利用される用例検索システムは、 翻訳する文に対して最も表現の類似した文とその対訳を データベースから高速に検索することが求められる。 従来提案されている手法では、文の構造的な情報が利用されて おらず、文の構造の類似性を判定するのは困難である。

そこで本研究では、文の構造の類似性の判定に日本文の持つ 係り受け関係を利用し類似文を検索する手法を提案する。 この方法は、 日本文の持つ係り受けの特徴を利用し、係り受けを構成する文節をペアで 扱うことで文の類似性を判定するもので、一致する文節ペア数が最も多い文を 類似文とする。この手法では、昨年の研究成果である 日本語類似文検索アルゴリズムの研究[3]の手法を取り入れ アルゴリズム全体を構成する。提案したアルゴリズムの動作を確認する ため、アルゴリズムに基づいた類似文検索システムを試作し、 独自に作成したデータベース120文に対して入力文20文を用いて実験を 行った。実験により、複雑な係り受け関係を持つ文に対しても 類似文を決定することができた。



平成14年5月1日