next up previous
次へ: NLP_iikae4 上へ: 単文文型パターンの言い換えの抽出 戻る: 単文文型パターンの言い換えの抽出

startsection section1@0.40.1はじめに 最近, 分かりやすい文への書き換えや要約や機械翻訳への適用を目指した言 い換え技術に関する研究が盛んである. 言い換えのための知識(事例や規則)とし ては, 語彙資源やコーパスからの収集が代表的である[5]. このうち, コーパ スからの収集の方法において, [1]は対訳コーパスから同一の英文に対する 複数の日本文を用意し, 日本文どうしのアライメントを取る手法を提案している. この手法は, 得られる日本文の組の数が少なく, かつ組内 の日本文の文数も少ないと考えられる.

本研究は対訳コーパスから作成された文型パターンから, 同一の英語パターン に対する複数の日本語パターンを用意し, 日本語パターンのアライメントを取る 手法を提案する.

今回は, 単文文型パターン[2]に提案手法を用い, 英語パターンが同一で日本語パ ターンが異なる日本語パターンの組を収集したときの, 日本語パターンの組の量 を調査する. また, 得られた日本語パターンの組に対し, 言い換えの知識が収集 できた割合を調査する.



root 平成18年3月24日