next up previous contents
Next: 単語レベル文型パターン Up: 日英重文複文文型パターン辞書 Previous: 日英重文複文文型パターン辞書   目次

概要

日英重文複文文型パターン辞書は,日本語と英語の重文複文を対象に非線形言語モデルに基づいた文型パターンが記述されている辞書であり,約13万文の対訳コーパスより作成された[1].

非線形言語モデルとは,言語表現に含まれる線形な要素と非線形な要素を見極め,線形表現要素を汎化することによって非線形な表現構造を取り出そうとするものである[4]. 線形要素とは,言語表現の構成要素(単語,句,節,など)のうち,それと同等の意味(概念)を持つ他の要素に置き換えても元の言語表現全体の意味(概念)が変化しない要素を「その言語表現に対する線形要素」という. 逆に,言語表現全体の意味(概念)が変化するとき,その要素を「その言語表現に対する非線形要素」という. また,線形要素は,それ自身1つの言語表現(句や節)であり,非線形要素と線形要素で構成されていると考えることもできる.

文型パターンは,線形な要素を変数として記述しており,非線形な要素を記号,関数や字面で表している. 変数には単語変数,句変数,節変数が存在する. 単語変数は,表現に含まれる名詞,動詞,形容詞,副詞などの自立語を表現要素とし,そのうちの線形なものを変数化している. 句変数は,名詞句,形容詞句,動詞句,副詞句など句を要素とし,そのうちの線形なものを変数化している. 節変数は,連体節,連用節などを要素と考え,そのうちの線形なものを変数化している. 単語変数は10種類に分類されており,句変数は5種類に分類されており,節変数は1種類である. 表2.1に,変数についてまとめた表を示す. 関数は,表記上の揺らぎを吸収し,適用範囲の広い文型パターンを記述するために用いられている. 関数は,様相関数と同値型グループ関数の2種類に分けられる. 様相関数は39種類あり,時制,相,態,様相などの助動詞相当表現を指定している. 同値型グループ関数は2種類あり,同種の意味の関数をグループ化して指定している. 表2.2に関数の例を示す. 記号は,文型パターン全体の非線形な構造を保ちながら,構造上の線形性を記述するために用いられている. 記号は,離散記号,文節境界記号,要素選択記号,任意要素記号,順序任意記号,位置変更可能記号の6種類である. 記号の例を表2.3に示す.

また,文型パターンは言語表現の文法的な構成単位に着目して3レベルで記述されている. 単語変数のみを用いて単語レベル文型パターンが作成されており, 単語変数及び句変数を用いて句レベル文型パターンが作成されている. また,単語変数,句変数及び節変数を用いて節レベル文型パターンが作成されている. 単語レベル文型パターンについて2.2節で説明し,句レベル文型パターンについて2.3節で説明し,節レベル文型パターンについて2.4節で説明する. そして,2.5節で文型パターン辞書の被覆率について説明する.

表 2.1: 変数
変数名 意味
N 名詞または名詞複合語
V 動詞
AJ 形容詞
AJV 形容動詞
ADV 副詞
TIME 時詞
GEN 限定詞
NUM 数詞
REN 連体詞
ND 用言性名詞
NP 名詞句
VP 動詞句
AJP 形容詞句
AJVP 形容動詞句
ADVP 副詞句
CL


表 2.2: 関数の例
記述子名 記述形式 意味
様相関数 .kako 日本語の過去形
様相関数 ^past 英語の過去形
同値型グループ関数 .#da 体言述部``だ",``で"などを表す


表 2.3: 記号の例
記述子名 記述形式 意味
離散記号 \y 連用節
文節境界記号 ! 文節の境界を受理
要素選択記号 (...|...) いずれかの要素列を受理
任意要素記号 [...] 文型選択上,任意の要素
順序任意記号 {...,...} 順序入れ替え可能な範囲
位置変更可能記号 $n^...,$n 指定位置に入れ替え可能


next up previous contents
Next: 単語レベル文型パターン Up: 日英重文複文文型パターン辞書 Previous: 日英重文複文文型パターン辞書   目次
2018-03-06