next up previous
次へ: 「数の概略」 上へ: gakkai 戻る: 接頭・接尾辞の分類

接頭・接尾辞の翻訳方法


対訳コーパスに使用されている40種類の接頭・接尾辞(用例数589件)のうち、本研究では使用頻度の高い19種類(用 例数504件)を検討対象とする。
また、接頭・接尾辞の翻訳規則の記述では,ターゲットの名詞と接頭・接尾辞の意味的用法を表すため,「意 味属性番号」を使用する。また,数詞で示される数量の細かさを表す尺度として,新たに「精細度」を定義する。ここ で使用する「意味属性番号」と「精細度」は,以下の通りである。

「意味属性番号」
日本語語彙体系[5](岩波書店)で規定されたもので,約40万語の名詞の意味的用法を最大12段、2710の属性 に分類した木構造の番号を表す。

「精細度」
例えば,「約1230個」と「約1000個」の表現を比べると,前者の示す数値が細かいのに対して後者の示す数量は大ま かである。このような数量表現の表す数値の「細かさ」と「大まかさ」を表現するため,数詞の桁数に対する有効数字 の割合を表す指標として「精細度」を以下の通り定義する。

\begin{displaymath}
数の精細度 =\frac{桁数 − 0の桁の個数}{桁数}
\end{displaymath} (1)


この値は,0〜1までの範囲にあり,1に近付くほど細かさが増す。以下,精細度の計算例を示す。
例:1234560000 → 6/10 = 0.6 (1に近付く程明確)
例:1000000000 → 1/10 = 0.1 (0に近付く程曖昧)



Subsections

平成13年3月22日