規則A.一般的な規則の導入
規則Aは従来の「数の概略」の翻訳規則を対訳コーパスに適用した規則である。なお、実行順序は正解率が最も高い順と
する
a:直前が「at」もしくは概数を表す動詞の場合訳は省略[5]
b:数詞に前後の幅がある場合訳は「some」、または「数詞-数詞 range」 [6]
c:数詞が10以下、ターゲットが単数系の訳は「some」以外 [5]
d:小数が存在する場合、訳は「around」以外 [7]
上記の規則から以下の図1に示す翻訳規則を作成した。
a:直前が前置詞、または | no | |||
概数を表す動詞 | → | 訳は省略される | ||
↓yes | no | |||
b:数詞に前後の幅がある | → | 訳は「some」 | ||
数詞-数詞 「range」 | ||||
↓yes | ||||
c:数詞が10以下、または | ||||
数量詞の対象が対数系 | yes | 「some」以外 | ||
↓yes | ||||
d:数詞の一桁目が0以外 | no | |||
小数が存在 | → | ※訳はaround以外 | ||
↓yes | ||||
規則Bに移動 | 『「※」 は条件を | |||
満たした後規則Bに移動』 | ||||
図:1 一般的な規則を用いた「数の概略」の翻訳方法 |
規則B.各接頭・接尾辞の特有の規則
規則Bは「約」、「前後」、「程度」がそれぞれもつ特徴から作成した
規則で、本稿では例として、接尾辞「程
度」がもつ意味から作成した規則を示す。
接尾辞「程度」の意味には以下の3種類がある[8]。
(1)「根本にかかわることではなく、程度がどういうことか」
(2)「程度の大小が物事の適否にかかわること」
(3)「ちょうど適当と考えれる度合」
対訳コーパスを調べた結果、「程度」が(1)の意味を持つ
とき訳は省略され、(2)の意味を持つときは「only」と訳される。(3)の意味を
もつ場合訳は複数の候補を持つため規則Cに移動する。上記の規則を
接尾辞「程度」の翻訳方法に加える。
規則C.各英訳の選択
規則Cは「数の概略」の各訳のもつ特徴から作成した規則で、数の曖昧性を判断
するために基準値を用いた。また、この規則においては複数の正解を持たせた。
数の概略の訳の候補には「about」、「approximately」、「around」、「roughly」
、「some」、「省略される」があり、以下に各訳の翻訳規則を示す。また、この訳を選
択する基準に0の数から数詞の曖昧性を判断する基準値を用いる。この基準値の式
も同様に以下に示す(これ以降、以下の式(1)を基準値とする)。
![]() |
(1) |
「about」 | - | 例外を除いてすべて正解 |
「approximately」 | - | 基準値が0.5の場合 |
「around」 | - | 数詞が100の位の場合 |
「roughly」 | - | 現在検討中 |
「some」 | - | 数詞が「万」以上の場合 |
「省略される」 | - | 直前に前置詞が来る場合 |