次に、対応表から2つ以上の英訳語を持つ名詞を全て抽出し、意味属性を 用いた訳し分けがどの程度可能かを検討した。対象となった499語を調べた 結果、大きく以下の4つに分類することができた。
(1)訳し分け可能
複数ある訳語候補の意味属性が全て異なる場合を「訳し分け可能」とする。
たとえば表3の「かい」の項目を見ると各英訳語の意味属性は、''shellfish'' に対して[魚][魚介類]が、''shell''に対して[殻]が付与されており、お互いに 異なっているためこの2つの訳語候補を意味属性で完全に区別できる。 つまり、「貝を食べる。」という文を考えた場合、「かい」は生き物である「貝」 やその身を指しており、意味属性は[魚介類]、あるいは[魚]を持つために''shellfish'' という訳語が選ばれる。一方、「貝がうず高く積もっている。」という文では 「かい」は貝殻のことを指しており、意味属性は[殻]を持つため、英訳語は ``shell''となる。
同様に「スキー」という名詞について考えると、「スキーを楽しむ。」という 文では、「スキー」は雪の上を滑るスポーツのことを指しているので[スポーツ] という意味属性を持ち、英訳する場合には''skiing''という訳語が選択される。 これに対して「スキーを借りる。」というような文では、「スキーをするための 道具」を指しているので[遊び道具運動具]という意味属性を持ち、英訳 語としては''ski''が選ばれる。
このように、意味属性によって英訳語を完全に一意に決定できる名詞を ここに分類した。
(2)訳し分け不可能
英訳語に付与されている意味属性が全て同じ、あるいは辞書の情報として 意味属性がまったく付与されていない場合を「訳し分け不可能」とする。
表3の「きば」という名詞は、英語では象などの牙は''tusk''、犬や狼の牙は''fang'' というように使い分けるが、ALTの辞書を見るとどちらの訳語に対しても [牙]という意味属性が登録されている。したがって、元の日本語文で どのような使われ方をしていても、「きば」の意味属性は[牙]となってしまい、 この情報から''tusk''と''fang''を区別することはできない。
また、「かおり」については、この項目を見る限り辞書に意味属性が登録 されていないため、そもそも意味属性を訳し分けの情報として用いることが できない。
このような名詞については、意味属性を訳し分けのための情報として 利用できない。
(3)場合により訳し分け可能
日本語の解析の結果によって訳し分けが可能になったり不可能になったり する名詞を「場合により訳し分け可能」とする。
表3の「いいん」の項目を見ると、''committee''に対して [成員][複数]という意味属性が、''member of comittee''に対して [成員][単数]という意味属性が付与されている。この場合、日本語文の 解析の結果、「いいん」の意味属性が[成員]と決まると2つの訳語候補を 区別することはできない。しかし、[単数]と決まれば''member of comittee'' が、[複数]と決まれば''comittee''が選ばれる。例えば、「不況対策を 委員で話し合う。」「彼は生徒会の委員に選ばれた。」という2つの文を 考えた場合、前者は数名の委員の集まりを指しているので''member of comittee'' が、後者は委員会の中の1人を指しているので''comittee''が、それぞれの訳語 として選ばれる可能性がある。
もうひとつ、「だっせん」という名詞を例に挙げる。まず、電車などの 脱線事故を指す''derailment''については、[事件]という意味属性が 与えられており、他の2つの候補と重ならないため一意に決定できる。 しかし、''deviation''と''degression''に関しては、[目的]または [話]という意味属性が選ばれた場合はどちらか一方に決定できるが、 意味属性[指向偏向]が重なっているため、これが「脱線」の 意味属性に選ばれた場合は2つの候補を区別できない。このように、 訳語候補の中に一意に決定できる候補がある場合もここに含めた。
(4)絞り込み可能
訳語を一意に決定することはできないが、候補の数を減らすことができる 名詞を「絞り込み可能」とする。
例として表3の「き」の項目を見ると、5つある訳語候補が [樹木]という意味属性を持つものと[材木]という意味属性を持つ ものに分けることができる。 そこで、「庭に木を植える。」という文を考えた場合、「木」は 植物である「木」を指しているので意味属性は[樹木]となり、その結果、 訳語候補は[樹木]という意味属性をもつ''tree''、''shrub''の2つに 絞られる。同様に、「木の小屋を建てる。」という文では、「木」 は材木の意味で使われているので、英訳語は[材木]という意味属性を 持つ''wood''、''lumber''、''log''の3つの中のいずれか、ということに なる。
また、「あさ」という名詞については、日本語文の解析によって意味属性が [糸布]に決定した場合は、3つある訳語候補のうち''linen''が選ばれるが、 [作物]、または[繊維]のいずれかに決定した場合は''flax''、''hemp''の2候補が ともに同じ意味属性を持つため、どちらか一方を選択することはできない。 しかし、訳語候補の数でみると3つから2つに減少したといえるので、このような 名詞も「絞り込み可能」に分類した。
なお、「(3)場合により訳し分け可能」で挙げた「だっせん」の例と、 「(4)絞り込み可能」で挙げた「あさ」の例は、全ての候補に対して 一意に決定できる可能性があるかないか、という点で異なる。
つまり、どちらの例も3つある訳語候補のうち1つは一意に決定できる。 しかし、残った2つの候補については、「だっせん」の例ではどの 意味属性に決まるかによって訳し分けができる場合とできない場合に 分かれるのに対し、「あさ」の例ではどの意味属性が選ばれても 訳し分けはできない。
見出し語 | 意味属性 | 英訳語 | ||
訳し分け | かい | [魚][魚介類] | :shellfish | |
可能 | [殻] | (貝がら) | :shell | |
スキー | [スポーツ] | 滑る事 | :skiing | |
[遊び道具・運動具] | 道具 | :ski | ||
訳し分け | きば | [牙] | 象などの | :tusk |
不可能 | [牙] | 犬、狼の | :fang | |
かおり | - | 一般的 | :smell | |
- | 一般的 | :scent | ||
- | 芳香 | :perfume | ||
- | 芳香 | :aroma | ||
- | 芳香 | :fragrance | ||
場合によ | いいん | [成員][複数] | 全体 | :committee |
り可能 | [成員][単数] | 一員 | :member of a committee | |
だっせん | [指向・偏向][目的] | 方針・標準からの | :deviation | |
[指向・偏向][話] | 話の | :degression | ||
[事件] | 電車などの | :derailment | ||
絞り込み | き | [樹木] | 樹木 | :tree |
可能 | [樹木] | 灌木 | :shrub | |
[材木] | 材木 | :wood | ||
[材木] | 製材した | :lumber | ||
[材木] | 丸太 | :log | ||
あさ | [作物][繊維] | 亜麻およびその繊維 | :flax | |
[作物][繊維] | 麻、大麻およびその繊維 | :hemp | ||
[糸・布] | 麻製品 | linen |
以上の4つの基準で分類を行った結果、それぞれの割合は図2のようになった。 この図より、意味属性ではまったく訳し分けができない名詞は13%で、 ほぼ半分の55%は一意に訳し分けが可能、また、残りの32%の名詞に対しても 候補数の絞り込みなどの効果が得られたことが分かる。
図2 意味属性の語義識別能力
さらに、意味属性を用いることで表4のような効果が得られた。
平均多義数は、意味属性による訳語の選択を行うことで
およそ半分に減少、また、正解が得られる確率は、全ての候補が等確率
で選ばれる場合に比べて約2倍にまで向上した。
意味属性未使用 | 意味属性使用 | |
平均多義数 | 3.02 | 1.74 |
正解が得られる確率 | 38.7% | 78.6% |
以上のことから、意味属性は訳語選択に有効であると言える。