ここで、3.2で挙げた6つの分類について検討する。
1)「多義のない名詞」
1)に分類された2語は、今回検討した範囲では多義が無かったため、
名詞の訳語選択では問題にならないだろう。なお、さらに広い範囲で
統計をとった場合、「東京」を''Tokio''と表記するなどの異なる候補が
現れる可能性があるが、ここに分類された「東京」「日本」はいずれも
地名であるため、どの候補を選んでも大きな間違いにはならないと思われる。
また、どちらの名詞も訳されていない場合があったが、これには2つの場合が
あった。1つは、括弧書きによる補足説明が英文で省略されていた場合で、
これは5)「訳されないことが多い名詞」と共通する。またもう1つは、新聞記
事の文章の流れによって省略されている場合で、1文ごとに個別に翻訳する場合
は、今回、候補として挙がった''Tokyo''、''Japan''を用いれば良いだろう。
5)「訳されないことが多い名詞」 5)に分類された4語は大きく2に分けることができる。
まず、「方向」「形」の2語は特定の言い回しの中で用いられることが多く、 「名詞」そのものとしては省略されることが多いため、まずは特定の表現 を探すことで訳し分けの問題の多くは解消できると思われる。
一方、残った「本社」「社長」の2語については括弧書きの省略のために訳さ
れないことが多く、
同じように括弧書きの内容を必要としない場合は問題にならない。また、出現回数
は少ないが「本社」には3つ、「社長」には2つの訳語候補が挙がったため、
翻訳する必要がある場合はこの中から選択することになると思われる。
しかし、今回統計をとった範囲では英訳語の出現回数が不十分なため、訳語選択
に有効な結果を得るためには、より多くの文章について統計をとる必要がある。
2)「訳語がほぼ一意に決定できる名詞」 および 3)「有力な候補がある名詞」
この2つの分類のうち、2)「訳語がほぼ一意に決定できる名詞」については、 もっとも出現回数の多い候補を選択することで8割以上の正解率が得られることに なるので、名詞の訳語選択では大きな問題にはならないだろう。また、3) 「有力な候補がある名詞」については、出現頻度の突出した候補があるため、 それを選択することである程度の正解率は得ることができる。
そこで、この2)、3)に分類された名詞に関しては、実際に訳語選択を行う
際に必要とする正解率の閾値を定めることで、問題となる範囲を特定することが
できると思われる。例えば、7割の正解率が必要であれば、ここに分類された
名詞のうち、7割以上を占める候補を持つ名詞は頻度情報で訳語を決定し、
そうではない名詞については他の方法を探す、といったことができるだろう。
6)「名詞以外に訳されることの多い名詞」
6)「名詞以外に訳されることの多い名詞」については、前後にある 他の語との組合わせで訳語が決まる場合が多く、名詞単独で問題になる ことはあまりないと思われる。
たとえば、サ変名詞には動詞として訳されることが多いものがあり、この場合は
動詞の訳語選択法が適用できるだろう。また、時間、位置、程度などを
表す「中」「先」などの名詞は副詞や前置詞に訳されることが多く、これらに
関しては前後にある単語が重要になる。ほかに、「量」や「額」などの名詞は、
「総量」「投資額」というように他の語と組み合わせで現れることが多く、
英訳語はどんな語との組み合わせで現れるかに依存すると思われる。
4)「同程度の出現頻度の候補を持つ名詞」
今回の分類のうち、4)に分類された名詞が出現頻度による訳語選択では最 も問題になると思われる。ここに分類された名詞は出現頻度の割合が 近い候補があり、頻度情報のみでは訳し分けの情報としては不十分なため、 他の訳語選択法が必要となるだろう。
たとえばその1つの例として、意味属性による訳し分け
を行った結果、辞書上での平均多義数が3.0から1.4に減少、平均正解率が
53.8%から92.2%に向上するという効果が得られた。
しかし、意味属性の効果が全くない名詞も存在するため、これらの名詞につ
いては見出し語ごとに個別に検討する必要があるだろう。
なお、1)から4)の分類にあたる63語に対して最も使用頻度の高い候補を選ぶ という方法を適用した場合、48.6%の平均正解率が得られた。