本研究では,2つの語が同義語対であるかの判定にEDR電子化辞書を利用する.
EDR電子化辞書は10種類の辞書からなり,本研究ではその中の1つである,「日本語単語辞書」と「概念辞書」を使用する. 日本語単語辞書には,約26万語収録されており,各語に対して「品詞」や「活用情報」など複数の情報が付与されている. その情報の1つに,「概念識別子」という情報がある.この概念識別子は16進整数で表されており,概念辞書に各識別子の意味が記述されている. このため,日本語単語辞書からは概念識別子を通して概念辞書を参照することにより語の意味を獲得できる. 概念識別子が同じ語どうしを同義語対と判定する. 概念辞書には,約41万の概念が収録されている. 日本語単語辞書によって語に与えられた概念識別子の例を表4.1に示す. また,概念辞書によって記述されている概念識別子と概念の関係の例を,表4.1の識別子を用いて表4.2に示す.
語 | 識別子 |
衣料 | 0e504a |
衣類 | 0e504a |
赤 | 0e29cb 1f8697 1f8698 1f8699 1f869b 1f869c 1f869d 1f86a0 1f86a3 |
青 | 0f91f3 1f6678 3bdae1 3c2c39 3c2c3a 3c2c49 3cfb7a |
ランチ | 3bec74 3c0457 3c0458 3c58fd |
昼食 | 3bec74 |
識別子 | 概念 |
0e504a | 体に着るもの |
0e29cb | 赤の色をしているさま |
1f869c | 収支が赤字であること |
3bec74 | 昼の食事 |
3c0457 | 港内の人員輸送に用いる大型モーターボート |
3c58fd | 洋風の定食 |