EDR電子化辞書は10種類の辞書からなり,本研究ではその中の1つである,「日本語単語辞書」と「概念辞書」を使用する. 日本語単語辞書には,約26万語収録されており,各語に対して「品詞」や「活用情報」など複数の情報が付与されている. その情報の1つに,「概念識別子」という情報がある.この概念識別子は16進整数で表されており,概念辞書に各識別子の意味が記述されている. このため,日本語単語辞書からは概念識別子を通して概念辞書を参照することにより語の意味を獲得できる. 概念識別子が同じ語どうしを類義語対と判定する. 概念辞書には,約41万の概念が収録されている. 日本語単語辞書によって語に与えられた概念識別子の例を表4.1に示す. また,概念辞書によって記述されている概念識別子と概念の関係の例を, 表4.1の識別子を用いて表4.2に示す.
語 | 識別子 |
探し回る | 3cec34 |
探し求める | 3cec34 0ec740 10c07a 1f239a 10e00a |
むつまじい | 3cfc19 |
近しい | 3cfc19 |
ほったらかす | 3ce673 |
怠る | 3ce673 0ef497 0f2210 0fb918 |
識別子 | 概念 |
3cec34 | 探し求める |
0ec740 | 企業などが採用すべき人を探し求める |
10c07a | 住む家を探し求める |
1f239a | (未知のものを)探し求めることができる |
10e00a | 奇怪なものや異常なことに興味を持って、それを探し求めること |
3cfc19 | 親密だ |
3ce673 | するべきことをしないで、ほうっておくさま |
0ef497 | 精進を怠る |
0f2210 | 道理がわからず怠ること |
0fb918 | 仕事を怠る |