next up previous contents
次へ: 実験で用いる同義語対の選定 上へ: 実験に用いる同義語対 戻る: 実験に用いる同義語対   目次


EDR電子化辞書を用いた同義語の認識

本研究では,2つの語が同義語対であるかの判定にEDR電子化辞書を利用する.

EDR電子化辞書は10種類の辞書からなり,本研究ではその中の1つである,「日本語単語辞書」と「概念辞書」を使用する. 日本語単語辞書には,約26万語収録されており,各語に対して「品詞」や「活用情報」など複数の情報が付与されている. その情報の1つに,「概念識別子」という情報がある.この概念識別子は16進整数で表されており,概念辞書に各識別子の意味が記述されている. このため,日本語単語辞書からは概念識別子を通して概念辞書を参照することにより語の意味を獲得できる. 概念識別子が同じ語どうしを同義語対と判定する. 概念辞書には,約41万の概念が収録されている. 日本語単語辞書によって語に与えられた概念識別子の例を表4.1に示す. また,概念辞書によって記述されている概念識別子と概念の関係の例を,表4.1の識別子を用いて表4.2に示す.


表: 語と概念識別子の対応例
識別子
衣料 0e504a
衣類 0e504a
0e29cb 1f8697 1f8698 1f8699 1f869b 1f869c 1f869d 1f86a0 1f86a3
0f91f3 1f6678 3bdae1 3c2c39 3c2c3a 3c2c49 3cfb7a
ランチ 3bec74 3c0457 3c0458 3c58fd
昼食 3bec74


表: 概念識別子と概念の対応例
識別子 概念
0e504a 体に着るもの
0e29cb 赤の色をしているさま
1f869c 収支が赤字であること
3bec74 昼の食事
3c0457 港内の人員輸送に用いる大型モーターボート
3c58fd 洋風の定食



平成25年2月19日