next up previous contents
Next: 提案手法 Up: word2vecと分類語彙表 Previous: word2vec   目次

分類語彙表

分類語彙表は,「語を意味によって分類・整理したシソーラス(類義語集) 」のことを言う.本研究では国立国語研究所のデータベースを利用して重要項目の選定を行う.

分類語彙表は,数字を利用した構造的な分類体系をとっている. 例えば,分類番号は「1.4131」のように5桁の数字で表記され,各数字あるいはその組み合わせが「類」「部門」「中項目」「分類項目」の階層的意味づけの構造となっている [5].

最初の1桁目は,品詞分類に相当し「類」に対応する.また,「類」は以下の4つに分類され,意味的な分類と文法的な分類を両立している.

  1. 名詞の仲間-体の類
  2. 動詞の仲間-用の類
  3. 形容詞・形容動詞・副詞等の仲間-相の類
  4. その他の仲間(接続詞・感動詞など)

1~3の類は,日本語の文法的特性を考える上の基本的な枠組みで,意味的にはそれぞれ,もの・動き・ありさまという概念に対応する.

次に,分類番号の2桁目は,「部門」に相当し,「部門」は「類」の中を意味的に大きな概念で分けたものである.各類と部門に対応する例を表3.1に示す.列が「類」に相当し,行が「部門」に相当する.





 
表 3.1: 「類」と「部門」の関係
抽象的関係 1.1 2.1 3.1
人間的主体 1.2 - -
精神および行為 1.3 2.3 3.3 
生産物および用具 1.4 - -
自然物および自然現象 1.5 2.5 3.5 


3桁目は「中項目」に相当し,「部門」より小さな概念を示す.また,「中項目」より小さい概念で,「中項目」を細分化した項目を4桁目と5桁目で示し,1桁から5桁の組み合わせた数字は「分類項目」相当する. 【1.1抽象的関係】に属する「中項目」の項目と「分類項目」を表3.2に示す.

数字あるいはその組み合わせが「類」「部門」「中項目」「分類項目」という4階層の意味的範疇を示す構造となり,「類」は1階層の項目に属し,「部門」は2階層の項目に属し,「中項目」は3階層の項目に属し,「分類項目」は4階層の項目に属する. 本研究では「分類項目」(5桁)に属する単語群を利用して表生成を行う.


表 3.2: 「中項目」の項目と「分類項目」
【1.1 抽象的関係】
1.10 事柄------
1.1000 事柄
1.1010 こそあど,他
1.1030 真偽
1.1040 本体,代理
1.11 類-------
1.1100 類,例
1.1101 等級,系統
1.1110 関係
.....


next up previous contents
Next: 提案手法 Up: word2vecと分類語彙表 Previous: word2vec   目次
akano hokuto 2018-03-06