分類語彙表は,数字を利用した構造的な分類体系をとっている. 例えば,分類番号は「1.4131」のように5桁の数字で表記され,各数字あるいはその組み合わせが「類」「部門」「中項目」「分類項目」の階層的意味づけの構造となっている [5].
最初の1桁目は,品詞分類に相当し「類」に対応する.また,「類」は以下の4つに分類され,意味的な分類と文法的な分類を両立している.
1~3の類は,日本語の文法的特性を考える上の基本的な枠組みで,意味的にはそれぞれ,もの・動き・ありさまという概念に対応する.
次に,分類番号の2桁目は,「部門」に相当し,「部門」は「類」の中を意味的に大きな概念で分けたものである.各類と部門に対応する例を表3.1に示す.列が「類」に相当し,行が「部門」に相当する.
体 | 用 | 相 | |
抽象的関係 | 1.1 | 2.1 | 3.1 |
人間的主体 | 1.2 | - | - |
精神および行為 | 1.3 | 2.3 | 3.3 |
生産物および用具 | 1.4 | - | - |
自然物および自然現象 | 1.5 | 2.5 | 3.5 |
3桁目は「中項目」に相当し,「部門」より小さな概念を示す.また,「中項目」より小さい概念で,「中項目」を細分化した項目を4桁目と5桁目で示し,1桁から5桁の組み合わせた数字は「分類項目」相当する. 【1.1抽象的関係】に属する「中項目」の項目と「分類項目」を表3.2に示す.
数字あるいはその組み合わせが「類」「部門」「中項目」「分類項目」という4階層の意味的範疇を示す構造となり,「類」は1階層の項目に属し,「部門」は2階層の項目に属し,「中項目」は3階層の項目に属し,「分類項目」は4階層の項目に属する. 本研究では「分類項目」(5桁)に属する単語群を利用して表生成を行う.