next up previous contents
次へ: 抽出方法 上へ: 日本語語彙大系からの抽出 戻る: 日本語語彙大系からの抽出   目次

日本語語彙大系とは

日本語語彙大系は,「意味体系」,「単語体系」,「構文体系」によって構成されている. 「意味体系」は,日本語の一般名詞,固有名詞,用言の意味的用法を意味属性体系で体系づけている. 「単語体系」は,一般名詞や固有名詞などの意味的用法を約3,000の意味属性体系を用いて定義している. 「構文体系」は,日本語の用言約6,000語の表現構造を結合価パターン約14,000件にまとめたものである.

本研究では,「単語体系」にまとめられている固有名詞意味属性体系から,場所を特定する手がかりとなるような単語を抽出し,手がかり語辞書に登録する. 固有名詞意味属性体系に登録されている各単語には,意味属性が付与されている. この意味属性を考慮して,手がかり語となりうる単語を抽出する. なお,固有名詞意味属性体系から抽出した手がかり語の都道府県名は不明である. 図[*]に,日本語語彙大系の固有名詞意味属性体系の例を示す. 図[*]に示す通り,一行には 「単語,読みかた,単語の属性(一般名詞か固有名詞か),意味属性番号と意味属性名」が記述されている.

図: 日本語語彙大系の固有名詞意味属性体系の例
\begin{figure}\begin{center}
\begin{tabular}{l} \hline
峰島(みねじま)[固] 67姓\...
...
美祢線(みねせん)[固] 63路線名 \hline
\end{tabular}
\end{center}\end{figure}



平成23年3月3日