単語間の文字列を利用した関連研究

本研究は,単語間の文字列を用いて,単語間の関係情報を抽出しており,単語間の文字列を利用した研究に関連している. 単語間の文字列を利用した関連研究を以下に示す.

村田ら[#!murata01!#]は,見出し語と辞書定義文を照合することにより,複合語の構成要素とその構成要素間の関係を示す表現を抽出した. 例として,「アマチュア無線」という見出し語の定義文は,「アマチュアによる無線」となっていることから,「アマチュア」と「無線」の2つの構成要素と,「による」という構成要素間の関係を示す表現を抽出している.

村田ら[#!murata02!#]は,入力した単語対の間の文字列を利用して,入力した単語対の類似の単語対を自動抽出した.さらに,ユーザが入力した単語と同じ分野の用語を収集して可視化するシステムを開発した.例として,「赤色」と入力した場合,「朱色」や「紅色」といった類似した表現の用語を抽出している.

岡田ら[#!okada!#]は,新聞記事群の文字列の出現頻度を用いて,テキストの分割単位となる文字列の自動取得を行った.例として,「という」「について」等のテキストの分割単位となる文字列を取得している.取得した文字列を用いて,テキストの分割を行うことで,通常の単語分割では細分化されてしまう複合名詞などを取得している.