next up previous contents
次へ: 謝辞 上へ: body_ver17 戻る: 今後の課題   目次

おわりに

本研究では,ブログ記事における地名解析を行うために,「手がかり語検出」と「都道府県名の曖昧性軽減」という2つの手法を提案した.

手がかり語検出では,場所を判定する手がかりとなる語とその都道府県の組を登録した手がかり語辞書を作成し, それを用いてブログ記事中の手がかり語にタグ形式で都道府県名を付与する処理を行った.

都道府県名の曖昧性軽減では,都道府県名と共起する語が登録された都道府県コーパスを作成し, それを用いてブログ記事単位に有力な都道府県名を推定し,1つの手がかり語に複数出力された都道府県名を抑制する処理を行った.

さらに,提案した手法の評価実験を行った. 手がかり語検出では,正解となる手がかり語の文字列のうち一部を手がかり語として検出できればよいという評価においてF値で0.662という評価結果であった. 都道府県名の曖昧性解消では,評価対象を上述の手がかり語検出において正しく検出できた手がかり語に限定した場合において,F値0.566という評価結果であった. 正解手がかり語のうち一部を検出できればよいという評価において手がかり語検出を行い,評価対象を限定せずに都道府県名の曖昧性軽減を行ったときの, 本手法全体の性能評価は,F値で0.336という評価結果であった. 一方,ブログ記事単位で有力な都道府県名を判定する性能の評価は,一致率で60%という評価結果であった.

以上の評価結果により,手がかり語辞書を用いて手がかり語検出を行い,その後都道府県コーパスを用いて都道府県名の曖昧性軽減を行うという本研究で提案した 地名解析の手法の有用性を確認した.



平成23年3月3日