next up previous contents
次へ: 今後の課題 上へ: 考察 戻る: 手がかり語検出   目次

都道府県名の曖昧性軽減

都道府県名の曖昧性軽減を行うことにより,余計な都道府県名の出力を抑制することができた. しかし,曖昧性軽減を行っても出力を抑制できなかった場合もあった. それは,1つの手がかり語に複数出力された都道府県名の中に,有力な都道府県名が存在しなかった場合である. このときは,複数出力されている都道府県名を抑制することができない.

この対策としては2つ考えられる. 1つ目の対策として,有力な都道府県名を判定するウィンドウ幅を,ブログ記事単位からもっと狭めて設定するということが考えられる. ブログ記事には,場所の移動が時系列に沿って記述されている場合が多い. ブログ記事単位に有力な都道府県名の推定を行うと,場所の移動が激しいブログ記事を扱うことは難しい. よって,有力な都道府県名を判定するウィンドウ幅を,3文単位や5文単位といった文単位に設定することで,より精度よく有力な都道府県名を推定することができ, もっと効率よく都道府県名の曖昧性軽減を行うことができると考えられる. 2つ目の対策として,有力な都道府県名を判定する際に,その候補を複数出力するということが考えられる. 例えば,あるウィンドウ幅において,有力な都道府県名を第一候補は``鳥取",第二候補は``岡山"などと候補を複数出力すれば, 第一候補の``鳥取"を用いて都道府県名の曖昧性軽減が行えなかった手がかり語に対して, 第二候補の``岡山"を用いれば都道府県名の曖昧性軽減が行えるということが考えられる.



平成23年3月3日