next up previous contents
Next: 今後の対応すべき課題 Up: 誤り分析 Previous: 意味解析の成功例   目次

固有名詞の処理不足

[
l]固有名詞の処理不足の例
[
l]パターン原文
原文1:
トルコの「汗と絨毯」は、職人たちを追ったドキュメンタリーだ。
原文2:
冷蔵庫にある製品は国内向けのものだった。
原文3:
写真で首に巻いているマフラーは、インタビューの直前に歌手の荻野目洋子さんにプレゼントされたものだ。
原文4:
アウシュビッツで公開されているガス室は解放後に共産党政権がでっち上げたものだ。
原文5:
現在ドゥダエフ政権部隊が使用している大量の兵器は、一九九一年にロシア軍がチェチェンを撤退した後に同政権に引き渡したものだ。
原文6:
一カ月にわたるロシア軍の進攻に激しく抵抗しているドゥダエフ・チェチェン政権の兵器が旧ソ連軍の残したものだ。
[
l]マッチしたパターン
パターン:
$ /\mathit{MT}1\,\mathit{N}2(は\vertが)[、]/\mathit{MT}3\,\mathit{N}4\,\mathit{MD}5$
[
l]選択条件
主語前:
T
[
l]応用情報
型名:
範疇叙述型
下位語:
輸送型潜水艦
上位語:
U151型Uボート
追加情報:
第一次大戦期の
 

[
l]正解データ
型名:
外延叙述型
上位語:
輸送型潜水艦
下位語:
U151型Uボート
追加情報:
第一次大戦期の
この例では,選択された型名および3つ組の組み合わせが誤っていた.誤り原因 は,述語の「U151型Uボート」を固有名詞とみなす処理ができなかったこと が挙げられる.形態素解析で単語毎に区切ると「U151」,「型」,「U」, 「ボート」と分解される.現在の手法では意味属性や品詞を参照する場合は,こ の中で末尾の「ボート」のみ参照しているので,述語にマッチした単語全てを参 照する,または,主語と述語のマッチした単語数で比較する素性を追加すること が考えられる.



2015-03-14