next up previous contents
Next: 機械学習を利用した照合結果の選択 Up: 実行の様子 Previous: Step1   目次

Step2

照合結果の選択
意味属性を利用した照合結果の選択の手順の処理を行う.

手順1:
追加情報および属性値のある適合結果を優先して採用
例文の全ての照合結果で,追加情報または属性値が存在するので全 ての候補を採用する.
手順2:
変数がより具体的な適合結果を優先して採用
マッチしたパターンの変数は,全てのマッチしたパターンが同様な ので全て採用する.
手順3:
主語,述語の上下関係をもとに優先して採用
例文の主語の意味属性コードは(418道路)で,述語の意味属性コー ドは(417交通路,2669経路)である.この内で,主語の(418道路)が下位, 述語の(417交通路)が上位の関係あたる.よって,主語が下位語 で,述語が上位語の範疇叙述型の照合結果2を採用する.
手順4:
原文との意味的な近さをもとに採用
マッチしたパターンの原文の中から(5.1)式で最も意 味的に近い原文からスコアを得る.パターン辞書だと,入力文が含 まれているので最も近い原文は入力文でスコアは0.0である.同一 の文を覗いた場合は,「一カ月にわたるロシア軍の進攻に激しく抵 抗しているドゥダエフ・チェチェン政権の兵器が旧ソ連軍の残した ものだ。」で,スコアは12.0となる.この選択を行う段階で,照合 結果2だけなので,これを最も原文に近い候補として採用する.
以上の処理で,例文は以下の照合結果を採用する.
入力文:
阪神間を結ぶ道路は、生活用品や復旧資材を運ぶ貴重な幹線だ。

[
l]採用した照合結果
[
l]パターン原文
原文1:
トルコの「汗と絨毯」は、職人たちを追ったドキュメンタリーだ。
原文2:
冷蔵庫にある製品は国内向けのものだった。
原文3:
写真で首に巻いているマフラーは、インタビューの直前に歌手の荻野目洋子さんにプレゼントされたものだ。
原文4:
アウシュビッツで公開されているガス室は解放後に共産党政権がでっち上げたものだ。
原文5:
現在ドゥダエフ政権部隊が使用している大量の兵器は、一九九一年にロシア軍がチェチェンを撤退した後に同政権に引き渡したものだ。
原文6:
一カ月にわたるロシア軍の進攻に激しく抵抗しているドゥダエフ・チェチェン政権の兵器が旧ソ連軍の残したものだ。
[
l]マッチしたパターン
パターン:
$ /\mathit{MT}1\,\mathit{N}2(は\vertが)[、]/\mathit{MT}3\,\mathit{N}4\,\mathit{MD}5$
[
l]選択条件
主語前:
T
[
l]応用情報
型名:
範疇叙述型
下位語:
道路
上位語:
幹線
追加情報:
生活用品や復旧資材を運ぶ貴重な
 



2015-03-14