next up previous contents
Next: 実装 Up: 情報抽出の提案 Previous: レスからの情報抽出   目次

情報の集約

スレッドの構造を表すグラフの辺をたどることで,断片的な情報を集約する.

辺の始点にある3つ組情報$ t_{1}$ を,辺の終点にある3つ組情報 $ t_{2}$ に重ねて, 集約された3つ組情報$ t_{3}$ を作成する(式3.1).なお, $ t_{i,j}$ $ t_{i}$ における $ j$ 番目の要素を表す.



$\displaystyle \underset{(j=1,2,3)}{t_{3,j}=}
\left \{\begin{array}{ll}
t_{1,j} ...
... のとき) \\
t_{2,j} & (t_{2,j} \not= \phi のとき) \\
\end{array}\right.$     (3.1)

集約された情報の例を表3.2に示す. レス5において,レス5からは得られなかった「商品名」および「場所名」の情報 は,宛先であるレス4を参照することで,新しく(キンツバ, 喜八洲, 美味しい), (キンツバ, 喜八洲, お店もいくつかあって買いやすいのも良い)というより正確 な情報となる. レス5の例では3つ組情報が2つ集約して作成された.このように,情報の集約は基 本的にはレスの単位で定まる.



表 3.2: 集約された3つ組情報の例
レス番号 3つ組情報
4 (キンツバ, 喜八洲, $ \phi$ )
5 (キンツバ, 喜八洲, 美味しい)
(キンツバ, 喜八洲, お店もいくつかあって買いやすいのも良い)



2013-02-23