提案手法2:文レベルでのテンプレート生成

この手法では句点までで終わる短い文レベルでのテンプレートを生成する. 作成された表に対して,文を全て名詞のみの状態にし再度列ごとでクラスタリングを行い,テンプレートを生成する.2章の方法で生成された表からテンプレート生成までの手順を以下に示す.また,手順の概略を図3.3に示す.

手順1
生成された表の全文を名詞のみの状態にする.テンプレートを生成するにあたり,本研究では名詞をテンプレートの変数と設定した.表中の文章に対してMeCabで形態素解析を行い,名詞以外の品詞は除去する.
手順2
名詞のみの状態で列ごとに再度クラスタリングを行う.

手順3
手順2で生成された表の各列をテンプレートの各変数とする.列の左側から順にX1,X2と設定し,その列に含まれる単語が変数となる.
手順4
元の文章に対して上記の変数を適応させ,テンプレートを生成する.

Figure 3.3: 文レベルでのテンプレート生成の手順
58#58