関連研究の手法の手順

以下の手順で文書群から表を自動で生成する.手順の概要図を図2.1に示す.

手順1 文書群に含まれる文を句点区切りで抽出する.
手順2 手順1で分割された各文の文ベクトルを計算する.
手順3 文ベクトルをWard法による階層クラスタリングでクラスタリングする.
手順4 階層クラスタリングによって得られた各クラスタ数でのクラスタリング結果を基に表に整理する.
手順5 手順4で採用されたクラスタ数でのクラスタリングの結果を,行を文書,列をクラスタとする表に整理する.
手順6 表の各列について,項目名を付与する.

Figure 2.1: 階層クラスタリングによる表生成の手順の例
1#1