paper

UpperTail法[#!UPPERTAIL!#]はMojena（1977）によって提案され,統計的な停止規則を用いた階層的クラスタ分析におけるクラスタ数決定のための重要な方法である.これらの規則は,基準値αとなる分布がN−1個あるのを利用する.ここではクラスタ間の距離のみが基準値として用いられ,基準値の値は $\alpha_{n1}$ ,すなわちクラスタが２つの場合から $\alpha_{n-1}$ 個まで取りうる.停止規則は,クラスタ数（j）が２個から始めて増加させていき, $\alpha_{j} \leq \hat{\alpha} + k_{s_{\alpha}}$ の条件を満たすまで繰り返される.ここで, $\hat{\alpha}$ と $s_{\alpha}$ は,それぞれの基準値 $\alpha$ の分布の平均と不偏分散である. kはαの分布の平均と不偏分散に基づき,上部棄却域を決める定数である.なお, Mojena（1977）においては, kの値は60から120までのデータ数に応じて２から４の値をとっている.これらを参考に，今回は1群のデータ数が文書数以下(20以下)になると仮定して, k=1で実験を行う.地震データの１回目クラスタリング結果の列2を用いて,提案手法を用いて, UpperTail法で最適なクラスター数を計算した結果を表に示す.

**Table:** １回目のクラスタリング結果の列１のデータをを用いて作った出力テーブル(UpperTail法で最適なクラスター数を計算した)
$\scalebox{0.9}{ \begin{tabular}{\vert l\vert l\vert l\vert l\vert l\vert} \hline... ...後9時23分ごろ　 &震源,地震 &震度5 &...\\ \hline \par \end{tabular}}$