next up previous contents
Next: 付録B 字数の削減 Up: おわりに Previous: おわりに   目次

付録A 文章作成支援

提案手法によって作成した表から重要情報を書き漏らしている文書を見つけ,書き漏らしていることを指摘することで,文書作成を支援することができると考えられる.

例えば,文書3に重量に関する情報がない場合,作成された表が表1であれば,文書3の欄が空欄となっているので正しく書き漏らしを検出できている.一方,表2のような表が作成された場合は,文書3の欄に重量とは関係のない情報が含まれており,書き漏らしの検出を誤っている.また,表3のような表が作成された場合は,本来,重量の情報を含むはずの文書2の欄が空欄となっているので,書き漏らしの検出を誤っている. 書き漏らし箇所の検出の精度3から求める.F値が大きいほど,書き漏らし箇所を正しく検出できたことを意味する.5.1節の結果の表の重要度の高い上位5列に対する評価結果を表4に示す. また,無作為に抽出した5列での結果を表5に示す. 結果から,本来,空欄でない箇所まで空欄となっていることが多かった.この問題を解消するには,6.1節と同様に,共通の情報を含む文が異なるクラスタに割り当てられることを抑える必要がある.


表 1: 正しく書き漏らしを検出した例
  重量
文書1 重量は約130g
文書2 重量は125g
文書3  
文書4 重量は138g


表 2: 書き漏らしの検出を誤った例1
  重量
文書1 重量は約130g
文書2 重量は125g
文書3 メモリーが3GB
文書4 重量は138g


表 3: 書き漏らしの検出を誤った例2
  重量
文書1 重量は約130g
文書2  
文書3  
文書4 重量は138g


\begin{displaymath}
適合率 = \frac{列の項目名を中心とする文を...
...の欄が空欄である数}{列に含まれる空欄の数}
\end{displaymath} ( .1)


\begin{displaymath}
再現率 = \frac{列の項目名を中心とする文を...
...の項目名を中心とする文を含まない文書の数}
\end{displaymath} ( .2)


\begin{displaymath}
F値 = \frac{2×適合率×再現率}{適合率+再現率}
\end{displaymath} ( .3)


表 4: 重要度の高い上位5列での評価結果
\scalebox{0.9}{
\begin{tabular}{\vert c\vert c\vert c\vert c\vert c\vert c\ver...
...ne
F値 & 0.89 & 0.89 & 0.93 & 0.93 & 0.83 & 0.89 \\ \hline
\end{tabular}
}



表 5: 無作為に抽出した5列での評価結果
\scalebox{0.9}{
\begin{tabular}{\vert c\vert c\vert c\vert c\vert c\vert c\ver...
...ne
F値 & 0.89 & 0.61 & 0.19 & 0.89 & 0.88 & 0.69 \\ \hline
\end{tabular}
}



next up previous contents
Next: 付録B 字数の削減 Up: おわりに Previous: おわりに   目次
2018-03-02