そこで本研究では,単一文書を入力とした単語ネットワークを構築する手法を提案した.
その結果,単一文書を入力として単語ネットワークを構築し,単一文書を可視化させることができた.
また,単一文書を入力として構築された単語ネットワークの利用について,内容把握度と単語の出現範囲の推定,ノード対の有用性で評価を行った.
内容把握度について,2階層目の5つのノードにおいて,段落の出現回数頻度上位3つ用いた場合には,約44%の読書率で約44%の正解率を確認した.読書率に対する正解率の割合が1.00となり,ランダムで段落を3つ抽出した場合の割合が0.83であることから,提案手法で抽出した段落を読んだ方が,内容の把握度が高くなることが確認できた.
単語の出現範囲の推定について,95%の信頼値の正規分布に基づいているとして,約98%の確率で単語が区間内に出現することを確認した.これにより,登場人物やある事柄など,単語ネットワークでノードとして出力されている単語の出現段落の推定が可能となった.
ノード対の有用性について,小説を入力とした単語ネットワークにおいて,6つの小説の全てで,5つ以上の有益なノード対が獲得できることを確認した.これにより,登場人物の特徴,2人の登場人物の関係性,物語における有益な情報のいずれかを獲得することができる.特に登場人物についての情報が多く獲得できたため,物語の大枠を捉えられる可能性から,読書支援にも有効であると考えられる.
今後は,単一文書を入力として単語ネットワークを構築する際,動詞や形容詞の重要な単語が存在する場合も考えられるため,様々な品詞をノードとして獲得できるよう改良したい.また,名詞連続の単語を連結することで,単語ネットワークとしての利便性を向上させたい.