next up previous contents
Next: 単語の出現範囲の考察 Up: 考察 Previous: 考察   目次

内容把握についての考察

内容把握の実験の評価について考察を行う. 新聞記事を入力として単語ネットワークを構築し,2階層目のノードで段落の出現数の頻度上位3つを評価したところ,ランダムに3段落を選出したものと比べ,読書率にほとんど差は見られないが,正解率が約12%高くなることを確認できた.頻度上位で段落を3つ選出した場合は読書率と正解率にほとんど差はないが,ランダムで段落を3つ選出した場合には,読書率に対して正解率が約11%低い結果となった.頻度上位では段落の選出をする際に,TF-IDFの値から得られたノードを元に段落番号を選出しているため比較的重要な段落が選出されていると考えられる.それに対し,ランダムに選出した場合には,重要度が考慮されていないため,正解率に差が出たと考えられる.

また,段落を3つ選出した際にその文字数の合計が最小になる場合と最大になる場合について評価した結果,それぞれ,読書率と正解率の差は約3%以下となった.この結果から,読書率に対して,ほとんど同等の値で正解率を獲得できることが考えられる.

なお,本実験で用いた問題は文献[13]に用いられているものであり,重要な内容についての問題であると仮定した.そのため,新聞記事で必ずしも重要な内容であるとは限らない可能性が考えられる.最も重要である内容を問題として提示することができれば,正解率が変化する可能性があるため,今後の検討が必要である.

その他の今後の課題として,段落の選出に用いるノードを2階層目以外も候補に入れ,問題文に関連する段落を取り出すことが考えられる.



s112054 2017-03-03