知見獲得における研究では,教師あり機械学習と統計的検定を用いて素性分析を行い,様々な分野に関する知見を獲得することができた.
知見獲得の評価における研究では,教師あり機械学習と統計的検定による知見獲得の評価を行った. Word2vecで得た単語対の素性500個とそれぞれの手法で得た単語対の素性500個との一致数の平均は,最大エントロピー法が30.6個,符号検定が70.3個であった. 被験者が行った,人手で連想した各単語対の語句30個とそれぞれの手法で得た単語対の素性500個との一致数の平均は,最大エントロピー法が7.9個,符号検定が11.3個であった. また,同様の被験者実験での結果では,最大エントロピー法が6.7個,符号検定が10.4個であった. それぞれの手法で得た各単語対の素性100個を筆者が人手で評価した結果の有益性の比率は,最大エントロピー法の◎が0.14,符号検定の◎が0.07であった. また,同様の被験者実験での結果では,最大エントロピー法の◎が0.85,符号検定の◎が0.059であった. 単語対と類似度が高い素性や人が連想できる語句など一般的な語句の収集には統計的検定が優れていることがわかった.一方,人が役に立つと感じる,知見につながるような語句の収集には教師あり機械学習が優れていることがわかった.