本知識ベース構築には約一ヶ月の時間を要した. 表5.3より,ブログ文抽出に大半の時間を要していることが分かる. この原因としては, 漢字や平仮名やカタカナでも表現ができる格要素を1度にOR検索してい ることによる. 例えば,表5.2の2行目の「ツバメ」は,「つばめ」や「燕」と3つ の表現方法がある.
今後,大規模な判断情報知識ベースを構築する上で必要な課題は, 唯一人手で行っている情緒判定を自動的に行うことである.