上記のように形態素解析による検出誤りには,もうひとつの誤り原因が存在する. それは,名詞連続の過分割である. 名詞連続から構成される単語を正解手がかり語とした場合,その名詞連続を形態素解析によって別の単語であると判定されてしまう場合がある. このとき,正解手がかり語が手がかり語辞書に登録されていても,正解手がかり語となる単語を分割してそれぞれにおいて手がかり語辞書を参照してしまったために, 正しく手がかり語検出が行えない. このような,形態素解析が原因の手がかり語検出誤りがあると考えられる. この対策としては,本研究では実装できていないが,形態素解析結果において隣接する名詞は,それぞれにおいて手がかり語辞書を参照するとともに, 隣接する名詞は一つの単語とみなして手がかり語辞書を参照するという処理がある.
さらに,正しく形態素解析が行えたが,もともとその単語が手がかり語辞書に登録されていなかったという誤り原因も存在する. この対策としては,手がかり語辞書の登録件数を増やすということが考えられる. しかし,手がかり語と都道府県名を信頼性高く同時に取得する手段は限られているという問題がある.