next up previous contents
Next: 未知語の翻訳精度と文全体の翻訳精度の差 Up: 考察 Previous: 考察   目次

未知語の傾向

6.1節で獲得した未知語(1,847単語)の傾向を調べるため品詞の分布を調査した.品詞の解析には``MeCab"を用いた.結果を図7.1に示す.

図 7.1: 未知語の品詞分布
\fbox{
\includegraphics[keepaspectratio,width=90mm]{distribution_unk.eps} %width=40mm
}

7.1より,上位3位を名詞・動詞・副詞が占めていることが分かった.具体的には,1位の名詞が1,311単語,2位の動詞が364単語,3位の副詞が80単語存在した.また,最も多かった名詞の中でも特に一般名詞が多く存在し,名詞全体の約7割を占めていた.残り3割の内,サ変接続名詞が約2割を占めており,固有名詞が約1割を占めていた.また,上位3位における動詞と副詞の未知語例を表7.1に示す.


表 7.1: 動詞と副詞の未知語例
\scalebox{1.0}{
\begin{tabular}{\vert c\vert c\vert c\vert c\vert}
\hline
品...
... 副詞 & 徐徐に & なにやら & あらためて\\
\hline
\end{tabular} }




s122019 2018-02-15