next up previous contents
Next: 項目名についての考察 Up: 考察 Previous: 情報抽出についての考察   目次

単語単位の情報抽出との比較についての考察

5.3節の文単位の情報抽出と単語単位の情報抽出との比較では,単語単位の情報抽出よりも文単位の情報抽出のほうが得られた情報を理解しやすいという結果となった.

例えば,単語単位情報抽出では,表6.1のように,「13時間」という情報が得られるが,これが「バッテリーが駆動する時間」についての情報であることが明確でなかった.しかし文単位の情報抽出では表6.2のように,「約13時間のバッテリー駆動を実現する」のように,得られた情報が「バッテリーが駆動する時間」についての情報であることが明確になり,理解しやすくなった.

しかし,文単位の情報抽出においても「OSは「android8.0」をする」といった文のように理解しづらいものがいくつか見られた.これは正しくは「OSは「android8.0」をプリインストールする」という文で得られるべきであるが, 3.2節の文の分割で行う格解析での解析の誤りによって不自然な文が生成されている.5.1節で得られた表では,重要度の高い上位5列に含まれる147文のうち8文がこのような不自然な文であった.

また,「ハイレゾ音源の再生にも対応する」といった文は「(新製品のスマートフォンが)ハイレゾ音源の再生にも対応する」のように,文中の主語が省略されている.このように主語や目的語が省略された文では情報を理解しづらくなる.この問題は,事前に文を照応解析し,省略された主語や目的語を補うことによりある程度解決できると考えられる.


表 6.1: 単語単位の情報の例
\scalebox{1}{
\begin{tabular}{\vert c\vert} \hline
\multicolumn{1}{\vert c\v...
...
13時間 \\ \hline
3日間 \\ \hline
3日間 \\ \hline
\end{tabular}
}



表 6.2: 文単位の情報の例
\scalebox{1}{
\begin{tabular}{\vert c\vert} \hline
\multicolumn{1}{\vert c\v...
...現 \\ \hline
3日間以上の電池餅を実現 \\ \hline
\end{tabular}
}




2018-03-02