次へ: 抽出結果に関して
上へ: 考察
戻る: 考察
目次
文例収集において,例文が5文集まらなかった接続表現が16件あった.
Googleではいかに検索結果が多くとも検索結果の表示は1,000件を上限
としている.そこで,1,000件の事例を確認しても条件に合致する文章が5文集ま
らなかった場合,「例文が5文集まらなかった」とした.以下に,例文が5文集ま
らなかった接続表現の例の特徴について説明し,対応策について記す.
- 「におうじて」
- 想定例文:物価が上昇するに応じて,私たちの生活は困
窮していく.
- 理由:接続表現「におうじて」では「物価の上昇に応じて」など
直前に名詞がくる場合が圧倒的に多く,節がくる例はほとんどな
かった.
- 対応策:この問題は文例数を増やすことで解決できると考える.
しかし,Googleでは検索結果がどれほど多くとも1000件以上は表
示しない仕様となっている.そのため,Googleだけでなく複数の
検索エンジンを使って文例を抽出することでこの問題は解決でき
る.
また,このとき検索エンジンとしてGoogleやYahoo!を利用す
ると同一ブログから文例を抽出してしまう可能性がある.これを
回避するため,ブログサービスを提供している各種サイトで(各
サイトのブログのみを対象とする)ブログ検索を行う必要がある.
- 「せつな」
- 想定例文:目を離したせつな,子供は波に飲まれてしまった.
- 理由:複数のアニメや漫画において「刹那」あるいは「せつな」とい
う名前のキャラクタがいるらしく,キャラクタ名の「刹那」に多
くあたってしまい,接続表現としての「せつな」が得られなかっ
た.また,「せつなさ」や「たいせつな」に
あたってしまった場合もあった.
- 対応策:「せつなさ」や「たいせつな」に合
致してしまう問題に関しては該当語句をマイナス検索することで
解決できる.
しかし,アニメや漫画のキャラクタ名としての「刹那」が検索結
果に多く出現する問題は,検索結果からキャラクタ名を除外する
のが難しく,回避するのは不可能と考える.
- 「るところによれば」
平成20年6月3日