next up previous contents
次へ: パターンの作成 上へ: 手順 戻る: 手順   目次

タグの付与および型名の追記

名詞述語文は,ID番号が付けられている. ID番号はアルファベット $+$ 6桁の番号とする. 文にスペースで分かち書きしておく. 文にタグを付与し,型名を追記する. タグは変数,関数,字面および品詞を表す. 処理後は次の形式とする.

タグセットは「$\langle$ $\rangle$」内に, タグセット名,品詞,関数,字面およびパターンに残す字面を表記する. タグセット名は表 % latex2html id marker 706
$\ref{tagset:one}$のアルファベットである. 品詞は表 % latex2html id marker 708
$\ref{tagset:two}$を表記する. 関数(表 % latex2html id marker 710
$\ref{tagset:three}$)は不要である場合は表記する必要はない. 関数および字面の間は「:」で区切る. 字面は変数に変換する単語もしくは句である. パターンに残す字面がある場合は,その前に「|」を表記しておくことで実現している.


表: タグセット
タグ 意味
$\langle$E : $\cdots$ $\rangle$ 実体
$\langle$A : $\cdots$ $\rangle$ 属性
$\langle$V : $\cdots$ $\rangle$
$\langle$U : $\cdots$ $\rangle$ 上位語
$\langle$L : $\cdots$ $\rangle$ 下位語
$\langle$I : $\cdots$ $\rangle$ 追加情報



表: 品詞の一部
品詞 意味
$N$ 名詞
$V$ 動詞
$NUM$ 数詞
$AJ$ 形容詞

※「$P$」が末尾にある場合「句」となる.



表: 関数の一部
関数 意味
$.dantei$ 判定詞
$.kako$ 過去
$.reru$ 受動態・可能態
$.\char93 da$ だ,である,です
$\hat{ }\,rentai$ 連体修飾

[
|]タグ付けの例 a000001 皮 が 薄い 分 、 たっぷり 詰まっ た $\langle$E $N$:つぶし あん|は$\rangle$ $\langle$V $V .kako$:抑え た$\rangle$ $\langle$A $N .dantei$:甘 さ で$\rangle$ 、 さっぱり し た 仕上がり 。 属性叙述型

本研究ではタグ付けの処理を人手で行った.


next up previous contents
次へ: パターンの作成 上へ: 手順 戻る: 手順   目次
平成25年6月20日