next up previous contents
次へ: 調査結果 上へ: 任意要素の効果の調査 戻る: 調査方法   目次

調査の様子

具体的な実験の手順を以下に示す.
  1. 文型照合実験に必要なデータべース,および,プログラムを準備する
  2. 対象辞書および基準辞書のオートマトン(マップファイル)を作成する.

    % pattern bwjall(辞書ファイル名)
            → map.bwjall(マップファイル)

  3. 照合

    % matching map.bwjall s1(形態素ファイル名)
            → s1.result(結果ファイル)

  4. 出力の例

    入力文:この俳句は冬の景色を読んだものだ。

    形態素ファイル:AF029183-00

    候補パターン
    WJ127171-01:/y#1[GEN2]/kN3は/tcfkN4を/cfV5.kako^rentai!ものだ。
    WJ188961-01:/y#1{#1[GEN2]/kN3は,/tcfkN4を }/cfV5.kako^rentai!ものだ。

    結果ファイル例

    INPUT=AF029183-00=
    この俳句は冬の景色を読んだものだ。
    1. /この(4200)
    2. /俳句(1100,{NI:1042,KR:1908k24})
    3. +は(7530)
    4. /冬(1500,{NI:2676,KR:8508x00})
    5. +の(7410)
    6. /景色(1100,{NI:525,KR:0403i03})
    7. +を(7430)
    8. /読ん(2374,読む,{NY:23,NY:32,NY:26,KR:1508a36})
    9. +だ(7227)
    10. /もの(1800,{NI:1})
    11. +だ(7256)
    12. +。([P]0110)
    13. /nil
    ---
    PATTERN=WJ127171-01=/y#1[GEN2]/kN3は/tcfkN4を/cfV5.kako^rentai!ものだ。
    =[/k,N3,は,/tcfk,N4,を,V5,.kako,!,ものだ。]=0x1ff9c=
    N3=俳句=俳句=n(napf(2))=0x0000c=
    N4=景色=景色=n(napf(6))=0x00180=
    V5=読む=読ん=v(8)=0x00c00=
    ---
    PATTERN=WJ188961-01=/y#1{#1[GEN2]/kN3は,/tcfkN4を}/cfV5.kako^rentai!ものだ。
    =[/k,N3,は,/tcfk,N4,を,V5,.kako,!,ものだ。]=0x1ff9c=
    N3=俳句=俳句=n(napf(2))=0x0000c=
    N4=景色=景色=n(napf(6))=0x00180=
    V5=読む=読ん=v(8)=0x00c00=
    #1=[N3,は,N4,を]=0x0039c=
    #1=[N3,は,N4,を]=0x0039c=
    PATTERN=WJ188961-01=/y#1{#1[GEN2]/kN3は,/tcfkN4を}/cfV5.kako^rentai!ものだ。
    =[GEN2,N3,は,/tcfk,N4,を,V5,.kako,!,ものだ。]=0x1ff9f=
    GEN2=この=この=gen(1)=0x00003=
    N3=俳句=俳句=n(napf(2))=0x0000c=
    N4=景色=景色=n(napf(6))=0x00180=
    V5=読む=読ん=v(8)=0x00c00=
    #1=[GEN2,N3,は,N4,を]=0x0039f=
    #1=[GEN2]=0x00003=
    ---

    結果ファイルの構成は,以下のようになっている.

  5. 文型再現率$R1$の算出
    照合結果ファイルより,適合文型パターンが抽出された入力文の数を算出する. そして,2.2.1節の方法によって$R1$を求める. なお,入力文から作成されたパターン「自己パターン」は,適合文型パターンには含 めないこととする.
  6. 平均適合パターン数$N$の算出
    照合結果ファイルより.抽出された適合文型パターンの数を算出する. ここで, 適合文型パターン数の計算において,注意点が2点ある.1つ目は,$R1$の算出の際 と同様に,自己パターンは含めないことである.2つ目は,適合解の数え方であ る.適合解には変数のバインド情報が含まれている.同一パターンで複数 の適合解がある場合,各変数や関数の対応する形態素が適合解ごとに異な ることで,適合解の個数を数える.(例えば,4.結果ファイル例の場合,適 合文型パターン数は,3パターンとなる.)

  7. 文型パターン拡大率$\eta $の算出
    求めた$R1$$N$の値を用いて,3.2.1節,および,3.2.2節の方法で $\eta $を算出する.


平成17年3月23日