next up previous contents
Next: 考察(サンプルテスト) Up: 含有率算出 Previous: 含有率算出

実験結果(サンプルテスト)

以下にサンプルテストの結果から、各置き換えごとに抽出された 表現数をまとめた表を示す。



 
Table: N-gram抽出表現数
置き換え名 抽出表現数 連鎖・離散表現数 適正表現数
置き換え無し 748066 53552 -
連鎖置き換えA 495265 35834 1156
連鎖置き換えB 370726 25901 1581
連鎖置き換えC 219843 14808 3551

置き換え無し

- 9589 -
離散置き換えA 495265 1030 109
離散置き換えB 231558 335 72

     



表にある抽出表現数とはN-gramによって 抽出された表現の種類の合計数である。 連鎖(離散)表現数とは連鎖(離散)置き換え後、抽出された連鎖(離散)表現の 種類数の合計値である。

適正表現数とは連鎖・離散表現数から人手で抽出した 重文・複文に関係した表現の種類数の合計である。

以下にサンプルテストの結果から算出された置き換えごとの 含有率をまとめた表を示す。



 
Table: 適正表現含有率
置き換え 含有率 品詞数
連鎖置き換えA 3.2% 11
連鎖置き換えB 6.1% 13
連鎖置き換えC 23.9% 22

離散置き換えA

10.6% 11
離散置き換えB 21.5% 21



品詞数とは品詞コードに応じて。γに置き換えた品詞数のことである。 名詞、格助詞、副助詞は使用される語の意味ごとに 1つの品詞として定義している。




2000-04-09