Next: 考察(サンプルテスト)
Up: 含有率算出
Previous: 含有率算出
以下にサンプルテストの結果から、各置き換えごとに抽出された
表現数をまとめた表を示す。
Table:
N-gram抽出表現数
置き換え名 |
抽出表現数 |
連鎖・離散表現数 |
適正表現数 |
置き換え無し |
748066 |
53552 |
- |
連鎖置き換えA |
495265 |
35834 |
1156 |
連鎖置き換えB |
370726 |
25901 |
1581 |
連鎖置き換えC |
219843 |
14808 |
3551 |
置き換え無し |
- |
9589 |
- |
離散置き換えA |
495265 |
1030 |
109 |
離散置き換えB |
231558 |
335 |
72 |
|
|
|
|
表にある抽出表現数とはN-gramによって
抽出された表現の種類の合計数である。
連鎖(離散)表現数とは連鎖(離散)置き換え後、抽出された連鎖(離散)表現の
種類数の合計値である。
適正表現数とは連鎖・離散表現数から人手で抽出した
重文・複文に関係した表現の種類数の合計である。
以下にサンプルテストの結果から算出された置き換えごとの
含有率をまとめた表を示す。
Table:
適正表現含有率
置き換え |
含有率 |
品詞数 |
連鎖置き換えA |
3.2% |
11 |
連鎖置き換えB |
6.1% |
13 |
連鎖置き換えC |
23.9% |
22 |
離散置き換えA |
10.6% |
11 |
離散置き換えB |
21.5% |
21 |
品詞数とは品詞コードに応じて。γに置き換えた品詞数のことである。
名詞、格助詞、副助詞は使用される語の意味ごとに
1つの品詞として定義している。
2000-04-09