周波数の誤差を修正を目的として,離散フーリェ変換の窓長を音節素片の開始時か ら1周期の整数倍にするために,窓長の0.5msまで(約0.0625ms刻み,計17種 類)に対して離散フーリエ変換を行い,振幅が最も0に近い音節開始位置を選択す ることで誤差の修正を試みる.次ページの表3.3に位相修 正を行う時に用いたデータを示す.
data number | 74 | 75 | 76 | 77 | 78 | |
frequency resolution(hz) | 216.216216 | 213.333333 | 210.526316 | 207.792208 | 205.128205 | |
frequency(hz) | 216.216216 | 213.333333 | 210.526316 | 207.792208 | 205.128205 | |
max power | 1371.825709 | 1382.304121 | 1390.597346 | 1396.709986 | 1400.937979 | |
initial phase(rad) | 0.309486 | 0.353311 | 0.395940 | 0.437506 | 0.478055 | |
1 period length(ms) | 4.625000 | 4.687500 | 4.750000 | 4.812500 | 4.875000 | |
shift time(ms) | 1.384060 | 1.435459 | 1.486825 | 1.538225 | 1.589663 | |
shift point | -22 | -23 | -24 | -25 | -25 | |
initial amplitude | 1518 | 1283 | 1248 | 963 | 963 | |
data number | 79 | 80 | 81 | 82 | 83 | |
frequency resolution(hz) | 202.531646 | 200.000000 | 197.530864 | 195.121951 | 192.771084 | |
frequency(hz) | 202.531646 | 200.000000 | 197.530864 | 195.121951 | 192.771084 | |
max power | 1404.109487 | 1406.285700 | 1407.525564 | 1407.013845 | 1405.076525 | |
initial phase(rad) | 0.517430 | 0.555702 | 0.592932 | 0.629561 | 0.665546 | |
1 period length(ms) | 4.937500 | 5.000000 | 5.062500 | 5.125000 | 5.187500 | |
shift time(ms) | 1.640986 | 1.692214 | 1.743363 | 1.794763 | 1.846361 | |
shift point | -26 | -27 | -28 | -29 | -30 | |
initial amplitude | 728 | 450 | 88 | 60 | -253 | |
data number | 84 | 85 | 86 | 87 | 88 | |
frequency resolution(hz) | 190.476190 | 188.235294 | 186.046512 | 183.908046 | 181.818182 | |
frequency(hz) | 190.476190 | 188.235294 | 186.046512 | 183.908046 | 181.818182 | |
max power | 1401.455628 | 1395.906178 | 1388.003210 | 1377.908184 | 1366.033870 | |
initial phase(rad) | 0.701122 | 0.736541 | 0.772195 | 0.808151 | 0.844301 | |
1 period length(ms) | 5.250000 | 5.312500 | 5.375000 | 5.437500 | 5.500000 | |
shift time(ms) | 1.898332 | 1.950878 | 2.004330 | 2.058753 | 2.114061 | |
shift point | -30 | -31 | -32 | -33 | -34 | |
initial amplitude | -253 | -454 | -916 | -1267 | -1773 | |
data number | 88 | 89 | 90 | |||
frequency resolution(hz) | 181.818182 | 179.775281 | 177.777778 | |||
frequency(hz) | 181.818182 | 179.775281 | 177.777778 | |||
max power | 1366.033870 | 1352.002315 | 1336.457808 | |||
initial phase(rad) | 0.844301 | 0.881115 | 0.918287 | |||
1 period length(ms) | 5.500000 | 5.562500 | 5.625000 | |||
shift time(ms) | 2.114061 | 2.170676 | 2.228343 | |||
shift point | -34 | -35 | -36 | |||
initial amplitude | -1773 | -2098 | -2220 |
表3.3は,表3.2において,1周期の波長 の離散値が1 period pointに示されており,81.920000ポイントだった.そこで, 位相を修正する目的でその8ポイント(0.5ms)の範囲で1ポイント (0.0625ms)刻みで波長を増減させ,離散フーリエ変換を行った結果を示している. 表3.3では,data numberで示されている波長で,それぞ れ,74ポイントの窓長から90ポイントまでの窓長で離散フーリエ変換を行ってい る.表における2frequency resolution(hz)から,1 period length(ms)までは, 表3.2と同じ数値を示している.shift time(ms)は初期位相が, ``-π/2''から何msずれているから示している.これに対して,離散値でshift pointの値だけ音声波形の位相をずらせば,初期位相が``-π/2''になる.そして, 最後にinitial amplitudeは,音声波形の初期位相を``-π/2''にずらした時の音 節開始位置における振幅の値である.本研究では,計17ポイントの窓長から求ま る音節開始位置の振幅の中から最も0に近い値の音節開始位置を音節境界位置と して選択する.