next up previous
Next: 実際の例文の抜き出し Up: 本文からテキストの取り出し Previous: JISコード

制御コード

制御コードの場合は、コードに応じて様々な処理が必要です。

まず、1番に注意すべきコードは0x1f04,0x1f05です。 これは、半角開始、終了コードで、このコードが現れたらフラグを立てるなどして、出力する文字を半角に変換します。 ただし、半角(ASCIIコード)に存在しない文字も半角開始〜終了内に含まれている場合があるので注意が必要です。

次は、0x1f0aです。 これは改行コードですので、改行を出力してください。

この他にも注意すべき制御コードはたくさんありますが、詳細は参考文献やhonmondump.cを参照してください。 コードによっては続く数バイトをパラメータとして使用するものがあり、読み飛ばすなどの処理が必要です。 ちなみに、パラメータではBCDが使われているものもあります。

honmondump.cHONMONから本文をテキスト形式で抽出するプログラムです。



Katayama 2002-03-12