Re: pTeXの内部Unicode化実験

名前: ZR
日時: 2007-04-15 16:58:00
IPアドレス: 59.140.98.*

>>47621 ttk さん、こんにちは。 upTeX を Cygwin 上で構築して動かしてみているのですが、 \csname ^^81~\endcsname とすると Segmentation fault になってしまいました。 エラーの表示の最中に落ちているものだと思われます。 #\typeout{>>^^ce/^^b1<<}\typeout{>>^^ae/^^ce<<}\typeout{>>} #のような正しい UTF-8 符号化文字列でないものを出力させると #かなり不可解な結果になるので、これと同様の現象だと #思われます。ただ、こちらの方は pTeX でも(正しい EUC/SJIS #でない場合に)発生する現象であり、そもそも何が出力されれば #正しいのかが明らかでないのでバグではないかもしれません。 現在の実装では \× と \^^d7 ('×' = U+00D7) は異なる control sequence と認識されます。これは恐らく '×' の内部コードが "D7 でなく "1100D7(=\ucs"D7) で あるからだと思うのですが、最終的に '×' の内部コードを "D7 にした時に、この 2 つを同一視するかどうかが問題に なるかも知れません。 # ちなみに、'\csname ×\endcsname' を書いたファイルを # 誤って SJIS で保存したために、最初に書いた現象が # 判明しました。(SJIS で '×'=817Eh)

この書き込みへの返事:

お名前
題名 
メッセージ(タグは <a href="...">...</a> だけ使えます。適宜改行を入れてください)