現状の (u)pTeX において入力漢字コードに jis を指定(-kanji=jis
)した場合、入力ファイルに含まれる高位バイト(128 以上のバイト)の扱いはどうなるのでしょうか?
確か、昔の(ptexenc 導入以前の)pTeX では、kanji=jis
の時に高位バイトがあればそれは EUC-JP として解釈されていたはずです。
しかし、少なくとも Windows の TeX Live(最新)で試したところでは、内部漢字コード(-kanji-internal
)と同じと解釈されるように見えます。そういう仕様なのでしょうか。
[test.tex]
% 文字コードはeuc \message{\number`琲}\bye % E0 EA % sjisだと〈瑕〉となる
これを以下のコマンドでコンパイルします。
ptex -no-guess-input-enc -kanji=(F) -kanji-internal=(I) test.tex
\message
で出力される整数値は以下のようになりました。
(F) | (I) | 値 |
sjis | sjis | 57578 |
sjis | euc | 57580 |
euc | sjis | 57576 |
euc | euc | 57578 |
jis | sjis | 57578 |
jis | euc | 57578 |