皆さん、情報ありがとうございました。
「jis の時の高位バイト」については、こんな感じになっていると推定できそうです。
- 昔からずっと、実装上は、「内部漢字コードを用いている」と解釈する。
- しかし昔(p3.0.4以降で ptexenc 導入まで)は入力漢字コードが jis(
-kanji=jis
)である場合は、内部漢字コードは euc に固定されていた。 - 従って、外部仕様としては、
-kanji=jis
の時に「実際には euc も読める」とされた。 - ptexenc では、内部漢字コード(
-kanji-internal
)と入力漢字コード(-kanji
)が独立に指定できる。 - そして、「jis の時の高位バイト」については、昔の“実装上の仕様”を踏襲していて、内部漢字コードと同じになる。これが可変になったため、もはや euc とは限らなくなった。