upTeXの仕様 (Re: 欧文ギリシア語の扱い)

名前: ttk
日時: 2007-06-03 23:37:35
IPアドレス: 61.210.211.*

ZR様、いつもながらご指摘ありがとうございます。 >>48210 > § を欧文扱いにした後、 > \kcatcode`§=18 > として「元に戻す」ことはできませんよね。 > # もはや「§」のトークンが存在せず「\kcatcode`^^c2^^a7=18」 > # と見做されているため。 うっかりしていましたが、仰るとおりです。 > 私はこれは不便だと思うのですが、どう考えるべきものでしょうか。 本格的に対応しようとすると、改造量が「Omega + pTeX」なものになりそうな気がします。 できれば upTeX ではそれは避けたいです。 場当たり的には、 \kcatcode の引数のときだけスキャン方法を変えるようなことをすると実現できるのかもしれませんが、 複雑すぎでしかも美しくないような感じもしますし、私には難しいかもしれません。 将来の課題、ということで先送りしたいです。 数値入力での対応をお願いすることになりそうです。 > 1. 和文文字のトークンに対し、その文字の \kcatcode が 15 の状態で > \string を作用させると、不可解なトークンが発生するようです。 なるほど、このように矛盾が発生するようなケースは他にもありそうですね。 修正可能なものか、もともとの仕様に無理があるのか、ちょっと考えてみます。 > 2. これは質問です。現在(u0.08)の upTeX での \char の仕様はどう > なっているのでしょうか。(和文扱いか欧文扱いか等) u0.07以前は、 文字コード255以下の文字は欧文、文字コード256以上の文字は和文になっていたと思います。 u0.08では、文字コード255以下の文字は、kcatcode, enablecjktokenを見て、 和文の条件を満たせば和文に回します。 「文字コード256以上でかつ、kcatcode=15のケース」では、 おかしな結果になると思います。 単純な場合ではエラーチェックに引っかかってくれるはずだと思ってはいるのですが、 果たしてどうでしょうか。

この書き込みへの返事:

お名前
題名 
メッセージ(タグは <a href="...">...</a> だけ使えます。適宜改行を入れてください)