Re: pTeXの内部Unicode化実験

名前: ttk
日時: 2007-04-16 00:41:58
IPアドレス: 61.210.54.*

栗山さん、永田さん、ZRさんこんばんは。 動作テスト、ご協力ありがとうございます。 uptex-0.06を公開しました。 >>47613 フォントパッケージuptex_font-0.06.tar.gzにoreillyからコピーしたCMapを入れました。 こちらに更新していただくと、CMapのWarningはなくなると思います。 また、sampleで"nkf -g" による文字コードのチェックをやめ、 perl5.6 + Jcode.pm または perl5.8 + Encode.pm のチェックに変更し、 無いときはチェックを飛ばすようにしました。 ここで落ちることはなくなったと思います。 jsclassのエラーはこちらでは再現しませんでした。 >>47642 pdfでコピペの件、ご確認ありがとうございました。 期待通りで、何よりです。 > (5) 以下のタイプセット > には for_dvipdfmx マップを kanjix.map にアペンドする必要がある > ように思いました(これで正しい?)。 CJKのフォントの自動設定は出来ていないのですが、 tfmは自動展開で存在するはずなのでdviまでは出来ますし、 またdvipdfmx, dvipsのフォント非埋め込みは自動で設定されていると思います。 dvipdfmxでフォントを埋め込む場合と、xdviは自動で設定できないので、 手動でお願いします。 typoのご指摘ありがとうございました。訂正しました。 >>47643 実は、正しいUTF-8でも大丈夫かどうか(文字列が長くなったときなど)、まだ心配しています。 不正な文字列が来たときは、なおさらどうなっているのか分かっていません(汗)。 > \csname ^^81~\endcsname > とすると Segmentation fault になってしまいました。 エラーは出ましたが、 "Segmentation fault"自体は再現しませんでした。 おいおい調べてみます。 > 現在の実装では > \× と \^^d7 ('×' = U+00D7) > は異なる control sequence と認識されます。これは恐らく > '×' の内部コードが "D7 でなく "1100D7(=\ucs"D7) で > あるからだと思うのですが、 そうなんですが、私の理解が正しければ、 control wordは、UTF-8(オリジナルpTeXならEUC/SJIS)で管理されているようです。 ですから、 \×と\^^c3^^97 (c3 97 は U+00D7 のUTF-8) が同じになっていると思います(未確認)。 > 最終的に '×' の内部コードを > "D7 にした時に、この 2 つを同一視するかどうかが問題に > なるかも知れません。 内部コードを変更しても、多分、 \×と\^^c3^^97 を同一視することになると思います。

この書き込みへの返事:

お名前
題名 
メッセージ(タグは <a href="...">...</a> だけ使えます。適宜改行を入れてください)