Re: UTF-8 と pTeX

名前: ttk
日時: 2006-05-30 22:32:28
IPアドレス: 61.210.244.*

>>43172 話した内容もごっちゃになっているので整理してみます。 (1) 土村さんの構想 入出力をUTF-8で出来るようにする。内部処理内容は既存のものと全く同じ。 使える文字集合は現在と同じ。 ファイルのエンコーディングの種類が3→4種類になる。 変換表の揺らぎを吸収してしまえば処理内容の混乱は発生しない。 (2) 私の構想その1(>>43137) (1)に加えてコード変換にJIS X 0213の部分を追加する。 JIS第3水準、第4水準が使えるようになる。dviは従来のJISの上位互換。 ただしdviから最終出力までにvfなりCMapなりのコード変換が必要。 pTeXの仕様上の変更点は小さくほぼ上位互換。周辺ツールの変更点も小さくて済む。 文字集合の範囲が明確で、今後の普及も見込め、 丸付き数字や新人名用漢字など需要の多い字が直に打てるようになる。 環境依存の問題も発生しにくい。UTF8入出力が可能になると心強い。 次世代の標準にしたい。 > 例えば,「梯子高」(utf8 0x9ad9)を > JIS 0x967eに変換し,さらにvfで0x9ad9に戻して, > UniJIS-UTF16-H/VでPS/PDFにするという流れでしょうか. 大体これに近いです。 しかし「はしご高」の0x967eはWindows機種依存文字ですね。 その代わりにJIS X 0213を入れようというものです。 JIS X 0213パッケージのdviの仕様を 標準化したい、といった所です。 (3) 私の構想その2(>>43070) (1),(2)とは別に、日本で使えそうな文字を3万字程度突っ込んだ独自の内部コードを作る。 入出力はUTF8, dviはUCS2。 日本語で使えるBMPの文字が直に打てるようになる。 dviwareは既存のものがすぐに使えvfが不要。従来のpTeXとは組版レベルで互換。 dviの段階で互換性は無く、JT1やJY1などのエンコーディングと同時に使えない。 文字数が多すぎて周辺ツールの対応の難易度が高い。 環境によって揃っているフォントが異なるなど、 環境依存の問題が多発する懸念あり(印刷屋さんが大混乱??)。 既存仕様とのギャップが大きすぎて使いづらそう。 実験レベルやインフラを整備しておくという意味では面白いかも。 全てに共通。多言語化ではない。Babel, Utf82TeX, UTF/OTFパッケージなどの重要性は変わらない。 (1)(2)位まではpTeXを名乗ってもなんら問題ないと思います。 ただし(2)以下では、フォント名を変えたりスタイルファイルのルールを作ったり、 という混乱防止策は必要と思います。 (3)はちょっと別物かもしれませんが、JT1, JY1のレベルの置き換えと見ると pTeXを名乗ってもいいのかなと思いますが、問題点が多すぎて企画倒れ気味です。 UTF/OTFのコード変換は 齋藤さんのところの 「VFの構成方法についての覚え書き」に解説がありました。 dviの時点のコード値はすごいことになっていますね。 pTeXの仕様の範囲内でやってしまっているのがすごいです。

この書き込みへの返事:

お名前
題名 
メッセージ(タグは <a href="...">...</a> だけ使えます。適宜改行を入れてください)