Re: uptex-0.11

名前: ttk
日時: 2007-08-15 22:49:23
IPアドレス: 61.210.211.*

>>49109 ZR様、詳細なご検討ありがとうございました。 実は私も、以前、似たような調査をしていました。 但し、このときの主目的は、ptexenc (当時はまだlibkanjiだったと思う) において、 「Unicode → JIS系 の多対一変換が広すぎではないだろうか」という観点での調査でした。 > 例えば、U+2225 を vf を用いて U+2016 に置換する等の策が考えられ > ます(この場合、ujis→urml の vf に組み込むことになるでしょう)。 umin*.vf, ujis.vfなどで、全角優先でコードポイントを変換してしまう、という手は 確かに考えられますね。 「2142 <‖>」等は、全角優先でU+2225→U+2016の変換でうまくいきます。 次に悩ましいのは、「213D <―>」「227E <◯>」の全角対応が複数ある場合が困ります。 JIS → Unicode で変換したときのばらつきを考慮して 「213D <―>」はCMapの"H"を見て真似すればよさそうにも思えますが、 今度は、U+2014とU+2015を使い分けたい場合を考えると変換するわけにもいきません。 これは、もう放置するしかないでしょう。 # 但し、「227E <◯>」→U+20DD の変換は全く見たことが無いくらい稀なので # 無視してよさそう ちょっと別の話ですが、 似たような話で困っているのが <“>(JIS1-1-40(0x2148) U+201C) <”>(JIS1-1-41(0x2149) U+201D) です。 H, UniJIS-UCS2-H ではCID672, CID673と全角幅に対応していますが、 UniJIS-UTF16-H など新しいものではCID108, CID122と狭い幅のものに対応しています。 tfmに準ずるにはCID672, CID673の全角の方が都合がいいのですが CMapの新しい標準では違ってしまいます。 さてどうしましょう。

この書き込みへの返事:

お名前
題名 
メッセージ(タグは <a href="...">...</a> だけ使えます。適宜改行を入れてください)