[qa:49111] Re: uptex-0.11

Re: uptex-0.11

名前: ttk
日時: 2007-08-15 22:49:23
IPアドレス: 61.210.211.*

>>49109
ZR様、詳細なご検討ありがとうございました。
実は私も、以前、似たような調査をしていました。
但し、このときの主目的は、ptexenc (当時はまだlibkanjiだったと思う) において、
「Unicode → JIS系 の多対一変換が広すぎではないだろうか」という観点での調査でした。

> 例えば、U+2225 を vf を用いて U+2016 に置換する等の策が考えられ
> ます(この場合、ujis→urml の vf に組み込むことになるでしょう)。
umin*.vf, ujis.vfなどで、全角優先でコードポイントを変換してしまう、という手は
確かに考えられますね。
「2142 <‖>」等は、全角優先でU+2225→U+2016の変換でうまくいきます。

次に悩ましいのは、「213D <―>」「227E <◯>」の全角対応が複数ある場合が困ります。
JIS → Unicode で変換したときのばらつきを考慮して
「213D <―>」はCMapの"H"を見て真似すればよさそうにも思えますが、
今度は、U+2014とU+2015を使い分けたい場合を考えると変換するわけにもいきません。
これは、もう放置するしかないでしょう。
# 但し、「227E <◯>」→U+20DD の変換は全く見たことが無いくらい稀なので
# 無視してよさそう

ちょっと別の話ですが、
似たような話で困っているのが
<“>(JIS1-1-40(0x2148) U+201C)
<”>(JIS1-1-41(0x2149) U+201D)
です。
H, UniJIS-UCS2-H ではCID672, CID673と全角幅に対応していますが、
UniJIS-UTF16-H など新しいものではCID108, CID122と狭い幅のものに対応しています。
tfmに準ずるにはCID672, CID673の全角の方が都合がいいのですが
CMapの新しい標準では違ってしまいます。
さてどうしましょう。
この書き込みへの返事：