名前: ttk 日時: 2006-09-23 23:44:47 IPアドレス: 61.210.211.*
>>45027 p(la)tex-utf8の方針は 「単純で見通しの良い実装」「内部はEUCのまま」で 「エンコーディングとしてのUTF8を利用可能にする」 「凝ったことはなるべくしない」ということだったと思います。 私の考えでは「^^ab化で[utf8]{inputenc}はオマケ」的な位置づけだと思っております。 EUCに対応する文字がある以上、(ptex-utf8では当面)欧文ではなく和文として扱う方がよいと思います。 欧文と和文の振り分けをカスタマイズできる仕組みが欲しいところですが、 それは内部unicode化による本格的な改造と同時に作れそうな気がしています。 ただし、1面79区の「¥」だけは、 U+00A5に対応付けている実装よりU+FFE5のほうが圧倒的優勢のような気がするので、 ヴァリエーションテーブルから外してもいいかもしれません。 また、「¢」「£」「¬」をWindows風にfullwidthの方のみにしてしまう 手もあるにはありますが、どっちがいいのでしょうか。 以下U+00FF以下の関係ありそうな字です。漏れがあるかもしれません。 r-c jis euc sjis ucs (ch)fyi 1-13 j-212d e-a1ad 0x814C U+00B4 # ACUTE ACCENT 「´」 1-15 j-212f e-a1af 0x814E U+00A8 # DIAERESIS 「¨」 1-62 j-215e e-a1de 0x817D U+00B1 # PLUS-MINUS SIGN 「±」 1-63 j-215f e-a1df 0x817E U+00D7 # MULTIPLICATION SIGN 「×」 1-64 j-2160 e-a1e0 0x8180 U+00F7 # DIVISION SIGN 「÷」 1-75 j-216b e-a1eb 0x818B U+00B0 # DEGREE SIGN 「°」 1-79 j-216f e-a1ef 0x818F U+00A5 # YEN SIGN 「¥」 FULLWIDTH:U+FFE5 1-81 j-2171 e-a1f1 0x8191 U+00A2 # CENT SIGN 「¢」 Windows(FULLWIDTH): U+FFE0 1-82 j-2172 e-a1f2 0x8192 U+00A3 # POUND SIGN 「£」Windows(FULLWIDTH): U+FFE1 1-88 j-2178 e-a1f8 0x8198 U+00A7 # SECTION SIGN 「§」 2-44 j-224c e-a2cc 0x81CA U+00AC # NOT SIGN 「¬」 Windows(FULLWIDTH): U+FFE2 2-89 j-2279 e-a2f9 0x81F7 U+00B6 # PILCROW SIGN 「¶」
この書き込みへの返事: