upTeXのupjisr-h.vfなどでの引用符

upTeXのupjisr-h.vfなどでの引用符

- 本田 知亮 の投稿
返信数: 3
upTeXのupjisr-h.vfをつらつらと読んでて
思ったのですが.

「‘」「’」と「“」「”」が
(MAPFONT D 2)で別扱いされていますよね.
このあたりに関連して,
makejvfでcnfファイルが導入されたあたりの
githubでのissueは読んだつもりですが,
そこでの議論ともちょっと違うような感じがします
(issueを誤読してなければ・・・).

最終的にmapファイルで違うcmapを
割り当てているからには
そうする必然があるのだと思いますが,
どうしてなんでしょうか

ついでに・・・
cnfファイルで指定されている後半の
番号が大きい文字群(BMPの外の文字?)は
CIDが存在するものを抽出しているという言及が
あったような気がしますので
そういうことかなと思っていますが,
この理解で問題ないでしょうか.

#upLaTeX関係で
#いろいろ「わちゃわちゃ」になったものが来たので
#放置してた諸事を
#いろいろ考えてるという状態だったりします.
本田 知亮 への返信

Re: upTeXのupjisr-h.vfなどでの引用符

- t tk の投稿
「‘」「’」と「“」「”」の特別扱いは cnf ファイルよりずっと以前からある話です。


UCS JIS X 0208
UniJIS-UTF16-H UniJIS-UCS2-H
U+2018 1-38 98 670
U+2019 1-39 96 671
U+201C 1-40 108 672
U+201D 1-41 122 673


「‘」「’」と「“」「”」を和文文脈で用いた場合、pTeX 互換で
CID 670..673 を使いたい。
その一方、U+2018..2019, U+201C..201D を標準的な UniJIS-UTF16-H で用いようとすると欧文グリフの CID 98,96,108,122 になってしまう。
それを避けるため、「‘」「’」と「“」「”」だけは UniJIS-UCS2-H を使えば用が足りるので vf の割当て先を分けることにした。

という事情でです。

本田 知亮 への返信

Re: upTeXのupjisr-h.vfなどでの引用符

- t tk の投稿
> cnfファイルで指定されている後半の
番号が大きい文字群(BMPの外の文字?)は
CIDが存在するものを抽出しているという言及が
あったような気がします

私も詳細は忘れてしまいました複雑な
uptex-fontsで提供する文字の範囲など
に記録が残っていますが、まとめると以下だと思います。

  • BMP超えは Adobe-Japan1-7 に見える文字のみ
  • BMP以内は原則、同一ブロック内に Adobe-Japan1-7の文字があればブロック内全部
  • ただし、次の4文字は例外的に登録しない。
    • U+0FD6 ࿖ Left-facing Svasti Sign CID:12182 in Tibetan block
    • U+2E40 ⹀ Double Hyphen CID:15516 in Supplemental Puncutuation block
    • U+A7B5 ꞵ Latin Small Letter Beta CID:15909 in Latin Extended-D block
    • U+AB53 ꭓ Latin Small Letter Chi CID:15911 in Latin Extended-E
現在は、dvipdfmx, dvips ともに vf 未登録時のフォールバックが動くようになっているので、vfへの登録がなくとも実フォントに全角グリフがあれば出力されるはずです。

t tk への返信

Re: upTeXのupjisr-h.vfなどでの引用符

- 本田 知亮 の投稿
ご教示ありがとうございます.

特別扱いの件,文字範囲の件,理解できました.
もう一歩奥にあるcmapまで追いかけてませんでした.
大変助かりました.

%-------
将来的なことを考えれば
upTeX化・LuaTeX化が正道なんでしょうが,
なかなか・・・

レアケースではありますが,
LaTeX2.09時代の重版がきたり,
FDでの入稿まである業界です(2020年実績)