upTeXのupjisr-h.vfをつらつらと読んでて
思ったのですが.
「‘」「’」と「“」「”」が
(MAPFONT D 2)で別扱いされていますよね.
このあたりに関連して,
makejvfでcnfファイルが導入されたあたりの
githubでのissueは読んだつもりですが,
そこでの議論ともちょっと違うような感じがします
(issueを誤読してなければ・・・).
最終的にmapファイルで違うcmapを
割り当てているからには
そうする必然があるのだと思いますが,
どうしてなんでしょうか
ついでに・・・
cnfファイルで指定されている後半の
番号が大きい文字群(BMPの外の文字?)は
CIDが存在するものを抽出しているという言及が
あったような気がしますので
そういうことかなと思っていますが,
この理解で問題ないでしょうか.
#upLaTeX関係で
#いろいろ「わちゃわちゃ」になったものが来たので
#放置してた諸事を
#いろいろ考えてるという状態だったりします.
「‘」「’」と「“」「”」の特別扱いは cnf ファイルよりずっと以前からある話です。
UCS | JIS X 0208 |
UniJIS-UTF16-H | UniJIS-UCS2-H | |
‘ | U+2018 | 1-38 | 98 | 670 |
’ | U+2019 | 1-39 | 96 | 671 |
“ | U+201C | 1-40 | 108 | 672 |
” | U+201D | 1-41 | 122 | 673 |
「‘」「’」と「“」「”」を和文文脈で用いた場合、pTeX 互換で
CID 670..673 を使いたい。
その一方、U+2018..2019, U+201C..201D を標準的な UniJIS-UTF16-H で用いようとすると欧文グリフの CID 98,96,108,122 になってしまう。
それを避けるため、「‘」「’」と「“」「”」だけは UniJIS-UCS2-H を使えば用が足りるので vf の割当て先を分けることにした。
という事情でです。
> cnfファイルで指定されている後半の
番号が大きい文字群(BMPの外の文字?)は
CIDが存在するものを抽出しているという言及が
に記録が残っていますが、まとめると以下だと思います。
番号が大きい文字群(BMPの外の文字?)は
CIDが存在するものを抽出しているという言及が
あったような気がします
- BMP超えは Adobe-Japan1-7 に見える文字のみ
- BMP以内は原則、同一ブロック内に Adobe-Japan1-7の文字があればブロック内全部
- ただし、次の4文字は例外的に登録しない。
- U+0FD6 ࿖ Left-facing Svasti Sign CID:12182 in Tibetan block
- U+2E40 ⹀ Double Hyphen CID:15516 in Supplemental Puncutuation block
- U+A7B5 ꞵ Latin Small Letter Beta CID:15909 in Latin Extended-D block
- U+AB53 ꭓ Latin Small Letter Chi CID:15911 in Latin Extended-E
現在は、dvipdfmx, dvips ともに vf 未登録時のフォールバックが動くようになっているので、vfへの登録がなくとも実フォントに全角グリフがあれば出力されるはずです。