QA: upTeXのupjisr-h.vfなどでの引用符

upTeXのupjisr-h.vfをつらつらと読んでて
思ったのですが．

「‘」「’」と「“」「”」が
(MAPFONT D 2)で別扱いされていますよね．
このあたりに関連して，
makejvfでcnfファイルが導入されたあたりの
githubでのissueは読んだつもりですが，
そこでの議論ともちょっと違うような感じがします
（issueを誤読してなければ・・・）．

最終的にmapファイルで違うcmapを
割り当てているからには
そうする必然があるのだと思いますが，
どうしてなんでしょうか

ついでに・・・
cnfファイルで指定されている後半の
番号が大きい文字群（BMPの外の文字？）は
CIDが存在するものを抽出しているという言及が
あったような気がしますので
そういうことかなと思っていますが，
この理解で問題ないでしょうか．

＃upLaTeX関係で
＃いろいろ「わちゃわちゃ」になったものが来たので
＃放置してた諸事を
＃いろいろ考えてるという状態だったりします．

Re: upTeXのupjisr-h.vfなどでの引用符

2021年 07月 3日(土曜日) 13:57 - t tk の投稿

「‘」「’」と「“」「”」の特別扱いは cnf ファイルよりずっと以前からある話です。

	UCS	JIS X 0208	UniJIS-UTF16-H	UniJIS-UCS2-H
‘	U+2018	1-38	98	670
’	U+2019	1-39	96	671
“	U+201C	1-40	108	672
”	U+201D	1-41	122	673

「‘」「’」と「“」「”」を和文文脈で用いた場合、pTeX 互換で

CID 670..673 を使いたい。

その一方、U+2018..2019, U+201C..201D を標準的な UniJIS-UTF16-H で用いようとすると欧文グリフの CID 98,96,108,122 になってしまう。

それを避けるため、「‘」「’」と「“」「”」だけは UniJIS-UCS2-H を使えば用が足りるので vf の割当て先を分けることにした。

という事情でです。

Re: upTeXのupjisr-h.vfなどでの引用符

2021年 07月 3日(土曜日) 14:17 - t tk の投稿

> cnfファイルで指定されている後半の
番号が大きい文字群（BMPの外の文字？）は
CIDが存在するものを抽出しているという言及が

あったような気がします

私も詳細は忘れてしまいました $複雑な$
uptex-fontsで提供する文字の範囲など

に記録が残っていますが、まとめると以下だと思います。

BMP超えは Adobe-Japan1-7 に見える文字のみ
BMP以内は原則、同一ブロック内に Adobe-Japan1-7の文字があればブロック内全部
ただし、次の4文字は例外的に登録しない。
- U+0FD6 ࿖ Left-facing Svasti Sign CID:12182 in Tibetan block
- U+2E40 ⹀ Double Hyphen CID:15516 in Supplemental Puncutuation block
- U+A7B5 ꞵ Latin Small Letter Beta CID:15909 in Latin Extended-D block
- U+AB53 ꭓ Latin Small Letter Chi CID:15911 in Latin Extended-E

現在は、dvipdfmx, dvips ともに vf 未登録時のフォールバックが動くようになっているので、vfへの登録がなくとも実フォントに全角グリフがあれば出力されるはずです。

Re: upTeXのupjisr-h.vfなどでの引用符

2021年 07月 4日(日曜日) 00:17 - 本田知亮の投稿

ご教示ありがとうございます．

特別扱いの件，文字範囲の件，理解できました．
もう一歩奥にあるcmapまで追いかけてませんでした．
大変助かりました．

%-------
将来的なことを考えれば
upTeX化・LuaTeX化が正道なんでしょうが，
なかなか・・・

レアケースではありますが，
LaTeX2.09時代の重版がきたり，
FDでの入稿まである業界です（2020年実績）