「竈門禰󠄀豆子」をLaTeXで

「鬼滅の刃」のヒロイン「竈門禰󠄀豆子」(かまどねずこ)の「禰󠄀」は,「禰」(U+79B0)+異体字セレクタ(U+E0100 VARIATION SELECTOR-17)でできている(→ UTF-8のテーブル(MySQL5.6)に竈門禰󠄀豆子が格納できない問題を調べてみた)。これをLaTeXで出せるか。

使ったのは普通の TeX Live 2021 で,Mac 上でテストした。ドキュメントクラスは何でもいいが,platex・uplatex・lualatex のどれにも対応する jlreq にしてみた。

\documentclass{jlreq}
\begin{document}

竈門禰󠄀豆子

\end{document}

まず platex してみよう。

l.4 竈門禰^^f3^^a0^^84^^80
                          豆子
? 

異体字セレクタでエラーになってしまう。

uplatex では処理できた。しかし dvipdfmx で警告。

dvipdfmx:warning: No character mapping available.
 CMap name: UniJIS-UTF16-H
 input str: 

PDFを表示させると「竈門禰⊠豆子」のようになってしまう。

lualatex ならちゃんと「竈門禰󠄀豆子」と表示されるPDFができた。

異体字セレクタではないが,UTF-8が4バイトになることは,もっと簡単な文字でもありうる。2010年に常用漢字に追加された「𠮟る」の「𠮟」(シツ,しか(る),U+20B9F)も4バイトだ。platex では処理できない。

\documentclass{jlreq}
\begin{document}

𠮟る

\end{document}
l.4 ^^f0^^a0^^ae^^9f
                    る
? 

こちらは uplatex でも lualatex でも処理できる。

ちなみに「叱」(字音「カ」,U+53F1)は本来は別字だが,UTF-8が3バイトに収まり,「𠮟」の代用として用いられてきた(←ややこしい歴史的経緯は省略^^;)。