「鬼滅の刃」のヒロイン「竈門禰󠄀豆子」(かまどねずこ)の「禰󠄀」は,「禰」(U+79B0)+異体字セレクタ(U+E0100 VARIATION SELECTOR-17)でできている(→ UTF-8のテーブル(MySQL5.6)に竈門禰󠄀豆子が格納できない問題を調べてみた)。これをLaTeXで出せるか。
使ったのは普通の TeX Live 2021 で,Mac 上でテストした。ドキュメントクラスは何でもいいが,platex・uplatex・lualatex のどれにも対応する jlreq にしてみた。
\documentclass{jlreq} \begin{document} 竈門禰󠄀豆子 \end{document}
まず platex してみよう。
l.4 竈門禰^^f3^^a0^^84^^80 豆子 ?
異体字セレクタでエラーになってしまう。
uplatex では処理できた。しかし dvipdfmx で警告。
dvipdfmx:warning: No character mapping available. CMap name: UniJIS-UTF16-H input str:
PDFを表示させると「竈門禰⊠豆子」のようになってしまう。
lualatex ならちゃんと「竈門禰󠄀豆子」と表示されるPDFができた。
異体字セレクタではないが,UTF-8が4バイトになることは,もっと簡単な文字でもありうる。2010年に常用漢字に追加された「𠮟る」の「𠮟」(シツ,しか(る),U+20B9F)も4バイトだ。platex では処理できない。
\documentclass{jlreq} \begin{document} 𠮟る \end{document}
l.4 ^^f0^^a0^^ae^^9f る ?
こちらは uplatex でも lualatex でも処理できる。
ちなみに「叱」(字音「カ」,U+53F1)は本来は別字だが,UTF-8が3バイトに収まり,「𠮟」の代用として用いられてきた(←ややこしい歴史的経緯は省略^^;)。