expert オプションのカナ文字化け

expert オプションのカナ文字化け

- aminophen の投稿
返信数: 5
ちょっと疑問に思ってしまったので、質問させてください…

LuaTeX-ja の luatexja-preset に expert オプションを付けて PDF を作成すると
- PDF ビューアで文字を選択してのコピー&ペースト
- Xpdf や Poppler の pdftotext
の両方で「仮名が文字化けする」という問題を、昨夜解決していただいたようです。
手元の W32TeX に当該コミットのスクリプトを持ってきて小塚 (OpenType) で試したところ、解決を確認しました。
# Twitter 拾っていただきありがとうございます

そこで疑問なのですが、pTeX/upTeX + dvipdfmx で otf に expert を付けて PDF を作成すると
- PDF ビューアで文字を選択してのコピー&ペースト
では正常で
- Xpdf や Poppler の pdftotext
では仮名文字が欠落するという問題が残っています。これは美文書6版サポートページに書かれた頃から
既知のようですが、なにか解決策はあるのでしょうか、というご相談です。

# LuaTeX-ja のほうを解決していただきながら、すみません…

追記:「文字化け」というと不正確でした。「抜け落ちる」に訂正しました。
サポートページのような事後処理ではなく PDF 作成時の対応のほうが良いと思いまして…
aminophen への返信

Re: expert オプションのカナ文字化け

- 匿 名 の投稿
Xpdf や Poppler が持っている Adobe-Japan1 の CID と Unicode の対応表を更新してもらうしかないんじゃないでしょうか。

dvipdfmx で Adobe-Japan1 と Unicode のきちんとした対応表を PDF に埋め込ませるようにするのも解決策ですが、現状でできるかどうかわかりません。
匿 名 への返信

Re: expert オプションのカナ文字化け

- aminophen の投稿
> 現状でできるかどうかわかりません。

私もその疑問を持っていて、技術的困難が理由で非対応なのかなあとも思っています。
ビューア依存性らしき面もみられるので「どんな状況だと欠落するのか」がはっきりするだけでも情報として有益です。
aminophen への返信

Re: expert オプションのカナ文字化け

- 匿 名 の投稿
技術的な困難は特になく、Xpdf や Poppler のバグなので dvipdfmx でどうにかするのは筋違いということになると思います。
匿 名 への返信

Re: expert オプションのカナ文字化け

- aminophen の投稿
やっぱりそうですかね。回答ありがとうございます。
aminophen への返信

Re: expert オプションのカナ文字化け

- 匿 名 の投稿
Poppler だと cidToUnicode/Adobe-Japan1 というファイルが Adobe-Japan1 と Unicode の対応表だと思われるので、おそらくこれを更新ですね。

Adobe-Japan1-4 以降の縦書き/横書き用かなとルビ用かな、プロポーショナルかな等がごっそり抜けおちてるようです。