コンパイル後PDFにおける文字情報について

コンパイル後PDFにおける文字情報について

- Asatsuki Yuna の投稿
返信数: 5
お世話になっております.

TexStudioで執筆およびPDFへのコンパイルを行っているのですが,
PDFの見かけ上は何ら問題なくコンパイル出来るものの,
PDFファイルの文字をテキストエディタやWordにコピー&ペーストすると,
一部単語の綴りが抜けるという現象が起きています.
(具体的には「fi」などが抜けやすいです)
----------
例えば,PDF上では問題なく「related research field」と表示されているものが,
テキストコピー&ペーストすると,「related research _elds」と,一部が抜けた状態でコピーされている状態です
----------

本現象にお心当たりのある方いらっしゃいましたら,ご教示頂けますと幸いです.
どうぞ宜しくお願い致します.

◆環境情報
・OS: Windows 10 Pro 64bit
・Texlive2017
・TexStudio 2.12.16


Asatsuki Yuna への返信

Re: コンパイル後PDFにおける文字情報について

- Asatsuki Yuna の投稿
補足させていただきますと,確認できている状況は2パターンで,「fi」と「fl」です.

・fiの場合
例えば,PDF上では問題なく「related research field」と表示されているものが,
テキストコピー&ペーストすると,「related research _elds」と,fiが「_」でコピーされている状態です

・flの場合
例えば,PDF上では問題なく「reflect」と表示されているものが,
テキストコピー&ペーストすると,「reect」と,flが抜けた形でコピーされているようです.
Asatsuki Yuna への返信

Re: コンパイル後PDFにおける文字情報について

- Akira Kakuto の投稿
\documentclass[12pt]{article}
\begin{document}
Are the words field and reflect copied OK?
\end{document}

について簡単に調べてみました:

xelatex: OK
latex+dvipdfmx: OK
latex+dvips+ps2pdf: OK
pdflatex: NG

pdflatex の場合には,以下で OK になりました:

\documentclass[12pt]{article}
\pdfmapline{=cmr12 CMR12 <cmr12.pfb <f7b6d320.enc}
\input glyphtounicode.tex
\begin{document}
Are the words field and reflect copied OK?
\end{document}
Asatsuki Yuna への返信

Re: コンパイル後PDFにおける文字情報について

- Asatsuki Yuna の投稿
角藤先生,奥村先生


本件ご確認頂きまして有難うございます.
最終的に,下記設定を変更することで自己解決できました.

◆本事象を確認した組み合わせ
・OS: Windows 10 Pro 64bit
・Texlive2017またはTexlive2018
・TexStudio 2.12.16

◆解決方法
1. texlive2019をインストール
2. TexStudioの設定->コマンドの,DVIビューア,PSビューアをそれぞれ以下に変更
・DVIビューア:"C:\texlive\2019\bin\win32\dviout.exe" "?am.dvi"
・PSビューア:"C:\texlive\2019\bin\win32\psv.exe" "?am.ps"
# これらが2017または2018の時に,最初に報告していた事象が生じていたようです.2019では解決しました.
Asatsuki Yuna への返信

Re: コンパイル後PDFにおける文字情報について

- ut の投稿

※ 既に解決されたようですので、これは、古いシステムを使い続けている怠け者の余計な疑問です。

(確かに、少し検索してみた限りでは、リガチャを抑制するにはどうしたらいいか、というような質問が出ていたのは、もう何年も前のことのようです)

texlive2019 に更新をすれば解決ということのようですが、texlive2019 にすれば、どのエンジン、どのフォント、どの pdf ビューアでも、リガチャのコピペがうまくいくようになったのでしょうか?

私の手元の、

  This is pdfTeX, Version 3.1415926-2.5-1.40.13 (TeX Live 2012/W32TeX) (format=pdflatex 2012.8.18)

  This is e-pTeX, Version 3.1415926-p3.3-110825-2.5 (sjis) (TeX Live 2012/W32TeX) (format=platex 2012.8.4)

  This is dvipdfmx-20120420 by the DVIPDFMx project team,
  modified for TeX Live,
  an extended version of dvipdfm-0.13.2c developed by Mark A. Wicks.

という、うんと古いシステムで、Computer Modern のママで、

  ff fi fl ffi ffl

について試してみましたら、

  ・ pdflatex --(Adobe Reader X)-->      〔何もコピペされず〕
  ・ platex + dvipdfmx --(Adobe Reader X)--> ff   ffi ffl

となりました。

なお、検索でヒットした古い質問では、Evince とか Sumatra PDF だとうまくいくという回答が見られましたが、手元の Google Chrome 経由でも、(行末の場合を除けば)うまくコピペできました。