Re: Texのデータをプレーンなデータにする方法?

名前: トノ
日時: 2003-01-20 20:06:24
IPアドレス: 150.35.254.*

>>15408 》 PDF経由だとligatureが化けるかもしれません。 ためしに、 \documentclass{article}\relax \begin{document} fi fl ffi ?` \'a \ss\ \S\ \pounds\ \textbullet\ $\alpha$ \end{document} というソースを pLaTeX → dvipdfm で pdf に変換し、Acrobat 4.05c 上で テキスト選択ツールで範囲指定してエディタにコピー&ペースとしてみると fi fl ffi ? ´a s x £ 2 R のようになりました。通常の文章についてはそこそこ使い物に なるかもしれません。 ※ \pounds がちゃんと全角のポンド記号になるのはちょっと驚きです。 同じ PDF ファイルから pdftotext でテキスト変換してみましたが、 半角仮名が交じってしまいました。-enc オプションで出力の文字コードを 指定すればいいのかもしれませんが、ドキュメントを読まないと わからないみたいです。

この書き込みへの返事:

お名前
題名 
メッセージ(タグは <a href="...">...</a> だけ使えます)