xpdf ユーティリティについて
W32TeX における,xpdf ユーティリティのインストール法を述べておきます。
TeX のインストールディレクトリ(例えば c:/w32tex)を$INSTALLDIR として
説明します。以下の[1], [2], [3] でインストールは終了します。
[1] バイナリ自身は,pdftex-w32.tar.xz (64ビットのものは pdftex-w64.tar.xz)
を展開すればインストールされます。
[2] $INSTALLDIR/share/texmf-dist/doc/pdftex/base/
にあるリソースを含んだファイル xpdfutil-supp.zip を,自分で決めた
ディレクトリで展開します。ここでは,そのディレクトリを
c:/res として説明します。
copy $INSTALLDIR\share\texmf-dist\doc\pdftex\base\pdftotext-supp.zip c:\res
cd /d c:\res
unzip -o xpdfutil-supp.zip
del xpdfutil-supp.zip
[3] TeX のバイナリディレクトリ $INSTALLDIR/bin (64bit のものは
$INSTALLDIR/bin64) にテキストファイル xpdfrc が入っているはずですから、
これを編集します。[2]で xpdfutil-supp.zip を展開したディレクトリが実際に
c:/res である場合には、編集しなくて良いようにしています。たとえば展開
ディレクトリが c:/xpdf/resource である場合には、 xpdfrc で c:/res
とある部分を c:/xpdf/resource に変更する必要があります。
xpdf 3.04 付属のユーティリティは以下のものです。
(a) pdfdetach.exe
PDF にアタッチされた部分をファイルとして抜き出すプログラムです。
texdoc pdfdetach
とすると,マニュアルを表示します。
(b) pdffonts.exe
PDF に使用されているフォント情報を知らせてくれるものです。
texdoc pdffonts
とすると,マニュアルを表示します。
(c) pdfimages.exe
PDF に埋め込まれた images を PPM or PBM or JPEG files として
セーブするものです。
texdoc pdfimages
とすると,マニュアルを表示します。
(d) pdfinfo.exe
PDF に関する各種情報を表示します。
texdoc pdfinfo
とすると,マニュアルを表示します。
(e) pdftohtml.exe
PDF を HTML に変換するものです。
texdoc pdftohtml
とすると,マニュアルを表示します。
(f) pdftopng.exe
PDF の各ページを PNG に変換するプログラムです。
texdoc pdftopng
とすると,マニュアルを表示します。
(g) pdftoppm.exe
PDF を PPM に変換するプログラムです。
texdoc pdftoppm
とすると,マニュアルを表示します。
(h) pdftops.exe
PDF を PS (PostScript) に変換するプログラムです。
texdoc pdftops
とすると,マニュアルを表示します。
(i) pdftotext.exe
PDF を単純なテキストファイルに変換するプログラムです。
texdoc pdftotext
とすると,マニュアルを表示します。
日本語の場合,
pdftotext -enc Shift-JIS foo.pdf foo.txt
とすると,Shift-JIS のテキストになりますが,ASCII 文字まで
2バイト文字になるようです。
pdftotext -enc EUC-JP foo.pdf foo.txt
の場合はうまく行くようです。従って,ひとまず EUC-JP で
出力してから,必要ならそれを Shift-JIS に変換したほうが
よいでしょう。