*[[Xpdf:http://www.foolabs.com/xpdf/]] [#m81ca082]

Xpdfにはpdftotextが含まれており,これをMacでも使いたいため,ソースからmakeしてみた。

まず http://www.xpdfreader.com/download.html から最新のソースをいただいてきて展開(誤記がありました。@niloufarjp さんに感謝)。

 tar zxvf xpdf-4.00.tar.gz
 cd xpdf-4.00
 mkdir build
 cd build
 cmake -DCMAKE_BUILD_TYPE=Release -DSPLASH_CMYK=ON -DA4_PAPER=ON ..
 cmake -DCMAKE_BUILD_TYPE=Release -DSPLASH_CMYK=ON -DA4_PAPER=ON -DSYSTEM_XPDFRC="/usr/local/etc/xpdfrc" ..
 make
 make install

ついでに上記サイトから xpdf-japanese.tar.gz もいただいてきて,その中身を /usr/local/share/xpdf/japanese の中に入れる。

その中の add-to-xpdfrc の内容を /usr/local/etc/xpdfrc にアペンド。

また,このファイル中の

 textEncoding UTF-8

のコメントを外しておく。

これで通常のPDFファイルが日本語も含めてテキストファイルに変換できるはず。