Xpdfにはpdftotextが含まれており,これをMacでも使いたいため,ソースからmakeしてみた。
まず http://www.xpdfreader.com/download.html から最新のソースをいただいてきて展開(誤記がありました。@niloufarjp さんに感謝)。
tar zxvf xpdf-4.00.tar.gz cd xpdf-4.00 mkdir build cd build cmake -DCMAKE_BUILD_TYPE=Release -DSPLASH_CMYK=ON -DA4_PAPER=ON -DSYSTEM_XPDFRC="/usr/local/etc/xpdfrc" .. make make install
ついでに上記サイトから xpdf-japanese.tar.gz もいただいてきて,その中身を /usr/local/share/xpdf/japanese の中に入れる。
その中の add-to-xpdfrc の内容を /usr/local/etc/xpdfrc にアペンド。
また,このファイル中の
textEncoding UTF-8
のコメントを外しておく。
これで通常のPDFファイルが日本語も含めてテキストファイルに変換できるはず。