*[[Xpdf:http://www.foolabs.com/xpdf/]] [#m81ca082] Xpdfにはpdftotextが含まれており,これをMacでも使いたいため,ソースからmakeしてみた。 まず http://www.xpdfreader.com/download.html から最新のソースをいただいてきて展開(誤記がありました。@niloufarjp さんに感謝)。 tar zxvf xpdf-4.00.tar.gz cd xpdf-4.00 mkdir build cd build cmake -DCMAKE_BUILD_TYPE=Release -DSPLASH_CMYK=ON -DA4_PAPER=ON .. cmake -DCMAKE_BUILD_TYPE=Release -DSPLASH_CMYK=ON -DA4_PAPER=ON -DSYSTEM_XPDFRC="/usr/local/etc/xpdfrc" .. make make install ついでに上記サイトから xpdf-japanese.tar.gz もいただいてきて,その中身を /usr/local/share/xpdf/japanese の中に入れる。 その中の add-to-xpdfrc の内容を /usr/local/etc/xpdfrc にアペンド。 また,このファイル中の textEncoding UTF-8 のコメントを外しておく。 これで通常のPDFファイルが日本語も含めてテキストファイルに変換できるはず。