名前: 角藤 日時: 2003-01-21 16:27:30 IPアドレス: 157.13.1.*
>>15439 >日本語対応の準備をした後は >$>pdftotext -enc Shift-JIS foo.pdf >で、Shift-JISコードの日本語テキストを抜き出します。 >結構使えます -enc Shift-JIS の場合、アスキー文字も 2 バイトになって しまうかもしれません。 -enc EUC-JP の場合はうまく行くと思います。 -layout オプションを指定しておくと、元の pdf の layout に近いものを出力するよう、努めるようです。
この書き込みへの返事: