名前: 霜月幾日 日時: 2003-01-21 13:26:05 IPアドレス: 133.24.26.*
>>15412 >同じ PDF ファイルから pdftotext でテキスト変換してみましたが、 >半角仮名が交じってしまいました。-enc オプションで出力の文字コードを これについては、角藤版のpdftex-w32.tar.gz に含まれる pdftexw32.txt に対応方法が記述してあったと思います。 日本語対応の準備をした後は $>pdftotext -enc Shift-JIS foo.pdf で、Shift-JISコードの日本語テキストを抜き出します。 結構使えます。
この書き込みへの返事: