Re: Texのデータをプレーンなデータにする方法?

名前: 霜月幾日
日時: 2003-01-21 13:26:05
IPアドレス: 133.24.26.*

>>15412 >同じ PDF ファイルから pdftotext でテキスト変換してみましたが、 >半角仮名が交じってしまいました。-enc オプションで出力の文字コードを これについては、角藤版のpdftex-w32.tar.gz に含まれる pdftexw32.txt に対応方法が記述してあったと思います。 日本語対応の準備をした後は $>pdftotext -enc Shift-JIS foo.pdf で、Shift-JISコードの日本語テキストを抜き出します。 結構使えます。

この書き込みへの返事:

お名前
題名 
メッセージ(タグは <a href="...">...</a> だけ使えます)