pstoeditの日本語化事情 (Re: DXF変換の際に...)

名前: tanaka
日時: 2005-10-27 17:20:46
IPアドレス: 192.51.44.*

>>38874 pstoeditの日本語化事情について、分かっている範囲のことを書きます。 ご参考まで。 昔から日本語が通らないことで有名だったpstoeditですが、 最近は大分改善してきています。 pstoeditは、まず、フロントエンドでghostscriptを走らせ中間データ化し、 次に、バックエンドの各ドライバーで各フォーマットに変換する仕組みになっています。 オプション "-ndt" をセットすると、文字は文字のまま解釈しようとします。 最近のVer.3.40以降では、"-ndt" をセットしたとき、 日本語入力の場合でも、フロントエンドでコケるケースが少なくなり、 大部分のケースで中間データまで通るようになっています。 (但し、当然、日本語対応のghostscriptが必要。) 英字フォントでない場合には、途中でコード変換はなく、 ASCII以外のコードでも0x00でも中間データまでは通ります。 あとは、個別の出力フォーマットに合わせて、 JISなりEUC-JPなりShift-JISなりのエンコーディングを適切な処理をするように バックエンドに機能追加するだけで、動きます。 ほとんどの場合は、エンコーディングの変換だけで済むでしょう。 松山氏がご指摘のように、エンコーディングの変換が不要な場合は、 現状でもかなり動きます。 pstoeditの日本語対応化は、昔と比べると、かなり障壁が減っており、 個々のフォーマットの日本語化事情を理解している人であれば、 改造はそんなに困難ではないはずです。 必要のある方は、dxf出力に限らず、どんどんチャレンジなさったらいいと思います。 pstoeditの改造案として、 各出力ドライバーによる個別対応に依らない一般的な方法で出来ないか、 私も愚考しておりますが、まだ具体案がありません。 ただし、やや複雑なもの(例:国際化xfigのPostScript出力)を入力とした場合は、 フロントエンドですでに問題が生じます。 現在のpstoeditではまだまだ困難である上、改良も相当難しそうです。 ご参考: http://homepage3.nifty.com/ttk/comp/ngraph/pstoedit.html pdf入力については、私自身は調査したことがなく、よく分かりません。 可能性のある日本語のエンコーディングは確か仕様ではいろいろあったように思います。 ご質問の件では、(以下は、想像です。) dxfフォーマットは基本的にはテキスト形式のようですので、 もし仮に入力がEUC-JPなど比較的解釈容易なエンコーディングになっているのならば、 出力ファイルのdxfフォーマットをコード変換ソフトでShift-JISに変換することにより、 pstoeditの改造無しに対応可能、かもしれません。

この書き込みへの返事:

お名前
題名 
メッセージ(タグは <a href="...">...</a> だけ使えます)