名前: 安田 日時: 2006-09-22 19:28:48 IPアドレス: 218.225.247.*
>>44981 >>44959 栗山さん、ttk さん、こんばんは。 興味深く記事を読ませていただきました。 pTeX の内部仕様がよく理解できていない立場で申し上げることを あらかじめご了承ください。 ユーザの勝手なひとりごとだとお考えください。 おそらく今後多国語が混在した文書を作成する場合、入力の文字コードは Unicode、とくに UTF-8 が主流になると思われます。 (日本語は JIS X 0213:2004 文字差換え問題で引っ掻き回されそうですけど) pTeX の Unicode 対応についていえば、Unicode 文字のプロパティで 和文かそれ以外かを判断して従来の和文/欧文規則が決定できるように なればよいかなと思っています。 少なくとも8ビットハイフネーションパターンが読み込め、欧文が漢字に 化けないことが必須でしょう。 一方で、各国語のパッケージそのものが Unicode で処理できるとは 限らない現在、個別に文字コードを指定して処理できるとさらに喜ばしい ことと思います。 つまり UTF-8 で原稿を書いても、言語パッケージが期待する各国個別 コードに変換して当該パッケージに渡すなどの工夫が必要になってくる わけで、これは相当の改造が必要なのではないでしょうか。 逆にこれができないと、omega, lambda と変わらないともいえます。 過去の遺産をきちんとカバーできることが重要だと思います。 omega, lambda が多国語ユーザにどれほど利用されているのか私には 判断できません。 しかしながら私自身の試用経験からすれば、既存のハイフネーション パターンやフォント、和文のマナーがきちんとサポートされているようには 思えません。 敬遠されているというのが実情ではないかと思います。 XeTeX にしても同じです。 Unicode, Cyrillic bundle など \inputenc で入力コードを指定して 処理できる LaTeX パッケージも存在するのですけれども、 現行 pTeX では 8 ビット欧文そのものがきちんと読み込めないところが なんとかならないかなあと思っています。 >>44959 > (1)入力バッファ(和文8bit 2byte, 欧文1byte) UTF-8 の場合 2 バイトだったり 3 バイトだったりするので、2 オクテット 固定は問題があるような気がします。
この書き込みへの返事: