Re: 非ASCII文字のハイフネーションパターンファイル

名前: 栗山雅俊
日時: 2006-09-23 20:38:33
IPアドレス: 219.126.147.*

>>45023 ttkさん、安田さん、奥村先生、こんばんは。 ちょっと話が錯綜してきたので整理したいと思います。 まず、SJIS、EUC と iso8859 の相性問題についてですが、 >>44998 > > Unicode にある程度移行できたとしても、欧文8ビット(iso8859)と > > 和文の「相性の悪さ」が残るとすると、これはこれで難しい問題 > いやまさにその通りです。 実は一日考えてみたのですが、本来これは相性が悪いのでは なく、むしろ pTeX が iso8859-1 の左半分(=ASCIIコード)と 相性が「善すぎた」結果なのかも知れません。 iso8859-1(latin-1)は右半分にアクサンやウムラウトなどの 西欧言語用追加文字がありますが、これでカバーできるのは 14言語程度で、更に言語を追加する場合は iso8859-x(latin-1 以外のもの)が必要になります。この場合異なった iso8859-x 同士でコードレベルの区別が出来る指標などないわけですから、 Babel では極めて単純な方法、つまり \selectlanguage ないし それに類する命令を本文に付すことで、該当部分がどの言語で 記されているのかを判断しています。 今まで日欧混在文では ASCII コードでまかなえる言語(英語) と日本語は pTeX で面倒を見、それ以外は Babel で(pTeXと 無関係に)切り替えていました。従って日本語についてのみ \selectlanguage 等の指示が不要で、常に日本語+他の印欧語 の組み合わせが成立していました。特に 7bit 時代は ASCII コードの部分がそのまま他の言語に置き換わるだけですから、 pTeX とも矛盾がありませんでした。 そこで、もし 8bit 欧文と日本語を pTeX 本体にそれほど手を 加えず実現するとすれば、Babel に日本語オプションのような ものを加えてやり、日本語部分は必ず \selectlanguage{japanese} 等で始めるようにする(対応する.sty .ldf を作る)のが 一番簡明な方法かも知れません。 # もちろん pTeX には \selectlanguage{japanese} を # 理解してもらうための最小限の改造は必要ですが イメージとしては以下のような感じです。 ------------------------------------- \documentclass{jsarticle} \usepackage[T1]{fontenc} \usepackage[greek,german,english,japanese]{babel} % 日本語がデフォルトの言語 \begin{document} ここは和文です。和文中に英語以外の欧文を引用する場合は \foreignlanguage{german}{"uberfl"ussig} などとします。 長文引用の場合は selectlanguage 環境を使います。日本語に 戻す場合も同じ操作になります。\\ \selectlanguage{german} Wir sind gl"ucklich, da wir zufrieden sind. \\ \selectlanguage{japanese} ここから再び日本語文になります。 \end{document} ------------------------------------- 今までの日欧混在文ではこのような操作が不要だったので 面倒に感じるかも知れませんが、欧文同士ではこの方法が デフォルトであることを考えるならば、我慢すべきレベルで しょうか。 Unicode についても同様の仕方で対応できるでしょうか。 Babel ではすでに欧文で \inputenc{utf-8} が実現できて いるので、これと pTeX-utf8 の対応関係が問題となるで しょうか。 まだ未整理な部分がありますが、誤り等ご指摘いただければ 幸いです。

この書き込みへの返事:

お名前
題名 
メッセージ(タグは <a href="...">...</a> だけ使えます。適宜改行を入れてください)