名前: 栗山雅俊 日時: 2007-06-06 19:32:54 IPアドレス: 133.87.1.*
>>48213 すみません,こちらも細かいことですが, >>48208 > >> #フランス語の OE (U+0152), oe (U+0153) は分解されてしまいましたが > >私が勘違いしていなければ,この現象は LaTeX を用いても同様なの > >ではないでしょうか。例えば latin1.def には ae 合字はあっても oe 合字 > >がないのが,昔から私には不可解でした。 > PDF 中に記録されている符号位置は 0x0152, 0x0153 のままなので、 > PDF ビューアがこれを o+e に換えているのだと思います。これをしないと > "oe" の検索で U+0153 にマッチしなくなるので。同様に ff(U+FB00) 等の > f-合字も分解されます。 > # (latin1.def に、というより) Latin-1 (=ISO-8859-1) の文字集合の中に > # oe 合字が存在しないことに注意。 まず,latin-1でなぜoe合字が脱落しているのかということですが, 以下のサイトの説明ですと, http://czyborra.com/charsets/iso8859.html#ISO-8859-1 > The new Latin9 nicknamed Latin0 aims to update Latin1 by > replacing the less needed symbols...with forgotten French > and Finnish letters and... Latin0 つまり ISO 8859-15 は ISO 8859-1 のアップデート版という 位置づけのようですが,フランス語の合字oeが抜けている理由と してforgotten(忘れていた)と説明しています。 >>48213 > "oe"の合字は、ドイツ語のエスツェットのような感覚ではなく、 > "ff"の合字のような感覚なのでしょうか。 「本来どちらに近いか」というご質問についてはそれぞれの 言語で異なった歴史を持つので何とも言えないと思います。 むしろ,電子媒体上で合字をどうやってうまく検索出来る ようにするか(たとえばssでエスツェットを検索出来るとか) という技術的な問題というべきでしょうか。 そうすると,oe合字については現在latin-1で「たまたま抜け 落ちている」ためにPDF等では分離して表示することにしている という理解が正しいということになるでしょうか。
この書き込みへの返事: