UTF-8のBOM付きと不付きの2つのソースファイルを作成し
eplatex -kanji=utf8 file[.tex]
としてコンパイルすると両方ともOKでした.
因みにUnicode(BE) と (LE) についても実験しました.
こちらはコンパイル中断となりました.
Unicode と UCS については奥深いもおがあるようで混乱します.
さて,UTF-8 を使うとすれば BOM 付きにするか,あるいは不付き
とするか迷います.皆様方のご意見を伺いたいと思います.
TeX での UTF-8/UTF-16 の入力の扱いをまとめると次のようになります:
-kanji
)が utf8: UTF-8(BOM無)も UTF-8(BOM有)も OK。-kanji
)が utf8 以外: この場合でも UTF-8(BOM有)は UTF-8 として読み込まれる。「UTF-8 の BOM のバイト列」がないものは「指定の入力漢字コード」とみなされる。\XeTeXinputencoding
が空(既定値)): UTF-8(BOM有/無)、UTF-16(BE/LE;BOM有/無)の全てを(自動判別して)受け付ける。※ Windows の文字コードの用語では「Unicode」は「UTF-16」のことです。当然ながら、「UTF-8 用の設定」では「Unicode」(= UTF-16)のファイルは扱えません。
余談ですが:
1 で UTF-8(BOM有)が OK なのは現在の欧文 TeX が入力ファイルの先頭の「UTF-8 の BOM のバイト列」を常に無視するからのようです(W32TeX と TeX Live 2010 で確認)。少し昔の欧文 TeX はそうではなかったと記憶しています。いつ変わったのでしょうかね…。