upmendex 0.03

upmendex 0.03

- t tk の投稿
返信数: 4
upmendex (索引作成ソフトmendexのUnicode版) の新版 ver0.03 を出しました。
upTeXのページ で公開しています。
ご興味のある方はお試しください。

今回の目玉は、ラテン文字、キリル文字、ギリシャ文字のダイアクリティカルマークへの対応です。
実は前までの版では、フランス語、ドイツ語なども厳しかったのですが、それらが上手くいくようになりました。多言語対応としてかなり利用範囲が広がったと思います。
アルファベットのサンプルも多数追加しました。

今後、以下の対応を考えています。
  • ダイグラフ (例えば、伝統的なスペイン語のソートでの"ch")
  • dotless i (トルコ語など)
  • 漢字のソート (中国語など)

前回 ご指摘いただいた、コンパイル時にICUへのリンクが自動的にできなかった点は修正できていると思います。ご指摘ありがとうございました。


t tk への返信

Re: upmendex 0.03

- でび まる の投稿
Debian/stable(jessie)で試してみました。コンパイルはICUのリンクも含め問題ありませんでした。付属の samples での make も問題なく通りました。
手元の bibtex, makeindex のテスト用のファイル(日本語だけ)でも試してみましたが uplatex, lualatex-ja, xelatex のどれを使っても正しい索引ができてると思います。素晴しいですね!(目玉は全く知識ないので試せませんでした。)

ところで全くオフトピックですが、手元のファイルは OTF パッケージを使う
uplatex 用だったので lualatex-ja, xelatex でもテストしてみるため検索して
修正してると lualatex-ja 用の luatexja-otf は TeXLive にあるようなのですが xelatex 用の zxotf はなさそうでした。こんなパッケージがあるのも知らなかったのですが日本語ユーザとしては TeXLive に入ってると嬉しいと思います。それでは。
t tk への返信

Re: upmendex 0.03

- t tk の投稿
upmendex (索引作成ソフトmendexのUnicode版) の新版 ver0.04 を出しました。
upTeXのページ で公開しています。
ご興味のある方はお試しください。

今回の目玉は、ラテン文字のdigraph, trigraphへの対応です。
伝統的なスペイン語のソートでの"ch"の扱い、
ハンガリー語、チェコ語、スロバキア語、セルビア語(ラテン文字)などが対応出来たと思います。
かなりややこしかったので、詳しい方に調べていただけるとありがたいです。

次には中国語を検討してみようと思います。

t tk への返信

upmendex 0.05

- t tk の投稿
upmendex (索引作成ソフトmendexのUnicode版) の新版 ver0.05 を出しました。
upTeXのページ で公開しています。
ご興味のある方はお試しください。

今回の目玉は、日中韓の漢字順による見出し出力への対応です。
部首画数順, 総画数順, ピンイン順, 注音記号順に対応しています。
中国語対応できた、と一応いえると思います。これによりCJKが出揃いました。
ICUのおかげで、想定よりは楽に作れました。

"icu_locale" を以下に指定することで動作します。
"zh@collation=unihan", "ja@collation=unihan", "ko@collation=unihan" (部首画数順),
"zh@collation=stroke" (総画数順),
"zh" (ピンイン),
"zh@collation=zhuyin" (注音記号)

画数や部首、発音等はICUによるものそのままです。日本の常用漢字や教育漢字の状況と若干異なる場合があると思いますので、お気を付け下さい。

今後、
カスタマイズを可能にするような仕組み、
各スクリプト毎にソート順を指定する仕組み、
トルコ語等のdotless i,
を検討しようと思います。
テストを重ね、ドキュメントを強化してからベータ版としようと思います。

t tk への返信

upmendex 0.06

- t tk の投稿
upmendex (索引作成ソフトmendexのUnicode版) の新版 ver0.06 を出しました。
upTeXのページ で公開しています。
ご興味のある方はお試しください。

今回の更新は、
トルコ語等のdotted/dotless I/i, アルバニア語のdigraph
への対応です。

ラテン文字関連の対応は、ひとまずここまでのつもりです。
今後、
カスタマイズを可能にするような仕組み、
各スクリプト毎にソート順を指定する仕組み、
を検討しようと思います。