愛知教育大学の鎌田と申します。
TeXはもう20年以上使っているのですが、多国語組版の経験はなく、最近急に必要に迫られて調べているところです。
ptexliveのおかげで、最新のTeXの状況がある程度わかりました。ご尽力された皆様に感謝します。
昨年、このフォーラムで北川さんが「LuaTeXで日本語」というトピックを立てられていたのを拝見し、いまどうなっているかを探してみました。
すると、ひょんなところから、NetBSDのpackages(FreeBSDのportsに相当)に、koTeXという形で登録されているのがみつかりました。
ディレクトリ構成を整理して、tar.gzしたものを添付しておきます。ご参考になれば幸いです。
ちょっと面白いなと思ったのは、助詞の扱いを特別に実装しているところです。XeTeXのディレクトリにxetexko-josa.styとあるのがそれです。韓国語では、パッチムがある語のあとの助詞は変化するのですが、それが実装されています。(ンで終わる語のあとは、ヌンでなくウンになるとか、要するに発音が難しいところをはしょっている雰囲気なのですが)
また、ルビも実装されています。なかなか興味深いです。
鎌田先生,どうもありがとうございます。
ほかの皆様に,少し文脈をご紹介しておきますと,いまEPUBなど電子書籍の仕組みが話題になっていますが,そもそもEPUBの元となるHTML/CSSでの縦組のしかたが確立しておらず,W3CのHTML5 Japanese Interest Groupなどで話し合われています(メーリングリストのアーカイブが公開されています)。日本としては,ここでCSS・EPUBに日本語の縦組の正しい仕組みをちゃんと入れてもらわないと将来に禍根を残すという危機感があるわけです。そこでTeXはどうやっているのかということで,鎌田先生がLuaTeXなどをソースレベルで調べてくださっているところです。
で,ko.TeXですが,われわれも韓国に行っていろいろ話を聞いてきているのですが,何しろ韓国語をまだちゃんと勉強する時間がないので,よく理解できておりません。鎌田先生,どうかよろしくお願いいたします。
出勤前なのでとりあえず。
ほかの皆様に,少し文脈をご紹介しておきますと,いまEPUBなど電子書籍の仕組みが話題になっていますが,そもそもEPUBの元となるHTML/CSSでの縦組のしかたが確立しておらず,W3CのHTML5 Japanese Interest Groupなどで話し合われています(メーリングリストのアーカイブが公開されています)。日本としては,ここでCSS・EPUBに日本語の縦組の正しい仕組みをちゃんと入れてもらわないと将来に禍根を残すという危機感があるわけです。そこでTeXはどうやっているのかということで,鎌田先生がLuaTeXなどをソースレベルで調べてくださっているところです。
で,ko.TeXですが,われわれも韓国に行っていろいろ話を聞いてきているのですが,何しろ韓国語をまだちゃんと勉強する時間がないので,よく理解できておりません。鎌田先生,どうかよろしくお願いいたします。
出勤前なのでとりあえず。
奥村先生、詳しい背景について解説していただきましてありがとうございます。
調べている動機は、まさにその通りです。
ko.TeXのサイトにも行ってきましたが、5月11日のスナップショットが置かれていること、TeX Live 2009に入っていそうなこと(tlmgrでもってこられる)ぐらいはわかりましたが、実装の詳細などは特に書かれていないようです。
幸い、ソースは韓国語ではないので:) (Plain TeXとLuaですから)そこからアプローチを引き出すことはできると思います。
実際問題、EPUBもCSS3のText Layoutモジュールも動きが速くて、また電子出版の盛り上がりで既存の出版やDTP業界の思惑なども入り込んできてきなくさくなってきていますので、急がなければならないのですが、十分手が回り切れていないところです。情報提供いただければ、そちらへ迅速にTeXの蓄積を反映させられますので、ご協力いただければ幸いです。
調べている動機は、まさにその通りです。
ko.TeXのサイトにも行ってきましたが、5月11日のスナップショットが置かれていること、TeX Live 2009に入っていそうなこと(tlmgrでもってこられる)ぐらいはわかりましたが、実装の詳細などは特に書かれていないようです。
幸い、ソースは韓国語ではないので:) (Plain TeXとLuaですから)そこからアプローチを引き出すことはできると思います。
実際問題、EPUBもCSS3のText Layoutモジュールも動きが速くて、また電子出版の盛り上がりで既存の出版やDTP業界の思惑なども入り込んできてきなくさくなってきていますので、急がなければならないのですが、十分手が回り切れていないところです。情報提供いただければ、そちらへ迅速にTeXの蓄積を反映させられますので、ご協力いただければ幸いです。
鎌田先生ありがとうございます。
EPUB・CSSについて数分で読めるまとめとして,アンテナハウスの村上さんの発表資料
EPUBやCSSと日本語レイアウトHTML5と電子書籍
を挙げておきます。pTeX同様の美しい日本語組版のできる仕様を日本から要求して入れていただかないと,日本語の電子書籍の将来が暗くなります。ぜひ皆様もよろしくお願いいたします。
EPUB・CSSについて数分で読めるまとめとして,アンテナハウスの村上さんの発表資料
EPUBやCSSと日本語レイアウトHTML5と電子書籍
を挙げておきます。pTeX同様の美しい日本語組版のできる仕様を日本から要求して入れていただかないと,日本語の電子書籍の将来が暗くなります。ぜひ皆様もよろしくお願いいたします。
EPUB。。資料ありがとうございます.
どうにも,この辺りの話でまとまったものがないので,
追いかけるのがつらいです.
私の関心は,
・いかにTeXから「簡単に」変換するか
・数式はどうするのか
なんですが・・・どうなんでしょうねえ.
ぶっちゃけ,普通の「文芸書」はどうとでもなるだろうと
楽観してまして,問題は教科書,
とくに数式や化学式の多用のものの
「職人技」ものがどうなるか動きを知りたいのです.
そもそも,「電子書籍」で
どこまで「組み版的な美しさ」が要求されるのでしょうか?
組み版はある意味「版面に制限された」世界での
バランスとかのお話も大きいので。。。
それとも,ぶっちゃけた話,
オンラインタイプセット(?)といったことが
要求されてるのでしょうか
---------
村上さんの資料をみると・・・
JAGATが絡んでますね。。。ちょっとそっちの方面から
情報がないか探ってみます.
どうにも,この辺りの話でまとまったものがないので,
追いかけるのがつらいです.
私の関心は,
・いかにTeXから「簡単に」変換するか
・数式はどうするのか
なんですが・・・どうなんでしょうねえ.
ぶっちゃけ,普通の「文芸書」はどうとでもなるだろうと
楽観してまして,問題は教科書,
とくに数式や化学式の多用のものの
「職人技」ものがどうなるか動きを知りたいのです.
そもそも,「電子書籍」で
どこまで「組み版的な美しさ」が要求されるのでしょうか?
組み版はある意味「版面に制限された」世界での
バランスとかのお話も大きいので。。。
それとも,ぶっちゃけた話,
オンラインタイプセット(?)といったことが
要求されてるのでしょうか
---------
村上さんの資料をみると・・・
JAGATが絡んでますね。。。ちょっとそっちの方面から
情報がないか探ってみます.
数式は、MathMLと組み合わせることが想定されています。化学式はおそらく、SVGで表現されるのではないかと思います。
いずれもXMLの枠組みで、XTHMLでマークアップされるEPUBの仕様の一部にすでに織り込まれていると考えてよいと思います。
電子書籍での組版ですが、僕は印刷レベルに耐えられる「美しさ」が実現できる余地は最低限でも必要と考えています。
現在の電子書籍でも、EPUBではありませんがVoyegerの.bookなどで組まれたものは、印刷物と遜色ない「読みやすい」表示結果が得られています。PC上でのWebとは次元の違う世界です。
いまW3CのCSS3 Text Layoutモジュールで日本が要望を出して世界で認められつつあるのは、印刷レベルの組版です。もしWebブラウザにもこれが実装されていけば、Web体験も全く違ったものになる可能性があります。
また、どこまで実装が追いつくことができるかということもありますが、「オンザフライタイプセット」をしたい、という要望も一部からは出ています。異なるデバイスでも、また、利用者の設定によりたとえば文字の大きさが変更されても破綻のない表示を実現してほしいという要望です。
ここまで話が大きくなってしまうと、版面という前提が崩れてしまうので、JIS X 4051に則った組版は不可能ですから、どこまでが最低要望なのか、ということの定義が必要になるでしょう。村上さんらの提案(日本語組版の用件)などから、一部割愛せざるを得ない部分も出てくることになると思われます。
いずれにせよ、現在のWebの世界における(あるいはPC類のディスプレイ表示といってもいいかもしれませんが)日本語の文字表示は貧しすぎると考えています。
TeXは今後もPDF作成ツールとして利用されていく(LuaTeXはDVIを作成しません)でしょうし、印刷を前提とした世界では今後も重要な地位を占めていくと思われます。その一方で、多様なディスプレイで読まれるテキストは、当面、Webの技術が応用されていくようになるはずですし、いずれ何かに置き換わるとしても、Webでの蓄積がベースとなっていくでしょう。
そうしたなかで、Webの仕様にTeXでの長年の蓄積が技術移転されていくことに意義があると考えています。
いま心配しているのは、Adobeの動きです。Illustratorのイメージで自由に絵が描ければいいじゃないかという前提でテキストも扱われてしまいそうな気配があります。雑誌の自由なレイアウトではそれでもいいのかもしれませんが、Webがそうなってしまうと、文芸書の電子書籍もその程度の品質になりかねないとおそれています。もしきちんと組みたければ、ECMAScriptでごりごり書かなければならない世界になってしまうかもしれません。TeXのマクロと思えばそうかもしれませんが、それがいいのか悪いのかは別の問題ではないかと思います。
いずれもXMLの枠組みで、XTHMLでマークアップされるEPUBの仕様の一部にすでに織り込まれていると考えてよいと思います。
電子書籍での組版ですが、僕は印刷レベルに耐えられる「美しさ」が実現できる余地は最低限でも必要と考えています。
現在の電子書籍でも、EPUBではありませんがVoyegerの.bookなどで組まれたものは、印刷物と遜色ない「読みやすい」表示結果が得られています。PC上でのWebとは次元の違う世界です。
いまW3CのCSS3 Text Layoutモジュールで日本が要望を出して世界で認められつつあるのは、印刷レベルの組版です。もしWebブラウザにもこれが実装されていけば、Web体験も全く違ったものになる可能性があります。
また、どこまで実装が追いつくことができるかということもありますが、「オンザフライタイプセット」をしたい、という要望も一部からは出ています。異なるデバイスでも、また、利用者の設定によりたとえば文字の大きさが変更されても破綻のない表示を実現してほしいという要望です。
ここまで話が大きくなってしまうと、版面という前提が崩れてしまうので、JIS X 4051に則った組版は不可能ですから、どこまでが最低要望なのか、ということの定義が必要になるでしょう。村上さんらの提案(日本語組版の用件)などから、一部割愛せざるを得ない部分も出てくることになると思われます。
いずれにせよ、現在のWebの世界における(あるいはPC類のディスプレイ表示といってもいいかもしれませんが)日本語の文字表示は貧しすぎると考えています。
TeXは今後もPDF作成ツールとして利用されていく(LuaTeXはDVIを作成しません)でしょうし、印刷を前提とした世界では今後も重要な地位を占めていくと思われます。その一方で、多様なディスプレイで読まれるテキストは、当面、Webの技術が応用されていくようになるはずですし、いずれ何かに置き換わるとしても、Webでの蓄積がベースとなっていくでしょう。
そうしたなかで、Webの仕様にTeXでの長年の蓄積が技術移転されていくことに意義があると考えています。
いま心配しているのは、Adobeの動きです。Illustratorのイメージで自由に絵が描ければいいじゃないかという前提でテキストも扱われてしまいそうな気配があります。雑誌の自由なレイアウトではそれでもいいのかもしれませんが、Webがそうなってしまうと、文芸書の電子書籍もその程度の品質になりかねないとおそれています。もしきちんと組みたければ、ECMAScriptでごりごり書かなければならない世界になってしまうかもしれません。TeXのマクロと思えばそうかもしれませんが、それがいいのか悪いのかは別の問題ではないかと思います。
だいぶ亀レスですが・・・
iPadの実機のiBookに
TeXからepubに変換したものを
のっけたりして考えてみました.
なんか違う方向のことのようにも思いますが
ぐだぐだ書いてみます.
「電子書籍での組版」には
二種類あるように思うのです.
(1) 紙と同じ状態をもつ
(2) epubのようにいわば画面上でその場で組版する
この二つは明確に区別しなければいけません.
(1)はぶっちゃけ,PDFやActiBook,
今のiPadの「産経新聞」みたいなものです.
紙媒体があってそれと「同じ」ものがある,
もしくは,どの端末のどんな解像度でみても
「同じ」状態になるものです.
少なくとも「電子教科書」は
この形態であるほうが望ましいのでは?
「教科書」にどのレベルのものを想定するかという
こともかかわると思いますが,
すくなくとも高校レベルまでは
「どこでも同じ紙面」は必須だと思います.
個人的には「教科書」というよりも
複数の人間で同時に頻繁に参照する必要があり
その参照対象が重要なものが
この「同じ紙面」の要求を満たすべきものだと思います.
#ぶっちゃけ本全体を「検索」するより
#その本の「何ページの上から何行目」の方が
#探しやすいし,間違いがない
そしてこの方面については
PDFなり何なりがあるわけで印刷屋としては
まあ作りやすいものなわけです.
問題は(2)のケース.
(2)が妥当な書籍の種類とは何でしょうと考えると
・・・・
学術論文,小説,いわゆる「新書」・・・
レイアウトにこだわった雑誌/新聞類は
(1)の範疇でしょう.
ただし,そのような雑誌の中から
記事だけぬきとった「スクラップブック」的なものは
きっと(2)の範疇だと思います.
TeXにかかわるのはいわゆる「論文」ですけど
どうすればいいんでしょう.
現状のepubとそれの表示系の実装では
まともな理工系論文は表現不可です.
仮に何らかのXMLで記述できたとしても
(TeXからXMLに変換できたとしても),
表示系が駄目だたら無意味ですし・・・
事実上,(2)は「オンザフライタイプセット」と
同義だと思うのです.
けどそれって,ぶっちゃけた話
いわゆるDTPソフトから編集機能を引いたもの
とほとんど大差ない気もします.
TeXでこういうことをしようとすると
かなり抽象的なマクロを整備して
GUIの窓の大きさから版面構築パラメータを取得して
それを組版エンジンに渡してってことで
やっぱりLuaTeXみたいな「割り込み」機構が
必要なのかなとかとも思います.
。。。なんかまとまりが付かない上に
支離滅裂ですが,とりあえずこんなことを
思うわけです.
iPadの実機のiBookに
TeXからepubに変換したものを
のっけたりして考えてみました.
なんか違う方向のことのようにも思いますが
ぐだぐだ書いてみます.
「電子書籍での組版」には
二種類あるように思うのです.
(1) 紙と同じ状態をもつ
(2) epubのようにいわば画面上でその場で組版する
この二つは明確に区別しなければいけません.
(1)はぶっちゃけ,PDFやActiBook,
今のiPadの「産経新聞」みたいなものです.
紙媒体があってそれと「同じ」ものがある,
もしくは,どの端末のどんな解像度でみても
「同じ」状態になるものです.
少なくとも「電子教科書」は
この形態であるほうが望ましいのでは?
「教科書」にどのレベルのものを想定するかという
こともかかわると思いますが,
すくなくとも高校レベルまでは
「どこでも同じ紙面」は必須だと思います.
個人的には「教科書」というよりも
複数の人間で同時に頻繁に参照する必要があり
その参照対象が重要なものが
この「同じ紙面」の要求を満たすべきものだと思います.
#ぶっちゃけ本全体を「検索」するより
#その本の「何ページの上から何行目」の方が
#探しやすいし,間違いがない
そしてこの方面については
PDFなり何なりがあるわけで印刷屋としては
まあ作りやすいものなわけです.
問題は(2)のケース.
(2)が妥当な書籍の種類とは何でしょうと考えると
・・・・
学術論文,小説,いわゆる「新書」・・・
レイアウトにこだわった雑誌/新聞類は
(1)の範疇でしょう.
ただし,そのような雑誌の中から
記事だけぬきとった「スクラップブック」的なものは
きっと(2)の範疇だと思います.
TeXにかかわるのはいわゆる「論文」ですけど
どうすればいいんでしょう.
現状のepubとそれの表示系の実装では
まともな理工系論文は表現不可です.
仮に何らかのXMLで記述できたとしても
(TeXからXMLに変換できたとしても),
表示系が駄目だたら無意味ですし・・・
事実上,(2)は「オンザフライタイプセット」と
同義だと思うのです.
けどそれって,ぶっちゃけた話
いわゆるDTPソフトから編集機能を引いたもの
とほとんど大差ない気もします.
TeXでこういうことをしようとすると
かなり抽象的なマクロを整備して
GUIの窓の大きさから版面構築パラメータを取得して
それを組版エンジンに渡してってことで
やっぱりLuaTeXみたいな「割り込み」機構が
必要なのかなとかとも思います.
。。。なんかまとまりが付かない上に
支離滅裂ですが,とりあえずこんなことを
思うわけです.
大本の投稿内容だけ見ると、「LuaTeX上での、日本語(或いはそれを含む多言語)が扱えるLaTeXを実装する」ことに関心があると読み取れます。この意味だと、今ある実装であるko.TeX(LuaTeXkoかな?)を調べるというのは納得できます。
一方で、「HTML+CSSベースのまともな日本語組版に関心があり、それへのフィードバックのためにTeXの実装を調べている」という話であれば、
なぜLuaTeXkoであって、「この掲示板上に実装についての知識を多少とも持つ人がいて」、かつ「日本語の組版の品質について多少とも定評のある」PTeXでないのか
というのが疑問に思うところなんですが。
LuaTeXkoでどこまでまともな日本語の文書が作れるかに興味があったので試してみました。
- 今月(2010年7月)上旬のW32TeX(標準インストール+ConTeXt)上で実行。
- 鎌田さん提供のアーカイブkotex-dev.tar.gzをそのままインストールした。
- 版間の互換性のため多少の修正が必要だが、基本的にLuaTeXkoの処理には一切手を加えていない。
- 文書クラスにはbxjsarticleの修正版(漢字のマクロ名対策をしただけで、「連携」処理等は施していない)を用いた。「文書クラスの日本語非対応」による違和感を除去するため。
- 文章は、私のサイトの「思わず Lua で LaTeX してみた」のページの冒頭部分。
- 和文フォントは等幅のIPAフォント。
内容と結果をアーカイブして添付しました。
Z. R. さんのサイトは、今回調べるにあたって、じっくり読ませていただいております。
そうですね、pTeXにこだわらない理由ですが、日本語の問題だけにとどめたくなかったから、という小さなこだわりなのですけれども、ご理解いただけますでしょうか。順番でいうと、韓国語でこうしている、では日本語ではどうすべきか、という段階になってpTeXをみるつもりです。
ご試用ありがとうございます。残念ながら、こちら(念のためMac OS X 10.6)ではフォントのエラーが出てしまいましたが、また調べます。
急ぐといいつつ別件にかかわっていてなかみを見ていない状態なのですけれど、差支えのない範囲で印象などお伝えいただければ幸いです。
そうですね、pTeXにこだわらない理由ですが、日本語の問題だけにとどめたくなかったから、という小さなこだわりなのですけれども、ご理解いただけますでしょうか。順番でいうと、韓国語でこうしている、では日本語ではどうすべきか、という段階になってpTeXをみるつもりです。
ご試用ありがとうございます。残念ながら、こちら(念のためMac OS X 10.6)ではフォントのエラーが出てしまいましたが、また調べます。
急ぐといいつつ別件にかかわっていてなかみを見ていない状態なのですけれど、差支えのない範囲で印象などお伝えいただければ幸いです。
説明が下手だったので、もう一度書き直します。
まず、LuaTeXに注目した理由は、Omega/Alphaに対して修正を加えている最新の多言語環境であること。
LuaTeXで縦組をしているもので、たまたま目についたのがko.TeXだったこと。
という流れでko.TeXをベースに日本語がどれぐらい組めるか、という関心をもちつつ、どんな実装をしているのだろうと興味をもちました。
pTeXに関して先入観があると多言語組版の理解の妨げになるかもしれないと思って、pTeXは最後に、日本語を「きっちり組む」レベルが必要になるときに調べようと思っていました。
僕の履歴を述べておくと、TeXは、KnuthのThe TeX Bookから入って、まだ新刊だったLamportのLaTeX Bookを横目で眺めつつ、NTT jTeXを使っていた時期が長いです。アスキー日本語TeX(縦組ができる前のもの)は知ってはいましたし、買ってもいましたが、まじめには使っていませんでした。
就職してから、pTeXができて、NTT jTeXの開発が終わったので、昔の感覚のままpTeXを使ってきました。スタイルファイルはNTT jTeXでは作ってはいましたが、pTeXでは既存のものを借りて手を入れるぐらいでした。
そういう経過があるので、pTeXにはうといのです。チェンジファイルがある、というのも手を出しづらいところでした。(どうせweaveするので気にするのも変ですが)
それから、XHTML+CSSのほうですが、きょうきいた話では、来月初頭に一気にCSS 2.1を片付ける方向に全力で向かっているようで、縦組を含むCSS3は、数年後になりそうだということです。EPUBについても、縦組はCSSレベルではなく、横組のスタイルをメタデータで仮に縦組する、現行のEPUBリーダの方法でつないでいき、CSS3 Text Layoutが決まってからEPUBにもっていくストーリーが想定されているそうです。
というわけで、電子書籍につながる仕事は、いまのところ急ぎではなくなりそうで、夏休みの宿題のつもりで今後じっくり取り組んでみます。
とはいえ、ひとりでやるのも寂しいので、どなたか、ご興味がおありでしたら、どんな内容でも結構ですので、わかったことをお知らせいただければと存じます。
まず、LuaTeXに注目した理由は、Omega/Alphaに対して修正を加えている最新の多言語環境であること。
LuaTeXで縦組をしているもので、たまたま目についたのがko.TeXだったこと。
という流れでko.TeXをベースに日本語がどれぐらい組めるか、という関心をもちつつ、どんな実装をしているのだろうと興味をもちました。
pTeXに関して先入観があると多言語組版の理解の妨げになるかもしれないと思って、pTeXは最後に、日本語を「きっちり組む」レベルが必要になるときに調べようと思っていました。
僕の履歴を述べておくと、TeXは、KnuthのThe TeX Bookから入って、まだ新刊だったLamportのLaTeX Bookを横目で眺めつつ、NTT jTeXを使っていた時期が長いです。アスキー日本語TeX(縦組ができる前のもの)は知ってはいましたし、買ってもいましたが、まじめには使っていませんでした。
就職してから、pTeXができて、NTT jTeXの開発が終わったので、昔の感覚のままpTeXを使ってきました。スタイルファイルはNTT jTeXでは作ってはいましたが、pTeXでは既存のものを借りて手を入れるぐらいでした。
そういう経過があるので、pTeXにはうといのです。チェンジファイルがある、というのも手を出しづらいところでした。(どうせweaveするので気にするのも変ですが)
それから、XHTML+CSSのほうですが、きょうきいた話では、来月初頭に一気にCSS 2.1を片付ける方向に全力で向かっているようで、縦組を含むCSS3は、数年後になりそうだということです。EPUBについても、縦組はCSSレベルではなく、横組のスタイルをメタデータで仮に縦組する、現行のEPUBリーダの方法でつないでいき、CSS3 Text Layoutが決まってからEPUBにもっていくストーリーが想定されているそうです。
というわけで、電子書籍につながる仕事は、いまのところ急ぎではなくなりそうで、夏休みの宿題のつもりで今後じっくり取り組んでみます。
とはいえ、ひとりでやるのも寂しいので、どなたか、ご興味がおありでしたら、どんな内容でも結構ですので、わかったことをお知らせいただければと存じます。
すみません。先の投稿の添付アーカイブでは、肝心の「結果」のPDFファイルが欠落していました。この投稿において添付します。
私の見た限りでは、pTeXと極めて近い仕上がりになっていると感じます。(三点リーダ〈…〉が欧文扱いになっていることが気になりますが。)どうも、luatexko自体(少なくとも日本語モード)はpTeXを相当意識して実装されている予感がします。例えば、luatexplainko-common.luaを見ると、pTeXに詳しい人なら馴染みのあるデータテーブルが並んでいることが判ります。