koTeXは日本語LuaTeXへの先導役になるか?

koTeXは日本語LuaTeXへの先導役になるか?

- 鎌田 敏之 の投稿
返信数: 14
愛知教育大学の鎌田と申します。

TeXはもう20年以上使っているのですが、多国語組版の経験はなく、最近急に必要に迫られて調べているところです。

ptexliveのおかげで、最新のTeXの状況がある程度わかりました。ご尽力された皆様に感謝します。

昨年、このフォーラムで北川さんが「LuaTeXで日本語」というトピックを立てられていたのを拝見し、いまどうなっているかを探してみました。

すると、ひょんなところから、NetBSDのpackages(FreeBSDのportsに相当)に、koTeXという形で登録されているのがみつかりました。

ディレクトリ構成を整理して、tar.gzしたものを添付しておきます。ご参考になれば幸いです。

ちょっと面白いなと思ったのは、助詞の扱いを特別に実装しているところです。XeTeXのディレクトリにxetexko-josa.styとあるのがそれです。韓国語では、パッチムがある語のあとの助詞は変化するのですが、それが実装されています。(ンで終わる語のあとは、ヌンでなくウンになるとか、要するに発音が難しいところをはしょっている雰囲気なのですが)

また、ルビも実装されています。なかなか興味深いです。
鎌田 敏之 への返信

Re: koTeXは日本語LuaTeXへの先導役になるか?

- 奥村 晴彦 の投稿
鎌田先生,どうもありがとうございます。

ほかの皆様に,少し文脈をご紹介しておきますと,いまEPUBなど電子書籍の仕組みが話題になっていますが,そもそもEPUBの元となるHTML/CSSでの縦組のしかたが確立しておらず,W3CのHTML5 Japanese Interest Groupなどで話し合われています(メーリングリストのアーカイブが公開されています)。日本としては,ここでCSS・EPUBに日本語の縦組の正しい仕組みをちゃんと入れてもらわないと将来に禍根を残すという危機感があるわけです。そこでTeXはどうやっているのかということで,鎌田先生がLuaTeXなどをソースレベルで調べてくださっているところです。

で,ko.TeXですが,われわれも韓国に行っていろいろ話を聞いてきているのですが,何しろ韓国語をまだちゃんと勉強する時間がないので,よく理解できておりません。鎌田先生,どうかよろしくお願いいたします。

出勤前なのでとりあえず。
奥村 晴彦 への返信

Re: koTeXは日本語LuaTeXへの先導役になるか?

- 鎌田 敏之 の投稿
奥村先生、詳しい背景について解説していただきましてありがとうございます。

調べている動機は、まさにその通りです。

ko.TeXのサイトにも行ってきましたが、5月11日のスナップショットが置かれていること、TeX Live 2009に入っていそうなこと(tlmgrでもってこられる)ぐらいはわかりましたが、実装の詳細などは特に書かれていないようです。

幸い、ソースは韓国語ではないので:) (Plain TeXとLuaですから)そこからアプローチを引き出すことはできると思います。

実際問題、EPUBもCSS3のText Layoutモジュールも動きが速くて、また電子出版の盛り上がりで既存の出版やDTP業界の思惑なども入り込んできてきなくさくなってきていますので、急がなければならないのですが、十分手が回り切れていないところです。情報提供いただければ、そちらへ迅速にTeXの蓄積を反映させられますので、ご協力いただければ幸いです。
鎌田 敏之 への返信

Re: koTeXは日本語LuaTeXへの先導役になるか?

- 奥村 晴彦 の投稿
鎌田先生ありがとうございます。

EPUB・CSSについて数分で読めるまとめとして,アンテナハウスの村上さんの発表資料

EPUBやCSSと日本語レイアウトHTML5と電子書籍

を挙げておきます。pTeX同様の美しい日本語組版のできる仕様を日本から要求して入れていただかないと,日本語の電子書籍の将来が暗くなります。ぜひ皆様もよろしくお願いいたします。
奥村 晴彦 への返信

Re: koTeXは日本語LuaTeXへの先導役になるか?

- 本田 知亮 の投稿
EPUB。。資料ありがとうございます.
どうにも,この辺りの話でまとまったものがないので,
追いかけるのがつらいです.

私の関心は,
・いかにTeXから「簡単に」変換するか
・数式はどうするのか
なんですが・・・どうなんでしょうねえ.

ぶっちゃけ,普通の「文芸書」はどうとでもなるだろうと
楽観してまして,問題は教科書,
とくに数式や化学式の多用のものの
「職人技」ものがどうなるか動きを知りたいのです.

そもそも,「電子書籍」で
どこまで「組み版的な美しさ」が要求されるのでしょうか?
組み版はある意味「版面に制限された」世界での
バランスとかのお話も大きいので。。。
それとも,ぶっちゃけた話,
オンラインタイプセット(?)といったことが
要求されてるのでしょうか

---------
村上さんの資料をみると・・・
JAGATが絡んでますね。。。ちょっとそっちの方面から
情報がないか探ってみます.
本田 知亮 への返信

Re: koTeXは日本語LuaTeXへの先導役になるか?

- 鎌田 敏之 の投稿
数式は、MathMLと組み合わせることが想定されています。化学式はおそらく、SVGで表現されるのではないかと思います。

いずれもXMLの枠組みで、XTHMLでマークアップされるEPUBの仕様の一部にすでに織り込まれていると考えてよいと思います。

電子書籍での組版ですが、僕は印刷レベルに耐えられる「美しさ」が実現できる余地は最低限でも必要と考えています。

現在の電子書籍でも、EPUBではありませんがVoyegerの.bookなどで組まれたものは、印刷物と遜色ない「読みやすい」表示結果が得られています。PC上でのWebとは次元の違う世界です。

いまW3CのCSS3 Text Layoutモジュールで日本が要望を出して世界で認められつつあるのは、印刷レベルの組版です。もしWebブラウザにもこれが実装されていけば、Web体験も全く違ったものになる可能性があります。

また、どこまで実装が追いつくことができるかということもありますが、「オンザフライタイプセット」をしたい、という要望も一部からは出ています。異なるデバイスでも、また、利用者の設定によりたとえば文字の大きさが変更されても破綻のない表示を実現してほしいという要望です。

ここまで話が大きくなってしまうと、版面という前提が崩れてしまうので、JIS X 4051に則った組版は不可能ですから、どこまでが最低要望なのか、ということの定義が必要になるでしょう。村上さんらの提案(日本語組版の用件)などから、一部割愛せざるを得ない部分も出てくることになると思われます。

いずれにせよ、現在のWebの世界における(あるいはPC類のディスプレイ表示といってもいいかもしれませんが)日本語の文字表示は貧しすぎると考えています。

TeXは今後もPDF作成ツールとして利用されていく(LuaTeXはDVIを作成しません)でしょうし、印刷を前提とした世界では今後も重要な地位を占めていくと思われます。その一方で、多様なディスプレイで読まれるテキストは、当面、Webの技術が応用されていくようになるはずですし、いずれ何かに置き換わるとしても、Webでの蓄積がベースとなっていくでしょう。

そうしたなかで、Webの仕様にTeXでの長年の蓄積が技術移転されていくことに意義があると考えています。

いま心配しているのは、Adobeの動きです。Illustratorのイメージで自由に絵が描ければいいじゃないかという前提でテキストも扱われてしまいそうな気配があります。雑誌の自由なレイアウトではそれでもいいのかもしれませんが、Webがそうなってしまうと、文芸書の電子書籍もその程度の品質になりかねないとおそれています。もしきちんと組みたければ、ECMAScriptでごりごり書かなければならない世界になってしまうかもしれません。TeXのマクロと思えばそうかもしれませんが、それがいいのか悪いのかは別の問題ではないかと思います。
鎌田 敏之 への返信

Re: koTeXは日本語LuaTeXへの先導役になるか?

- Akira Kakuto の投稿
> LuaTeXはDVIを作成しません

これは言い過ぎです。DVI を出力することはできます(\pdfoutput=0)。
(TeX Live では DVI モードの format 名を
dviluatex, dvilualatex としています)
勿論、LuaTeX 特有の豊富な機能は PDF 出力の場合に
実現されています。

鎌田 敏之 への返信

Re: koTeXは日本語LuaTeXへの先導役になるか?

- 本田 知亮 の投稿
だいぶ亀レスですが・・・
iPadの実機のiBookに
TeXからepubに変換したものを
のっけたりして考えてみました.

なんか違う方向のことのようにも思いますが
ぐだぐだ書いてみます.

「電子書籍での組版」には
二種類あるように思うのです.
(1) 紙と同じ状態をもつ
(2) epubのようにいわば画面上でその場で組版する

この二つは明確に区別しなければいけません.

(1)はぶっちゃけ,PDFやActiBook,
今のiPadの「産経新聞」みたいなものです.
紙媒体があってそれと「同じ」ものがある,
もしくは,どの端末のどんな解像度でみても
「同じ」状態になるものです.

少なくとも「電子教科書」は
この形態であるほうが望ましいのでは?
「教科書」にどのレベルのものを想定するかという
こともかかわると思いますが,
すくなくとも高校レベルまでは
「どこでも同じ紙面」は必須だと思います.
個人的には「教科書」というよりも
複数の人間で同時に頻繁に参照する必要があり
その参照対象が重要なものが
この「同じ紙面」の要求を満たすべきものだと思います.
#ぶっちゃけ本全体を「検索」するより
#その本の「何ページの上から何行目」の方が
#探しやすいし,間違いがない

そしてこの方面については
PDFなり何なりがあるわけで印刷屋としては
まあ作りやすいものなわけです.


問題は(2)のケース.
(2)が妥当な書籍の種類とは何でしょうと考えると
・・・・
学術論文,小説,いわゆる「新書」・・・
レイアウトにこだわった雑誌/新聞類は
(1)の範疇でしょう.
ただし,そのような雑誌の中から
記事だけぬきとった「スクラップブック」的なものは
きっと(2)の範疇だと思います.

TeXにかかわるのはいわゆる「論文」ですけど
どうすればいいんでしょう.
現状のepubとそれの表示系の実装では
まともな理工系論文は表現不可です.
仮に何らかのXMLで記述できたとしても
(TeXからXMLに変換できたとしても),
表示系が駄目だたら無意味ですし・・・

事実上,(2)は「オンザフライタイプセット」と
同義だと思うのです.
けどそれって,ぶっちゃけた話
いわゆるDTPソフトから編集機能を引いたもの
とほとんど大差ない気もします.
TeXでこういうことをしようとすると
かなり抽象的なマクロを整備して
GUIの窓の大きさから版面構築パラメータを取得して
それを組版エンジンに渡してってことで
やっぱりLuaTeXみたいな「割り込み」機構が
必要なのかなとかとも思います.

。。。なんかまとまりが付かない上に
支離滅裂ですが,とりあえずこんなことを
思うわけです.
本田 知亮 への返信

Re: koTeXは日本語LuaTeXへの先導役になるか?

- 奥村 晴彦 の投稿
私も電子教科書はPDFみたいなもので十分,少なくとも最初はそこから出発すればいいと考えています。それなら教科書会社は端末とは独立に教材を開発し,端末は競争させられます。

ところが世間ではむしろ,マルチメディア教材,動くインタラクティブ教材みたいなものを想定しているみたいです。また,学習履歴を活用しようという話もあるようです。
奥村 晴彦 への返信

Re: koTeXは日本語LuaTeXへの先導役になるか?

- TONE Kozaburo の投稿

昔々,ニューメディアと言うものがあってな。それは露と消えたそうな。(^_^)

電子教科書に求められる(?)もの

  1. 書き込みが出来ること。今の子供は教科書に書き込みをしています。
  2. 付箋やメモが貼れること。これは1と同じ?
  3. 授業中に各生徒が,どのページを開いているのか教師が把握することは出来るのでしょうか。

学習履歴ってどのようにして判断するんでしょうかね? 「何月何日,ここのページまで進んだ」って情報を個人ごとに集計するのかなぁ。

鎌田 敏之 への返信

Re: koTeXは日本語LuaTeXへの先導役になるか?

- Z. R. の投稿

大本の投稿内容だけ見ると、「LuaTeX上での、日本語(或いはそれを含む多言語)が扱えるLaTeXを実装する」ことに関心があると読み取れます。この意味だと、今ある実装であるko.TeX(LuaTeXkoかな?)を調べるというのは納得できます。

一方で、「HTML+CSSベースのまともな日本語組版に関心があり、それへのフィードバックのためにTeXの実装を調べている」という話であれば、

なぜLuaTeXkoであって、「この掲示板上に実装についての知識を多少とも持つ人がいて」、かつ「日本語の組版の品質について多少とも定評のある」PTeXでないのか

というのが疑問に思うところなんですが。


LuaTeXkoでどこまでまともな日本語の文書が作れるかに興味があったので試してみました。

  • 今月(2010年7月)上旬のW32TeX(標準インストール+ConTeXt)上で実行。
  • 鎌田さん提供のアーカイブkotex-dev.tar.gzをそのままインストールした。
  • 版間の互換性のため多少の修正が必要だが、基本的にLuaTeXkoの処理には一切手を加えていない。
  • 文書クラスにはbxjsarticleの修正版(漢字のマクロ名対策をしただけで、「連携」処理等は施していない)を用いた。「文書クラスの日本語非対応」による違和感を除去するため。
  • 文章は、私のサイトの「思わず Lua で LaTeX してみた」のページの冒頭部分。
  • 和文フォントは等幅のIPAフォント。

内容と結果をアーカイブして添付しました。

Z. R. への返信

Re: koTeXは日本語LuaTeXへの先導役になるか?

- 鎌田 敏之 の投稿
Z. R. さんのサイトは、今回調べるにあたって、じっくり読ませていただいております。

そうですね、pTeXにこだわらない理由ですが、日本語の問題だけにとどめたくなかったから、という小さなこだわりなのですけれども、ご理解いただけますでしょうか。順番でいうと、韓国語でこうしている、では日本語ではどうすべきか、という段階になってpTeXをみるつもりです。

ご試用ありがとうございます。残念ながら、こちら(念のためMac OS X 10.6)ではフォントのエラーが出てしまいましたが、また調べます。

急ぐといいつつ別件にかかわっていてなかみを見ていない状態なのですけれど、差支えのない範囲で印象などお伝えいただければ幸いです。
鎌田 敏之 への返信

Re: koTeXは日本語LuaTeXへの先導役になるか?

- 鎌田 敏之 の投稿
説明が下手だったので、もう一度書き直します。

まず、LuaTeXに注目した理由は、Omega/Alphaに対して修正を加えている最新の多言語環境であること。

LuaTeXで縦組をしているもので、たまたま目についたのがko.TeXだったこと。

という流れでko.TeXをベースに日本語がどれぐらい組めるか、という関心をもちつつ、どんな実装をしているのだろうと興味をもちました。

pTeXに関して先入観があると多言語組版の理解の妨げになるかもしれないと思って、pTeXは最後に、日本語を「きっちり組む」レベルが必要になるときに調べようと思っていました。

僕の履歴を述べておくと、TeXは、KnuthのThe TeX Bookから入って、まだ新刊だったLamportのLaTeX Bookを横目で眺めつつ、NTT jTeXを使っていた時期が長いです。アスキー日本語TeX(縦組ができる前のもの)は知ってはいましたし、買ってもいましたが、まじめには使っていませんでした。

就職してから、pTeXができて、NTT jTeXの開発が終わったので、昔の感覚のままpTeXを使ってきました。スタイルファイルはNTT jTeXでは作ってはいましたが、pTeXでは既存のものを借りて手を入れるぐらいでした。

そういう経過があるので、pTeXにはうといのです。チェンジファイルがある、というのも手を出しづらいところでした。(どうせweaveするので気にするのも変ですが)

それから、XHTML+CSSのほうですが、きょうきいた話では、来月初頭に一気にCSS 2.1を片付ける方向に全力で向かっているようで、縦組を含むCSS3は、数年後になりそうだということです。EPUBについても、縦組はCSSレベルではなく、横組のスタイルをメタデータで仮に縦組する、現行のEPUBリーダの方法でつないでいき、CSS3 Text Layoutが決まってからEPUBにもっていくストーリーが想定されているそうです。

というわけで、電子書籍につながる仕事は、いまのところ急ぎではなくなりそうで、夏休みの宿題のつもりで今後じっくり取り組んでみます。

とはいえ、ひとりでやるのも寂しいので、どなたか、ご興味がおありでしたら、どんな内容でも結構ですので、わかったことをお知らせいただければと存じます。
Z. R. への返信

Re: koTeXは日本語LuaTeXへの先導役になるか?

- Z. R. の投稿

すみません。先の投稿の添付アーカイブでは、肝心の「結果」のPDFファイルが欠落していました。この投稿において添付します。

私の見た限りでは、pTeXと極めて近い仕上がりになっていると感じます。(三点リーダ〈…〉が欧文扱いになっていることが気になりますが。)どうも、luatexko自体(少なくとも日本語モード)はpTeXを相当意識して実装されている予感がします。例えば、luatexplainko-common.luaを見ると、pTeXに詳しい人なら馴染みのあるデータテーブルが並んでいることが判ります。

Z. R. への返信

Re: koTeXは日本語LuaTeXへの先導役になるか?

- 鎌田 敏之 の投稿
ありがとうございます。組版結果が拝見できました。

ほぼ、問題のない組版になっていますね。僕自身は、PDFを一見する限り奇妙に感じられるところはありませんでした。

Z. R.さんご指摘の、「pTeXを相当意識して」という部分が効いているのでしょうか。

参考にします。