latex2htmlにおけるfigure環境内tabularの文字化け

latex2htmlにおけるfigure環境内tabularの文字化け

- 岡部 洋一 の投稿
返信数: 11
figure環境内に入れた表(tabular)をlatex2htmlに通すと、その部分だけ日本語の文字化けが起きます(MacTeX環境)。
具体的には
\begin{figure}
 \begin{tabular}{cc}
  日本語の入った表
 \end{tabular}
\end{figure}

2011年3月ごろまで使っていたlatex2htmlではeucで作成した文書では正しく表示されたのですが、久々にlatex2html-2002-2-1+l2h-2002-2-1+jp2.0-3.patch(UTF8)を入れたところ、UTF8ソースで、表部分のみ文字化けしてしまいました(EUCソースに対しEUC用に作成したl2hでも同様)。images.logを見ると

(/usr/local/texlive/2014/texmf-dist/tex/latex/base/utf8.def
File: utf8.def 2008/04/05 v1.1m UTF-8 support for inputenc
Now handling font encoding OML ...
... no UTF-8 mapping file for font encoding OML
Now handling font encoding T1 ...
... processing UTF-8 mapping file for font encoding T1

(/usr/local/texlive/2014/texmf-dist/tex/latex/base/t1enc.dfu
File: t1enc.dfu 2008/04/05 v1.1m UTF-8 support for inputenc
   defining Unicode char U+00A1 (decimal 161)
   defining Unicode char U+00A3 (decimal 163)
   …
   以下同様にOMXに対しては no UTF-8 mappingが続いてdefiningのメッセージ
   …

となっているので、OMLやOMXフォントが無いと言われているようなのですが、標準のMacTeXではインストールされないようです。
 どなたか、教えていただけるとありがたいのですが…
岡部 洋一 への返信

Re: latex2htmlにおけるfigure環境内tabularの文字化け

- 奥村 晴彦 の投稿
岡部先生,お世話になっております。

残念ながら私はlatex2htmlをまったく使わなくなってしまいましたので,どなたかおわかりになるかた,よろしくお願いします。

ちなみにWeb上ではMathJaxがすばらしすぎる(LaTeXシンタックスの数式をそのままHTML表示できる)ので,私はもうMathJaxに頼りきりです。でもMathJaxでは \begin{figure} などは処理しないので,LaTeXのソースそのままであればlatex2html(またはその後継)に頼らざるを得ないのだろうと思います(いまいちよくわかっていませんのでどなたか補足お願いします)。
奥村 晴彦 への返信

Re: latex2htmlにおけるfigure環境内tabularの文字化け

- 岡部 洋一 の投稿
奥村先生
 ご推薦のLyXを使って見ましたが、表がWebのtable形式に変わってしまうことに加え、空欄の項が無視されてしまうバグがあり、利用できませんでした。plastexも同じになります。TeXで美しく作られた大量の表を綺麗に見せるソフトとして長らくlatex2htmlを使っていたのですが、FBSDである時点からうまくコンパイルできない時代があり、それからは断念しておりました。久々に使ったら、記載のようなトラブルが発生した次第です。
 ということで、お分りなるどなたかヘルプをお願いします。
岡部 洋一 への返信

Re: latex2htmlにおけるfigure環境内tabularの文字化け

- 若松 久仁光 の投稿
 岡部先生
初めて書かせて頂きますが、数少ないMacOSXでの投稿を拝見し、何か
お手伝い出来るのかとも思い記入しています。

如何せん情報が少ない為、小生のMacOSX環境で再現を試みる事すら
出来かねる状況です。

latex2htmlは、残念ながOSX10.6.8で使用していましたが、現在の環境の
OSX10.7では諸処の事情で「plastex」へ移行しています。

先ず、OSX10.Xの環境と言う明示も有ったらベターですが、
元ファイルが添付されていないので、何処様な表なのか?すら判断できません。
幸い「plastex」で実行しても同様と書かれているので、
OSX10.7 TexLive2014 でplastexを走らせて同様の問題が発生するのか?
確認する事は吝かでは御座いませんが?

OSX10.6.8 TeXLive2014を使用して「latex2html」も同様に試す事は可能?かも
知れませんが、動作が安定してくれるか定かでは御座いません。

Mac OSX10の場合、同じ環境を作成している積りでも、全く同一の動作をすると言う、保証は無さそうです。

別件に成りますが、
同一バージョンのMacVimKaoriyaから
VimLaTeXをOSX10.7 TeXLive2015 TeXLive2014で走らせても
コンパイルしますが、OSX10.6.8 では同一のTeXLive2014 TeXLive2015を
使用しても、コンパイル出きず、エラーの文字列が多数表示されるだけ
と言った有様です。

従いまして、投稿中の「LyX」も同様に考えるべきで、
バージョンが何れなのか?
もご記入の上、状態を御説明されたほうが、検定や追跡がより確実に、
しやすく成るのでは無いかとも、思われますが?如何でしょうか?

部外者には、LyXを使用して「何処ようなコンパイル」を実行したのか?
此処の投稿の文章では判らないと思うのですが?

色々書いた為、失礼な言い廻しが有るかも知れませんが、
其処はご容赦を、お願います。

どの様なお手伝いが出来ますか? 若松久仁光拝
岡部 洋一 への返信

Re: latex2htmlにおけるfigure環境内tabularの文字化け

- h s の投稿
l2h-2002-2-1+jp2.0-3.patch で Google 検索をかけてみましたが出てきません。

日本語化パッチのページ


によると、そもそも jp2.0 では UTF-8 は対応していないのではないように思えます。
"jp2.0-3" というのは UTF-8 対応を加えた「非公式」なものでしょうか。
h s への返信

Re: latex2htmlにおけるfigure環境内tabularの文字化け

- 若松 久仁光 の投稿
h.s様
回答には成っていませんが、以前同様な問題を抱えた時、
開発者からの返事を貰いました。その過程を纏めたものを小生の
サイトに書いたので、宜しかったら、参考にしてみて下さい。

サイト名は「音楽家の為のLaTeX〜 con gusto」です。

パッチについての件は、門外漢なので判りかねます。
以上 ご連絡迄           若松久仁光拝
岡部 洋一 への返信

Re: latex2htmlにおけるfigure環境内tabularの文字化け

- 和田 勇 の投稿
和田です。

latex2html のバージョン?(年式)が違うから NG かもしれませんが、
検証のために必要っだったものを列挙します。

OS ........ 10.10.3
texlive ... 2015

latex2html 本体
 latex2html-2012
 (CTAN  のミラーサイトの一つの rsync://ftp.riken.go.jp/ctan/  support/latex2html/latex2html-2012.tgz から入手)
 
日本語化パッチ
 l2h-2K8-jp20110708.tar.gz
 LaTeX2HTML 日本語化パッチ開発版のページ
 http://takeno.iee.niit.ac.jp/~shige/TeX/latex2html/current/l2h-current.html

 このパッチ自体は 2008 がベースですが、2012 にも適用できます。
 一部 2012 で取り込み済み箇所がありその部分のみリジェクトさ
 れるものがありますが、2012 でも使えます。

 なおパッチには JP1 JP2 ありますが JP2 で試しました。

netpbm .... homebrew でインストール

 実行中に rgb.txt がないと言われたら 初期化ファイルに RGBDEF の
 設定をするか、環境変数 RGBDEF を設定してください。

 現在の私の環境だと

 export RGBDEF=/usr/local/Cellar/netpbm/10.68/misc/rgb.txt

ghostscript ... homebrew でも良いですが、安直にフォント関連設定済みの
 http://www.muskmelon.jp/?page_id=75 からオススメのものをダウ
 ンロードして /Applicationへ

 これを使う場合は Ryumin 云々がないとかつぶやかれなくなると思い
 ます。
 このダウンロードページのなかにある「補足」に環境変数 PATH の
 ことが記載されています。参考にして設定してください。

latex2html のコンフグレーション
 ./configure  --with-kanji=outfit

環境設定
 netpbm ghostscript を PATH に組み込む

ワンポイントアドバイス

 latex2html は通常あまりエラー情報を表示してくれませんが
 環境変数 DEBUG を以下のようにして実行するといろいろつ
 ぶやいてくれます。
 解決しない場合は、この情報をお知らせください。

 DEBUG=1 latex2html hoge.tex




和田 勇 への返信

Re: latex2htmlにおけるfigure環境内tabularの文字化け

- 和田 勇 の投稿
検証が足りなかった。 :-(

どうやら table で記述した内容で *一番長い行* の行末が日本語の場合、その文字の左際のみちょっと表示されてしまい欠けてしまいますね。

日本語パッチによるものだとおもいますが、これはちょっと解析に時間がかかりそうだ。



和田 勇 への返信

Re: latex2htmlにおけるfigure環境内tabularの文字化け

- 和田 勇 の投稿
調べると dvips でイメージを作る際の bounding box にたどり着きました。

latex2html は表部分を切り出して latex + dvips でイメージを一旦作ります。
そのイメージのバウンディングボックスを元に有効領域をクリッピングしています。幅は、一番長い行を元に生成されていると思われます。その一番長い行の行末が日本語だと、有効領域の幅が若干狭いようです。

latex2html はその子プログラム pstoimg で上記の切り出し領域を決定していますが、他の機能でも領域計算において類似の補正処理が行われていたので、試行錯誤した結果、切り取り幅を暫定地ですが 12 増分すると欠けることなく表示できるようになりました。

パッチ内容は添付ファイルを参照してください。

完全な解決ではないのですが暫定処置として利用していただけたら幸いです。


和田 勇 への返信

Re: latex2htmlにおけるfigure環境内tabularの文字化け

- 若松 久仁光 の投稿
岡部様

どの様なお手伝いが出来ますか?と書いた後、小生の環境OSX10.7.5での
「plastex」動作を改めて確認しましたら、(以前の状態とは異なり)
正常に動きませんでした。

platexはpython2.5+と言う環境での保証でしたが、小生の
Pythonのバージョンも現在は2.7.10→3.4.3に変更していたり、
様々な環境の変化の為、検証のお手伝いが、出来そうにない事、
お詫びを申し上げます。

また、OSX10.6.8での「latex2html」も動作しませんでした。
再度インストール仕直したのですが、矢張り機能してくれませんでした。

OSX10.7.5 OSX10.6.8双方共以前使用していた「port」から
「HomeBrew」に全面的に変更した事、又頻繁に「brew upgrade」を
実行している事も、其の要因の一つに成っているかも知れません。

早まった提案をしてしまった事、
改めてお詫びを申し上げます。若松久仁光拝
岡部 洋一 への返信

Re: latex2htmlにおけるfigure環境内tabularの文字化け

- 岡部 洋一 の投稿
皆様

皆様の投稿からヒントをいただき、ようやく解決できました。figure環境の図も正しく日本語が出るようになりました。

結論は ghostscript のバージョンが低かったもので、再調査したところ、奥村先生のMacTeX導入のところに書いてありました。今までこれが悪さをするような作業をしていなかったの気づきませんでした。Ghostscript-9.16.pkg でインストールし、latex2html-2002-2-1 に l2h-2002-2-1+jp2.0-3.patch を当てたもので再インストールし、解決しました。dvips はよく見るとdvips(k)となっており、悪さはしていないようです。

若松様: 当初よりlatex2html インストールには若松様の書かれたページを大いに参考にさせていただいておりました。ありがとうございます。

hs様: ご紹介の数式文字化けの記事が大変参考になりました。この記事も目を通していたのですが、改めてご指摘いただき、再度、調査して解決に至りました。ありがとうございました。

和田様: latex2html-2012 はいずれテストさせていただこうかと思っています。ありがとうございました。なお、bounding box は日頃からpdfファイル読み込みを多くしているので、それなりに理解しております。

以上、改めて皆様ありがとうございました。