0213:2004対応CMap?

0213:2004対応CMap?

- 奥村 晴彦 の投稿
返信数: 29
pTeX+dvipdfmxでJIS X 0213:2004の字を出してみたいのですが,UniJISX02132004-UTF32-HというCMapは見つけたのですが,ただのHに相当するものってないでしょうか。
奥村 晴彦 への返信

Re: 0213:2004対応CMap?

- 本田 知亮 の投稿
http://homepage3.nifty.com/ttk/comp/tex/jisx0213.html

ttkさんのJIS X 0213のパッケージの中にttkさんによる
JISX0213-2004-V
JISX0213-2004-H
があります.

それとdvipdfmxで作ってみました.なおサンプルの文字列は78JISから83JISへの変更文字の一部だった気がします(^^;;.辻,葛,迂みたいな文字は含まれてますが,テストセットがあるとうれしいです(^^;
本田 知亮 への返信

Re: 0213:2004対応CMap?

- 奥村 晴彦 の投稿
わぁ,ありがとうございます!

さっそく「辻」とか test: IPAフォントの美しさ にある「逗」「祇」をやってみました。ばっちしでした。

あと,UniJISX02132004-UTF32-H/V を改変したUniJIS-UTF16-H/Vを組み合わせて,otfパッケージで2004対応な出力ができそうです。
奥村 晴彦 への返信

Re: 0213:2004対応CMap?

- 奥村 晴彦 の投稿
遊びで作ったインチキUniJIS-UTF16-H/Vです(本物と同名につき注意!)。本物と置き換えて,さきほどのttkさんのCMapを本物のH,Vと置き換えて,試しています。本当はdvipdfmxのmapファイルを編集すべきですね。どなたかちゃんとしたものを作って配布していただければありがたいです。
奥村 晴彦 への返信

Re: 0213:2004対応CMap?

- 本田 知亮 の投稿
まじめにやるなら,
tfm/vf/dviware用map/cmapをセットにしたり
必要ならマクロも準備する必要があるんでしょうか.
本田 知亮 への返信

Re: 0213:2004対応CMap?

- Z. R. の投稿

本格的に 0213 を使うのであれば、齋藤さんの JIS X 0213 パッケージが適当ではないでしょうか。(ttk さんのページからリンクされています。ttk さんの jishojo はこのパッケージを更に 0212 に対応するように拡張したもののはずです。)

奥村 晴彦 への返信

Re: 0213:2004対応CMap?

- Z. R. の投稿

JISX0213 を扱う(特に表を作る)場合には qa:49109  で述べたような「全角幅でないグリフ」の問題に留意する必要があると思います。(漢字については大丈夫。)

等幅の IPA フォントの字幅(全角/半角)は等幅の MS フォントに合わせているように思われる。Adobe-Japan1 で想定されているグリフ幅との関係は不明。

あと、JISX0213-2004-H/V を用いて第 2 面の文字を利用するには、内部 SJIS の pTeX を用いて、ShiftJIS0213 の符号位置を用いる必要があると思われます。

Z. R. への返信

Re: 0213:2004対応CMap?

- 奥村 晴彦 の投稿
なるほど,0213を本格的に使おうとすると,ややこしそうですね。

私の遊んでいることは,0213を使おうというわけではなく,第2水準まで+otfパッケージの\UTF{...}マクロで書いた私の本の字形を簡単に2004にすることでした。

もともとは,Mac OS X 10.5に2004字形のヒラギノProNフォントが入っていたけれどこれを使っても2004字形にならないのはなぜ?あ,当然じゃん ;-) というところから出発したのでした。Vistaについてはよく知らないのですが,VistaにしてもpTeX+dvipdfmxの字形が2004になるわけではないですよね。
奥村 晴彦 への返信

Re: 0213:2004対応CMap?

- Z. R. の投稿

恐らく、OS に関係なく次のようになると思います。

  • Adobe-Japan1 の CID に対応した OTF (ヒラギノ等)を用いた場合はそのまま。
  • 一般の TTF (MS 明朝、IPA 明朝、等)を用いた場合は、そのフォントが「2004 対応」なら 2004 のグリフが出る。

理由は次の通りです。

  • dvipdfmx の日本語のフォントの指定では、普通、「AJ1 の CID フォント」を指定する。(CMap は AJ1 へのものが使われる。)
  • ところが、そのフォントが TTF の場合、CID 番号でのグリフアクセスができないため、dvipdfmx は内部で CID を Unicode に変換し、Unicode を用いてグリフにアクセスする。
  • JISx0213 のグリフを 2004 のものに変えたということは、結局 Unicode に対応するグリフを変えたということ。(JISX0213 の 2004 年改定で Unicode との対応は不変。)

実際、rml に「IPA 明朝」(2004 対応版)を指定して「葛飾区」を書くと、2004 の字形になりました。勿論、'H' で記された対応先は 2000 の字形なのですが。
(ややこしいですね。)

Z. R. への返信

Re: 0213:2004対応CMap?

- 奥村 晴彦 の投稿
あ,Vistaの2004対応フォントもTTFでしたか。それなら「Vistaにすると2004になる」はTeXでも真ですね。
奥村 晴彦 への返信

Re: 0213:2004対応CMap?

- Z. R. の投稿

「dviout(MS明朝)で見た時と、dvipdfmx→Adobe Reader (小塚明朝)で見た時で字形が違う!」てことになりますね:-(。

今の Windows の日本語文字セットには、AJ1 にない文字(U+265A BLACK CHESS KING 等)があるので、Windows の日本語フォントが AJ1 のフォントになることはないと思われます。メイリオは AJ1-5(6?)相当のグリフを全て持っていますが、やはり AJ1 のフォントではありません。

Z. R. への返信

Re: 0213:2004対応CMap?

- 奥村 晴彦 の投稿
ありがとうございます。うーん,複雑ですね。

加藤さん: メイリオ(Meiryo)とMS 明朝、MS ゴシック、Windows Vista - Fonts update をちらっと見て,CID-keyedなOpenTypeかと勘違いしたのですが,CIDではなくGIDをキーとする中身がTrueTypeなOpenTypeですか。

PDF 千夜一夜: Windows Vista と日本語文字コード問題(4) のコメントにもいろいろ書いてありますね。
奥村 晴彦 への返信

Re: 0213:2004対応CMap?

- 本田 知亮 の投稿
> それなら「Vistaにすると2004になる」はTeXでも真ですね。

これが頭が痛い問題なんです.
実際,真なんですよ.
VistaのTeXで組まれてそれで出力された原稿は
すでに存在しており,「辻」「葛」「蔽」なんかはきっちり「Vista字形」で出てます.
現状も対策を講じてますが,あまりに非効率的でVistaの普及にともない追いつかなくなります(^^;;

著者:TeX on Vista + dviout
印刷所:PS & Cmap -H 使用

このとき,
著者が出力した原稿 => 2004
出来た本 => 1983(でいいのかな)

編集者がこの辺りの事情を理解してればよいのですが,
一部の方を除いて理解できてない
もしくは「問題そのものの存在を知らない」
と解釈しておくべきです.
となると事故です(-_-;

で私が「まじめにやるなら」と抽象的に書いたのは,
「最後にCmapを取り替えて済む」
ような場合(全体を2004にする)だけではなく
「局所的に2004を要求される」ことを意図しています.
JISX0213そのものの利用までは考えてませんです.
別フォントにしてCmapを切り替えるのが一番楽かなと思うのですが。。。新しいCmapを導入させるのが厄介かなあ。。。
PDFで進行すればいいかもしれませんが,これもまた諸事情で厄介なのです(-_-;
本田 知亮 への返信

Re: 0213:2004対応CMap?

- 本田 知亮 の投稿
なんか言葉が使いが滅茶苦茶ですね>自分
2004とかJIS0213というと語弊がありますね

えーと。。。要は,
普通のエンドユーザが作った
「デフォルトのフォント設定」ソースを対象とし,
その際
「Vista」で印字された原稿と
「非Vista」で印字された原稿を合体させて,
なおかつ字形は原稿のまま再現することが要求されており,
それに効率よくかつ間違いがないようにどう対処するかというのが私の興味です(^-^;
本田 知亮 への返信

Re: 0213:2004対応CMap?

- 奥村 晴彦 の投稿
はい,よくわかります。
でも78/83/2004字形というのが一番わかりやすいですね。

MacのヒラギノはPro/ProNで83/2004を切り替える仕組みですが,CMapが違うだけで,CIDとグリフの対応は同じです(ProNのほうが文字数が多いはずなのにファイルサイズが小さいのは制御点がより最適化されたため?)。簡単に切り替えるためにはdvipdfmxのmapファイルを複数用意するのがいいでしょうか。
本田 知亮 への返信

比較のPDF(Re: 0213:2004対応CMap?)

- 本田 知亮 の投稿
とりあえず,JISの親玉通産省から拾ってきた資料で2004で字形変更になった168文字の一覧を83/2004/78で並べたPDFを作ってみました.

表の中で赤くなってるのは何が変わってるのか分からない(^^;文字と意味不明の47区64点です.

ヒラギノやリュウミンで作ったら,包摂なのか手抜きなのかデザインのこだわりなのか,同じになるものが多すぎて比較にならなかったので,Acrobat7に付属のKozMinProVI-Regular.otfを埋め込んでます.

とりあえず,Cmapの切り換えで混在可能でPDFまでできることが確認できました.
あとは・・・商用のRIPで実験できるかです(^^;
本田 知亮 への返信

Re: 比較のPDF(Re: 0213:2004対応CMap?)

- t tk の投稿
今頃になって私のデッチアゲたCMapが話題になってびっくりです。
中身は本当に正しいのか、よくよくご確認下さい。
また、JIS第4水準が95区~120区にあるのはイレギュラーでもあります。

> 表の中で赤くなってるのは何が変わってるのか分からない
一応、Adobe の資料です。

http://www.adobe.com/jp/support/winvista/pdfs/JIS2004_Comparison.pdf

役所が作った資料(どこが違うかが書いてある)も
Webから見られるどこかにあったはずですが、見つかったらまた書きます。

> 47区64点
1面47区64点 「屢」 は「しばしば」ですね。
これもJIS83の被害者で、第3水準で復活した文字です。

t tk への返信

Re: 比較のPDF(Re: 0213:2004対応CMap?)

- 奥村 晴彦 の投稿
ありがとうございます。要するに小塚明朝では牽膏棘橙靄に違いがないわけですね。牽はノがつながっているかいないかで画数まで違うので,小塚では包摂しているけれどこのPDFは2004字形を作字したということでしょうか。
奥村 晴彦 への返信

Re: 比較のPDF(Re: 0213:2004対応CMap?)

- t tk の投稿
> 牽はノがつながっているかいないかで画数まで違うので,小塚では包摂しているけれどこのPDFは2004字形を作字した

ひょっとしたら
KozMinProVI-Regularと
KozMinPr6N-Regularの違いかもしれません。
t tk への返信

Re: 比較のPDF(Re: 0213:2004対応CMap?)

- t tk の投稿
> 役所が作った資料
役所じゃなくて、財団法人 日本規格協会でした。

「JIS 文字コード改訂の方針と具体的変更箇所」(案)


「JIS 文字コードの例示字形が紛らわしいのを微修正したもの」っていうやつが曲者ですねえ。
t tk への返信

Re: 比較のPDF(Re: 0213:2004対応CMap?)

- USER = Tackaschi の投稿

JIS X 0213:2004 の例示字形の変更点がよくわかるウェブサイトを見付つけました。

ついでに JIS X 0213:2000 から JIS X 0213:2004 への改訂において例示字形が変更された文字を,変更部分が似ているものを近くにまとめて挙げてみます。

  • 逢迂迦逗遡遜辿辻這逼迄謎腿槌鎚樋鑓漣蓬遁
  • 祇祁禰榊
  • 飴餌蝕餅
  • 箸薯屠堵賭瀦儲藷
    煉 甑噌 酋猷楢噂樽鱒鄭 溢
    煎箭揃廟嘲 愈 詮
    芦扁篇騙 煽 鰯溺翰翫 摺謬 擢
    隙 屑哨鞘蛸 秤叛蔽瞥 倦捲 鞄庖巷撰
    牙穿訝鴉
    喰餐 饗 卿櫛厩 榔
    茨 杓灼豹 蔑
    僅歎灘
    鯖錆 瀞 淫
    牌稗 兎 挽娩 冤
  • 汲笈 諺薩 捗瀕 叟艘
  • 葛 晦 襖 徽 恢 鵠 篝 芒 籾 註 簾 囀 疼 蠅
  • 灸粂 誹徘 牽 楯 訊 甕 竈 蜃

  • 廻鍵腱挺筵釜斧爺梗鞭甦鮫咬狡駁杖靱叉虔
  • 蟹 膏 棘 橙 祟 靄
  • (1面47区64点,U+5C62)
USER = Tackaschi への返信

Re: 比較のPDF(Re: 0213:2004対応CMap?)

- 奥村 晴彦 の投稿
これはすばらしくわかりやすい表ですね!

これを見ると,膏棘橙靄などは小塚のように手を付ける必要がないフォントが多そうですね。
t tk への返信

Re: 比較のPDF(Re: 0213:2004対応CMap?)

- 本田 知亮 の投稿
>1面47区64点 「屢」 は「しばしば」ですね。
>これもJIS83の被害者で、第3水準で復活した文字です。

あーなるほど。。JISX0213:2000ですか・・・
なんか混乱してきました.
78/83/90/2000/2004・・修行します.
本田 知亮 への返信

Re: 比較のPDF(Re: 0213:2004対応CMap?)

- Z. R. の投稿
Z. R. への返信

Re: 比較のPDF(Re: 0213:2004対応CMap?)

- Z. R. の投稿

む、致命的な誤記がありますね。

(誤) 和文字体を代替して作業を行う
(正) 和文書体(フォント)を代替して作業を行う

Z. R. への返信

包摂基準

- 奥村 晴彦 の投稿
JISの包摂基準は緩いのですが,厳しい包摂基準としては,役所の戸籍係のものがあると思います。昔,婚姻届を出しに行って,感嘆しました。^^;

土口の吉と士口の吉では同じ人物とは認めてもらえません。辻の点の数も同様です。昔勤めていた県立高校では,卒業証書を書くとき,改めて親に戸籍名を丁寧に書いてもらって,それに合わせて墨書していました。明朝体のしんにょうと墨書のしんにょうでは全然違うものですがそれは包摂されて問題ないようで,点の数だけの問題のようです。こういったポイントさえ押さえてあれば,フォントデザインの違いはまったく問題にならないのでしょう。

今は昔ほど厳しくないのかもしれませんが,それでもVistaになって人名がたくさん変わって,別人28号が大量発生することになりました。葛飾区はVistaになって喜んだでしょう。
奥村 晴彦 への返信

Re: 包摂基準

- Amanita muscaria の投稿
名字に使用できる、電算化に伴い、 55267 文字に包接された全ての漢字の検索が、法務省 戸籍統一文字情報で、できます。
Amanita muscaria への返信

Re: 包摂基準

- 奥村 晴彦 の投稿
ありがとうございます。

でも,住基ネットがらみで,このどれでもない文字もけっこうあり,それは画像で保存しているという話を聞いたことがあります。

いま探したら,ほら貝:文字コードに「残存外字」として載っていました。
奥村 晴彦 への返信

2004字形とスタイルシート

- 奥村 晴彦 の投稿

このページをLeopard(Mac OS X 10.5)のSafariで見ると,SafariでデフォルトフォントにヒラギノProを指定しているのに2004字形になるので調べてみたら,CSSが

font-family:Arial, Verdana, Helvetica, sans-serif;

となっていました。Safariは欧文を指定すると和文はウェイトの似たヒラギノ角ゴシックになってしまうようですが,LeopardからはProNになるのではないかと思います。とりあえず上記の部分をコメントアウトしてみましたが,何か良い方法はないでしょうか。