いろいろ

書く時間がないので項目だけ。またあったら書き足す。

  • IT戦略本部,IT新改革戦略を発表
  • 緊急連絡網をメールにする話はよくあるが,メールの使えない人にはファクスで送ったり入力内容を音声化して電話したりするシステムが日本のどこかで導入されたというニュースを数日前NHKでやっていた
  • 昨日のクローズアップ現代,医療のIT化の話,まとめておかなければ
  • Reply-to:を書き直す変なMTAがあるらしい
  • 内閣府ホームページ,Windowsでしか見えない文字が
  • 大学のためにあるシステムを無償開発しなければならなくなったのでRubyを使うことにした

RE:内閣府ホームページ

>内閣府ホームページ,Windowsでしか見えない文字が

済みません、具体的にどの文字なんでしょうか?
charsetはiso-2022-jpになってるようですが。

国家公務員�種試験志

国家公務員�種試験志望者対象「霞が関官庁探訪」の実施についての6文字目です

ちなみにこの字,Macで

ちなみにこの字,Macでは黒い菱形に白抜きの?の文字に見えます。化けマークなんでしょう。Macでもフォントやソフトに依存するかもしれません。Safari 2.0.3でヒラギノを使っています

Mac OS X 10.3.9

うちの Safari 1.3.2 on Mac OS X 10.3.9 では、その部分は文字がありません。また、FireFox では I ← の図形と同じ文字が出てきます。

FirefoxはWindows通りに見

FirefoxはWindows通りに見えますね。あと,ヒラギノとOsakaでは微妙に違うかもしれません

追加ですが,エンコー

追加ですが,エンコーディングにもからんでややこしい状況です。ここにも以前書きましたが,MacでFirefoxでヒラギノでutf-8とするといわゆる機種依存文字が化けます。FirefoxはJIS系のエンコーディングでWindows依存文字を表示しようとしてかえってバグっているようです。

NetFront v3.1 on linux Zaurusでは□です。

四角(□)が表示され、やはり公務員何種なのかは不明です。

おー,やっぱりZaurusは

おー,やっぱりZaurusはLinuxなんですね\(^o^)/

メールも,いつも総合研究棟�で会議という連絡が来て,困ります。

どこですか,と訊いて

どこですか,と訊いてあげればよいのでは?

「総合研究棟�です」

「総合研究棟�です」と返事が来るでしょう。^^;

学校からの連絡も文字化けで読めません。

子供の学校からの連絡も文字化けで読めません。
わざわざWindowsを起動させて読んでます。
Windows onlyの環境で育った人たちは
LinuxやMacユーザが困っているなんて思いもしないのでしょう。
返事は決まってWindows使えばいいじゃんですもの。

Windowsな人

Windows only の環境で育った人は,他に OS があることを知らないのでしょう。これも Windows のシェアが大きすぎる弊害でしょうか。

ローマ数字の1

問題のページをダウンロードしてWindowsXP上でMeadow3でみると「ローマ数字の1」は表示されます。
また、ActivePerl5.8.7build815+Encode2.14で以下のようなscriptで変換を試みました。
use strict;
use Encode qw(from_to);
my $str1 = my $str2 ="\e\$B-5\e(B"; #13区21点
from_to($str1,'iso-2022-jis','cp932');
print $str1,"\n"; #表示(変換)できてしまう!
from_to($str2, 'iso-2022-jp', 'UCS-2');
my ($c1,$c2) = unpack('CC',$str2);
printf "%0x%0x\n", $c1,$c2; #2160
結果は無いはずの文字が変換されてしまいます。Encodeに用意されているJIS<->unicodeの変換テーブルには13区の文字は載っていないのですが、内部的にはjisを機械的に(MSBを立てて)euc-jpに変換したのちにunicodeに変換しています。euc-jp -unicode変換テーブルにはjis-2022-jpの規格に沿ったものではなくeuc-jp-ms(Windows-31J,cp932に相当)が使われているようです。MeadowもIEもおそらく同じようなことを行っているのではないでしょうか。ここまでは、無い文字が表示される、unicodeに変換される話ですが逆に内閣府の中の人はどういうエディタ、ツールを使ってローマ数字をiso-2022-jpに突っ込んだのでしょう?それともJIS X 0208に13区の漢字は正式に追加されたんでしょうか?

何らかのCMSを使ってい

何らかのCMSを使っていて,それがcp932をiso-2022-jp-msみたいなものに変換したのでは? ちなみにソースを読むとbannerがbunnerと綴ってあります

Windows依存(機種、OS依存?)

Windows依存という言葉にちょっと違和感を覚えます。今回の内閣府のページの問題はiso-2022-jpにない文字を使っているということではないでしょうか?通信にiso-2022-jpを使うことが半ば強制されていた時代とは変わってIANAに登録されている文字コードなら自由にインターネットで使ってよい時代になっています。問題のページのcharsetがUTF-8やcp932などだったら問題はないのではありませんか?'iso-2022-jp'以外のcharsetだったら受け手側の問題になると思います。Linuxではunicodeは普及していないのでしょうか?unicodeの文字が表示できる環境があれば、ローマ数字の1は\2160として登録されていますから当然表示できるはずです。また、Macは既にローマ数字は登録されていると思います。http://www.unicode.org/Public/MAPPINGS/VENDORS/APPLE/JAPANESE.TXT

ローマ数字の1とJIS

ローマ数字1はJIS X0213:2000に登録されていますね。perlのEncodeのeuc-jp<->unicode変換テーブルはそれに基づいたものでした。「JISに登録された=iso-2022-jpに入る」はちょっと疑問ですが、この辺りにお詳しい方いらっしませんか?
http://wakaba-web.hp.infoseek.co.jp/table/jisx0213-2000-std.txt

iso-2022-jpとJIS X0213:2000

ウィキペディアに解説がありました。JIS X0213:2000を含むiso-2022-jp-3が提案されたが却下されて通信には使えないという事だそうです。内閣府の問題のページはルール違反ということですね。
http://ja.wikipedia.org/wiki/ISO-2022-JP

このページがutf-8なら

このページがutf-8なら何ら問題ないですね。Linuxでも最近のは読めるでしょうし。古いものはLinuxでもWindowsでも読めませんが。charset=cp932というのはありでしょうか。

相変わらず,この手の

相変わらず,この手の問題は
ややこしいですねえ(-_-;;;
途中からこんがらがりました

印刷屋としては
78jis,83jis,90jisだけで精一杯です

========
ところでkippさんはjperlを
公開されてるkippさんでしょうか?
jperlには大変お世話になりました.
この場を借りてお礼を申し上げます

私の周囲の一般人曰く

私の周囲の一般人曰く、「Windowsで読めるものを表示できないMacやLinuxが悪い。これがデファクトスタンダードなんだから表示できるようにすべきだ」だそうですorz もう少しまともな理解がなされていると思っていたのですが……。

もともとJISに①などが

もともとJISに①などがなかったのでMacもWindowsも独自に拡張してしまったわけで,今さらどちらかに合わせると昔の文書が化けてしまいますね。今ある最善の方法はutf-8に移行することだと思います。utf-8なら①もⅠも機種依存になりません。ただ,utf-8未対応のブラウザを使っている人がまだいるかもしれませんが,どのくらいの割合なんでしょうか

RE:このページがutf-8なら

IANAに登録されている正式名称は'Window-31J'です。Windowsで使っている文字を使いたいならcharsetにこれをセットすべきと思います。しかし登録されていない'x-sjis'がcp-932を意味して使われることが多いように'cp-932'も使われる可能性があります。

RE:相変わらず,この手の

本田さん、初めまして。
jperlは斎藤靖、渡辺博文両氏のパッチがあったからこそ公開出来ました。私は彼らの力を借りてコンパイルしてWeb上にアップしたに過ぎません。しかしながら、そのようなお言葉をかけて頂くと嬉しいものがあります。jperlをお使い頂きありがとう御座いました。

Windows依存(機種、OS依存?)の2

「パソコン通信」が華やかだった時代には、丸囲みの数字、ローマ数字をniftyとかPC-VANの掲示板に書き込もうものなら、すぐさま苦情が書き込まれたものでした。フォントはパソコンのROMにしかなく、フォントの無い文字は表示できないのは当たり前でした。その意味で苦情は正当なものでした。
今はどうでしょう?フォントはパソコンのROMにしかありませんか?いいえ、ハードディスクに置いて利用可能な数多くのフォントが売られていますし、freeのフォントもWeb上にあります。最近ではMacで使えるJIS X 0213に対応したフォントがweb上で公開されています。http://fairuse.hp.infoseek.co.jp/
それでは、それらのフォントを使って文字を画面上に表示させるためのソフトはLunuxやMacにはありませんか?
WindowsにはEmacs 22をベースにしたMeadow ver3が公開されていてこれを使うと多くの言語が使う文字をフォントさえ用意すれば表示できます。EmacsはLinuxにもMacにもあります。
先にも書きましたが、IANAに登録した文字コードは自由にインターネット上で使ってよいことになっています。これはWindowsのユーザーだけの取り決めではないと思います。
Ajaxを使ってこんな事もできるんだ!というサイトを最近発見しました。使っているパソコンに漢字のフォントがなくても、漢字の入力ができるそうです。
http://chasen.org/~taku/software/ajax/fullime/
時代は動いています。

0213

手近に環境がないのでテストできないのですが、
Microsoft Windows XP とか、Mac OS X では、
http://www.tt.tuat.ac.jp/special/j0213.txt
には何が出ているのでしょうか?

ISO-2022-JP with JIS X 0213 ?

実は、よくしらないのですが、
JISX0213を "esc $ B" と "esc ( B" ではさんでいいんでしょうか…。
上記ファイルは、とりあえずそうやって、ISO-2022-JP風にして
(JISX0208を入れるみたいに)JISX0213を埋め込んであります。

EUC風

EUC風に左8ビット目を立ててみました。
http://www.tt.tuat.ac.jp/special/j0213euc.txt
です。

どちらもSafariでは菱形

どちらもSafariでは菱形?になっちゃいます(文字コードはそれぞれiso-2022-jp,eucに設定しましたが)。

http://aozora.gr.jp/newJIS-Kan

http://aozora.gr.jp/newJIS-Kanji/newJIS3.html
わざわざ0213フォントを入れなくてもUnicodeで
呼吸深く

AjaxによるIME

> 使っているパソコンに漢字のフォントがなくても、漢字の入力ができるそうです。
ってほんとですか? 残念ながらSafariでは働かないのでよくわかりません

呼吸深く

呼吸深く

確か最近のMac版MS Office

確か最近のMac版MS OfficeにはMS明朝,MSゴシックが付属していたと思いますが、ブラウザのフォントをこれに指定するとどうなりますか?

そもそも内閣府のペー

そもそも内閣府のページはスタイルシートでMS Pゴシックを指定していますのでそれが選ばれているのだと思います(ブラウザのデフォルトフォントを切り替えても変わりません)

コメントの表示オプション

お好みの表示方法を選択し、「設定の保存」をクリックすると、表示方法を変更することができます。