地域がん登録と個人情報保護

辰己さんが過剰な個人情報保護と題してがん対策に個人情報の壁、病院がデータ提供拒否(読売新聞)記事について述べておられたので,逆の立場から書いてみよう。

がん患者の住所・氏名・生年月日・性別等の報告を病院に求めている自治体は35道府県市あるという(少し古い資料地域がん登録の必要性と個人情報保護の現状に34道府県市の名前や報告の様式が挙げられている)。読売新聞によれば,そのうち病院などからデータ提供を拒否された経験がある自治体は10県。残り25自治体の病院はすべて提出しているということか。

昨今はいろいろなデータがネットに流出するので,本人にも告知していないかもしれない情報を自治体に報告するのは怖い気がする。そもそも統計的調査なら本人の基本4情報は必要か。次の報告と突き合わせる必要があるならハッシュ値でもいいのではないか。

確かに地域で同一ハッシュ関数を使えば十分

これが、同じ地域の複数の病院から、「奥村晴彦」さんと、「奥村 晴彦」さんと、「奥村 晴彦」さんと、「Okumura Haruhiko」さんと、「Haruhiko Okumura」さんと、「おくむらはるひこ」さんと、「おくむら はるひこ」さんと「おくむら はるひこ」さんのハッシュが届いた場合、同一人物であったことがわからなくなりませんか?

苗字と名前を別登録フィールドに分けても「辰己」「丈夫」さんと「辰巳」「丈夫」さんと「辰已」「丈夫」さんのような例があって、困ります。

地域がん登録の入力作業では、こういうのは人間が見つけて重複を取り除いているそうです。

健康保険証の番号とか、住基コードとか使うと特定できそうですが、これまた「目的外利用」になりそうですよね。

正規化は技術的には可

正規化は技術的には可能なように思います。氏名は姓と名に分けて,かな入力(場合によっては拗促音・濁音等も正規化)。性別と生年月日の正規化は簡単。住所(を含めるかどうかは別として)は木構造をたどる入力にすれば正規化できます。うまく考えないと辞書攻撃できてしまいますが,秘密のsaltを使うよりましなcryptographic protocolがあるでしょうか

加筆しようと思って忘れていた

先ほど、加筆しようと思って忘れていたのですが、同姓同名のケースもあります。この場合は生年月日や住所がことなることで、同姓同名の複数人物を分けています。僕が関わっている自治体の個人情報審議会(公開)でも、先日、「同姓同名の人を区別するために、窓口担当者が本人に何を聞いていいのか/いけないのか」ということが話題になりました。

同姓同名の場合は、がん登録を受けた地方公共団体(自治体)は、やっぱり生年月日などで分けているんでしょうかねぇ(推測)。

で、okumuraさんの提案について考えてみたのですが、現実の病院事務担当者に、「姓名の正規化された仮名」を入力させて、さらに、住所も正規化された状態で入力させて、それを地域で決めたHASH関数で変換させてがん登録に送るというのは、やや非現実的な気がしています。それよりは、1次データのままセンターに安全な方法で移動させて、そこで患者ごとに正確に分類した上で個人情報を消去して統計資料にする方が、結果として安全じゃないかと。

それから、「国の個人情報保護」の立場で「がん登録」を適用外とすることは「国として合法」なのでしょうが、地方公共団体(自治体)が「各病院は個人情報を出してはならない」と条例を作ることも合法でしょう、おそらく。(裁判所の証拠提出命令に従わないことを決める条例は違法です。)このあたり、地域がん登録の担当者が裁判でも起こして、その種の条例が国の法律に反していることを訴えて勝訴すれば状況は変わるんでしょうが、裁判は面倒といえば面倒ですよねぇ。

私は,がんに限らず,

私は,がんに限らず,また35自治体に限らず,疫学データは全国から収集して研究に使える体制ができないかと考えているのですが,レセプトも電子化される時代,手書きで報告書を作成して,自治体がそれを目視で同定するのではなく,プライバシを侵害せずに電子的に統計情報を収集するようなプロトコルの設計ができないものでしょうか。そういった提言も情報処理学会ができるようにならないでしょうか。

結局、話は提言に戻る

あ、それ(=情報処理学会で提案)は建設的ですね。賛成。

医療関係者も、プログラミングの経験がないと、コンピュータで何ができるのかできないのかの判断が「全く」できないから、そうなると「こういうことを情報処理学会に聞いていいのかいけないのか」もわからない状態なんでしょうね。

ところで

なぜ、僕の記事にトラバってくれないんですか…

とらば

すっかり忘れていました。^^; とらばりました(ってことばがあるんでしょうか)

とらばるって「とらば

とらばるって「とらばーゆする」って事じゃないんですね ^^;;;

ぐぐってみましたが,

ぐぐってみましたが,確かに今はトラックバックの意味で使われているようです。とらばーゆするの意味で流行語になったのは20年前とか。

コメントの表示オプション

お好みの表示方法を選択し、「設定の保存」をクリックすると、表示方法を変更することができます。