データベース

これは松阪大学で教えていたころのものです。

データベースと SQL

ここでいうデータベースは関係データベース（relational database，RDB）と呼ばれるものです。関係データベースを操作するには SQL という言語を使います。 SQL はもともと Structured Query Language（構造化問合せ言語）の略でしたが，今では単に SQL（エスキューエル）が正式名になっています。

ちなみにこの query（問合せ）という語は，ソフトによっては「クエリー」のように日本式発音でカナ書きしているものもあります。

関係データベースを管理するソフト（RDBMS）にはいろいろなものがありますが，ここでは PostgreSQL（ポストグレス・キュー・エル）というオープンソースのデータベースソフトを使ってみましょう。これは Linux（に限りませんが）で動きます。 Linux への PostgreSQL のインストールはここをご覧ください。

授業では news というマシンにユーザ名 www，パスワード foobar で SQL が使えるようにしてあります。次のページから SQL が打ち込めます。

SQL 実習 (すいません，今は動いていません)

テーブルを作ろう

自分のユーザ名（学籍番号を小文字にしたもの）と同じ名前のテーブル（表）を作ってみましょう。たとえばユーザ名が c01789 の人は

create table c01789(hinmei char(16), nedan int);

char(16) は16バイトまでの文字列，int は整数（integer）の意味です。

この表に値（values）を挿入（insert）してみましょう。

insert into c01789 values('りんご', 500);
insert into c01789 values('みかん', 300);

挿入した列をすべて表示してみましょう。「すべての列」は米印 * で表します。

select * from c01789;

すると次のような形式で表示されるはずです。

      hinmei      | nedan 
------------------+-------
 りんご           |   500
 みかん           |   300
(2 rows)

hinmei の列だけ表示するには次のようにします。

select hinmei from c01789;

今度は値段が 400 円以上の品名だけ表示してみましょう。

select hinmei from c01789 where nedan >= 400;

合計（sum）を求めてみましょう。

select sum(nedan) from c01789;

値段の順に並べてみましょう。

select * from c01789 order by nedan;

無指定では値段の小さい順（昇順，ascending order）に並びます。大きい順（降順，descending order）に並べるには desc を付けます。

select * from c01789 order by nedan desc;

データの更新には update を使います。

update c01789 set nedan=200 where hinmei='みかん';

行の削除は delete です。

delete from c01789 where hinmei='みかん';

データベース設計

主キーを定めよう

上の例で使った商品データベースでは，りんごがいろいろあったら品名だけで行が決まりません。名前だけで行が決まるような詳しい名前を付けるか，あるいは商品コードを付けましょう。

学生名簿でも，同じ名前の学生が二人いたら，名前だけで行が決まりません。学籍番号を付けましょう。

商品コードや学籍番号のように，これが決まれば行が特定できるものを，主キーといいます。

第1正規化

学生名簿に「所属クラブ」という列があると，複数のクラブに所属している学生はどう扱えばいいでしょうか。

学籍番号	氏名	所属クラブ
C01788	松阪太郎	野球部
C01789	山田花子	茶道部	漫研

こんな芸当はできません。^^;

学籍番号	氏名	所属クラブ1	所属クラブ2
C01788	松阪太郎	野球部	-
C01789	山田花子	茶道部	漫研

これだと三つのクラブに所属する人が現れたら困ります。それに，このようにしてしまうと，あとの処理が難しくなります。

そのようなときは，複数の行に分けましょう。

学籍番号	氏名	所属クラブ
C01788	松阪太郎	野球部
C01789	山田花子	茶道部
C01789	山田花子	漫研

これを第1正規化といいます。

第2正規化

上の表では，主キーは「学籍番号」と「所属クラブ」の二つになります。二つの主キーの値を指定すれば行が定まるので，これはまったく問題ありません。問題は，氏名が「学籍番号」だけで決まってしまい，もう一つの主キー「所属クラブ」によらないということです。このように，ある列の値が主キーの一部だけによって決まる場合は，表を次のように二つに分けましょう。

学生一覧表（主キーは学籍番号）

学籍番号	氏名
C01788	松阪太郎
C01789	山田花子

クラブ所属表（主キーは学籍番号と所属クラブ）

学籍番号	所属クラブ
C01788	野球部
C01789	茶道部
C01789	漫研

実際にはクラブに属していない学生も多いので，クラブ所属表は学生一覧表ほど大きくなりません。

このように，主キーの一部だけに依存するような項目をなくすことを，第2正規化といいます。

第3正規化

学生一覧表は実際にはもっといろいろな項目を含みます。たとえばコースについての情報が次のように入っているとしましょう。

学籍番号	氏名	コース名	コース主任
C01788	松阪太郎	行政	○○教授
C01789	山田花子	情報	□□教授

「コース名」が決まれば「コース主任」は決まってしまいますね。そこでまた表を分割しましょう。

学生一覧表（主キーは学籍番号）

学籍番号	氏名	コース名
C01788	松阪太郎	行政
C01789	山田花子	情報

コース一覧表（主キーはコース名）

コース名	コース主任
行政	○○教授
情報	□□教授

コース一覧表は，コースの数だけでいいので，たいへん小さくなります。

このように，別の項目に依存するような項目をなくすことを，第3正規化といいます。

表はできるだけ正規化するのが正しいデータベース設計です。

結合（join）

上のように正規化した場合，いくつかの小さな表ができます。これらを結合して，正規化する前の大きな表に戻す方法が必要になります。

学生一覧表とクラブ所属表から，いずれかのクラブに所属する学生について，氏名なども含めた大きい表を作るには，次のようにします。

select * from 学生一覧表 natural join クラブ所属表;

また，学生一覧表とクラブ所属表から，すべての学生について，氏名なども含めた大きい表を作るには，次のようにします。

select * from 学生一覧表 natural full join クラブ所属表;

ほかにもいろいろな結合が考えられますが，これだけ知っていれば大丈夫でしょう。

参考書・参考サイト

参考書

芝野耕司『SQLがわかる本』（オーム社，1998年）
石井達夫『PostgreSQL完全攻略ガイド改訂第3版』（技術評論社，2001年）
J. C. Worsley and J. D. Drake, Practical PostgreSQL (O'Reilly, 2002)
Date，Darwen『標準SQLガイド改訂第4版』（アスキー，1998年）

参考サイト

PostgreSQL (公式サイト)
UNIX データベース入門 (稚内北星学園大学の丸山不二夫先生が1994年に書かれたもの)
連載SQL実践講座 (アットマーク・アイティ)

奥村晴彦

Last modified: 2004-05-03 22:51:30