全角と半角

日本語の文字は、正方形の枠にデザインされることが多いので、全角文字とも呼ばれます。これに合わせて英数字もABC123のように正方形の枠にデザインされた全角の英数字があります。問題は、ABC123のような全角でない文字を何と呼ぶかです。

従来の日本語フォントではABC123などは全角の半分の幅にデザインされることが多かったので、「半角文字」という言葉が生まれました。

ところが、今風のフォントでは、ABC123などは全角の半分の幅ではなく、例えばWは広くIは狭いという具合に、文字の形に応じて幅を変えてあるのが一般的です。こういうフォントをプロポーショナルフォントといいます。

プロポーショナルフォントの時代に「半角」文字というのは変です。では何と呼べばいいでしょうか。

昔のShift JISなどの文字コードでは、全角文字は2バイト、「半角」文字は1バイトで表されました。そこで、2バイト文字・1バイト文字という呼び方もされました。

ところが、Unicodeの時代になると、文字のバイト数はエンコーディングによって変わるようになりました。一番よく使われているUTF-8では、「半角」文字は1バイトですが、全角文字の多くは3バイトです。UTF-16ではどちらも2バイト(一部の全角文字は4バイト)です。

Unicodeでは、文字のブロックごとに名前が付けられています。いわゆる「半角」文字には「基本ラテン文字」(Basic Latin)という名前が付いています。この呼び方が一番正確です。でも「半角文字」という呼び名は当分なくなりそうにありません。

ちなみにUnicodeでは、半角AはLATIN CAPITAL LETTER A(ラテン大文字A)、全角AはFULLWIDTH LATIN CAPITAL LETTER A(全角ラテン大文字A)という名前が付いています。