全角と半角

日本語の文字は、正方形の枠にデザインされることが多いので、全角文字とも呼ばれます。これに合わせて英数字もＡＢＣ１２３のように正方形の枠にデザインされた全角の英数字があります。問題は、ABC123のような全角でない文字を何と呼ぶかです。

従来の日本語フォントではABC123などは全角の半分の幅にデザインされることが多かったので、「半角文字」という言葉が生まれました。

ところが、今風のフォントでは、ABC123などは全角の半分の幅ではなく、例えばWは広くIは狭いという具合に、文字の形に応じて幅を変えてあるのが一般的です。こういうフォントをプロポーショナルフォントといいます。

プロポーショナルフォントの時代に「半角」文字というのは変です。では何と呼べばいいでしょうか。

昔のShift JISなどの文字コードでは、全角文字は2バイト、「半角」文字は1バイトで表されました。そこで、2バイト文字・1バイト文字という呼び方もされました。

ところが、Unicodeの時代になると、文字のバイト数はエンコーディングによって変わるようになりました。一番よく使われているUTF-8では、「半角」文字は1バイトですが、全角文字の多くは3バイトです。UTF-16ではどちらも2バイト（一部の全角文字は4バイト）です。

Unicodeでは、文字のブロックごとに名前が付けられています。いわゆる「半角」文字には「基本ラテン文字」（Basic Latin）という名前が付いています。この呼び方が一番正確です。でも「半角文字」という呼び名は当分なくなりそうにありません。

ちなみにUnicodeでは、半角AはLATIN CAPITAL LETTER A（ラテン大文字A）、全角ＡはFULLWIDTH LATIN CAPITAL LETTER A（全角ラテン大文字A）という名前が付いています。

さらに細かいことをいうと、東アジアの文字幅という概念があり、全角（fullwidth）、半角（halfwidth）、広（wide）、狭（narrow）、曖昧（ambiguous）、中立（neutral）の区別がありますが、ここでいう半角は「半角カナ」の半角で、基本ラテン文字は「狭」のようです。