全角文字と半角文字があるのは何故?ざっくり解説

IT

パソコンやスマホの文字入力は、数字や英字やカタカナは全角と半角の2通りあります。
メールアドレスやパスワードは「半角英数」が必須です。

文章を書いたりはどちらでもいいでしょう。
しかし、ひらがなと漢字で文章を普通に書くときは「全角」です。

文字によって2種類あるのはややこしいですね。
慣れてしまうと気にせず使い分けていますが、違和感は残ったままです。

そこで、文字入力が全角と半角の2通りある理由をまとめます。

当初のコンピューターが使える文字は半角だけだった

コンピューターは基本的に半角英数字で操作する機械です。
コンピュータは最初、英語圏の人が作り、英語と数字だけなので半角の入力で足りました。

コンピュータが世界に広まると、日本語や中国語でも使えるよう仕組みが採り入れられ、全角の入力を可能にしました。
このように後から入力可能になったのが全角文字なのです。

注意しなければならないのは、同じ意味の文字でも全角文字と半角文字はデータ上は違う文字ということです。

全角文字と半角文字は、大きさという見た目の違いだけです。
しかしコンピュータの世界では、データとしては違うものとして認識されます。

この違いは、メールアドレス、サイトのURL、パスワードなどに現れます。
これらは半角英数での入力となります。
全世界共通のインターネットなどで使う文字は半角英数での入力という決まりがあるからです。

半角だけの文字コードの時代

コンピュータの情報は全て2進法の数値によって表されます。
※情報が数値で管理されているということ
※文字情報は、各文字に対して番号を割り振って管理している

各文字に付けられた番号のことを文字コードと呼びます。
文字コードにより、各文字は1バイト文字と2バイト文字に分類されます。

2バイト文字は、1バイト文字2文字の幅の正方形で表示させることが多いので、1バイト文字は半角文字、2バイト文字は全角文字と呼ばれたりします。
このように全角文字と半角文字で文字コードが違うわけです。

1バイトはコンピュータが一回で処理するデータ量を表す基本単位です。
1バイトは、2進数で8桁あり、256通りのデータを表せます。
2進数の1桁のことを1ビット(bit「binary digitの略」)と呼びます。
2進数の数桁をまとめたものを1バイト(byte)と呼びます。

コンピュータの世界では0か1が入る桁がビットです。
※1ビットは0か1が入る桁が1個ある状態

この桁が8個でバイトになります。
※1バイトは0か1が入る桁が8個ある状態

つまり8ビットで1バイトになります。
※8ビットで1バイトが正式に決められたのは2008年のこと

1桁に0か1が入り、8枠あるので、1バイトで表現できる情報の数は256個(2の8乗)です。
※初期のコンピュータの文字コードは256文字しかなかった

全角(日本語)を表現するため文字コードが拡張される

1980年代に入って、日本でもパソコンが普及します。
当然ながら、漢字が使いたいというニーズが強まります。

しかし漢字の文字数は多く、8ビットの文字コードでは足りません。
そこで16ビットの文字コードを使う方法が採用されました。
※情報の数は256個(2の8乗)×256個(2の8乗)となり文字コードは65536文字になる

このときから、もともとあるコンピュータの文字が、全角16ビットの半分である8ビットで表現することから半角文字と呼ばれるようになったのです。

コンピュータの進歩とともに世界中の文字が表現される

日本語の漢字の文字数が多いと言っても、文字コードはせいぜい16ビットでおさまります。
しかし世界中にはもっと多くの言語にともなう文字があります。
それを全て表示しようとしたら16ビットの65536文字では全く足りません。

そこでその後、Unicode(ユニコード)という仕組みが世界共通規格として採用されました。
ついに世界中の文字がコンピュータに表示できるようになり現在に至ります。

まとめ

文字入力が全角と半角の2通りある理由が分かり、同じ意味の文字でもデータ上は違うことが理解できたのではないでしょうか。
少し踏み込んだ説明になりましたので難しいと思います。
しかしがんばって一度でも学んでおけば、パソコンやスマホの使用に役立つ知識になるでしょう。

パソコンとスマホに共通したコンピュータの仕組みを知ることでITリテラシーも高まります。

仕事上はもちろんプライベートでも仕組みを理解して使えたらいいですね。

この記事が参考になれば幸いです。

タイトルとURLをコピーしました