
1バイト文字とは? – 基礎から理解する文字コード
私たちが普段何気なく見ている文字や数字、記号といった文字は、コンピューターにとっては全く異なる姿で認識されています。コンピューターは、あらゆる情報を0と1の二進数で処理しています。この0と1の最小単位は「ビット」と呼ばれ、電気が流れるか流れないかを表しています。しかし、一つの文字を表すには、ビット一つでは情報量が少なすぎます。
そこで、複数のビットを組み合わせて文字を表現する方法が考え出されました。例えば、8個のビットを組み合わせると、256通りのパターンを作ることができます。このパターンを、アルファベットや数字、記号といった様々な文字に割り当てることで、コンピューターは文字を処理できるようになるのです。
この、文字とビット列の対応関係を定めたものを「文字コード」と呼びます。代表的な文字コードとしては、「ASCIIコード」や「Unicode」などがあります。ASCIIコードは主に英語圏で使用される文字を表現するもので、Unicodeは世界中の様々な言語の文字を網羅することを目指して作られました。
つまり、私たちが普段見ている文字は、コンピューター内部では決められた規則に従って、0と1のビット列に変換されているのです。