
日本語EUC:知っておくべき文字コード
日本語電子計算機漢字コード(にほんごでんしけいさんきかんじこーど)は、計算機で日本語の文字を扱うための文字の符号の一つです。よく「日本語イーユーシー」と呼ばれ、略して「EUC-JP」とも書かれます。昔は、計算機の種類によって様々な漢字コードが使われていて、文字化けなどの問題がよく発生していました。そのような中、日本語電子計算機漢字コードは、主に「ユニックス」系の計算機で使われて広く知られるようになりました。この漢字コードは、アルファベットや数字などを表すための基本的な符号であるアスキーコードを拡張したものと言えます。アスキーコードだけでは、ひらがな、カタカナ、漢字などの日本語の文字を表すことができません。そこで、アスキーコードで使われていない部分を利用して、日本語の文字を表せるようにしたのが、日本語電子計算機漢字コードです。
この拡張によって、日本語を含んだ文章などを計算機で扱うことができるようになりました。インターネットの初期の頃には、日本語のホームページなどでよく使われていましたが、最近は世界中の文字を統一的に扱うことを目指した「ユニコード」が主流となっています。ユニコードは、日本語電子計算機漢字コードを含め、様々な文字コードをまとめた包括的な文字の集合です。現在でも、古い計算機や資料では日本語電子計算機漢字コードが使われていることがあるので、その仕組みや特徴を理解しておくことは大切です。
日本語電子計算機漢字コードは、単に日本語を表せるだけでなく、アスキーコードとの互換性を保っていることも大きな特徴です。つまり、アスキーコードで書かれた計算機の命令や資料は、日本語電子計算機漢字コードを使っている計算機でも問題なく動きます。これは、計算機のシステムを移行する時などに大変便利です。日本語電子計算機漢字コードは、情報処理の分野では基本的な知識と言えるでしょう。