神戸 西宮 宝塚 ホームぺージ制作

文字コードとは?コードの種類や変換が合わないときの対処方法

2020/12/20

この記事の投稿者

ラフくん

「文字コード」という言葉はよく耳にします。ところが、日常でパソコンを使っているだけではあまり必要ではなく、意味が分からないという方もいるでしょう。

意味を知らなくても実際には、コンピューター上で文字を打ったり、読んだりしているだけでも恩恵に与っています。今回は、知らずに使っている文字コードを簡単に見てみましょう。

文字コードについて

文字コードの種類は、一つではなく大きく分けて二つです。ここでは、簡単な説明と、二つの種類をご紹介します。

文字コードってなに?

文字コードとは、コンピューター上で文字を表現する際に使うコードを指し、あらかじめ、ひとつひとつの文字に番号を割り当てておくことでコンピューターが文字を理解します。

コンピューターが文字を理解するには1文字ずつに番号を振り分ける振り分けた番号をコンピューターが理解できるようにする二通りが必要です。

1文字につき一つの番号を振り分けたものが「符号化文字集合」、振り分けた番号がどの文字かをコンピューターが理解するようにするのが「文字符号化方式」です。

コンピューターは「0」「1」しか理解しないため、文字符号方式は0と1だけで表現されています。

符号化文字集合

英数字、漢字、ひらがな、かたかな、外国語の文字、記号など、さまざまな文字を1文字ごとに番号を割り当てた文字コードが「符号化文字集合」です。

代表的なものとしては、ASCII、Unicode、JIS X 0208、JIS X 0213などがあります。

【ASCII(アスキー)コード】

1963年に米国国家規格協会で決められた英数字と記号、制御文字の基本的なコード表です。後述する文字符号化方式も兼ねています。

【Unicode】

ASCIIコードは英数字など最小限のものしかなく、ほかの言語を表現するにはコードが足りませんでした。そこで作られたのが、Unicodeです。現在では、世界共通のものとなっています。

【JIS X 0208】

JIS(日本工業規格)が規定した日本初の日本語や人名、地名などを表すコード表です。

文字符号化方式

符号化文字集合で決められたコードをコンピューターが理解できる数字に置き換えたものを「文字符号化方式」といいます。

例えば、「あ」を符号化文字集合において「000123」と表現しているとしましょう。ところが、コンピューターは0と1しか理解できないため、000123と伝えても「あ」と表示してくれません。そこで必要になるのが、「0」と「1」だけで表現されたコード表となります。

文字符号化方式のコード表として有名なのは、Unicodeで使われる「UTF‐8」「UTF‐16」「UTF‐32」、JISでは「ISO‐2022‐JP(JISコード)」「シフトJIS」です。

文字コードが合わず文字化け!どうする?

サイトやメールを開くと、たまに読めない文字の羅列が並んでいることはありませんか?そうなると「ウイルスに感染したかも」と慌てる方もいるでしょう。

文字表記がおかしくなる原因の一つに、文字コードが合っていないことが挙げられます。こちらで紹介するのは、文字化けが起こったときの対処法です。

HPが文字化けしている場合

一度、リロードしてみましょう。更新ボタンをクリックする、またはF5やCtrl+F5を押すだけで簡単にリロードできます。

それでも直らないときは、文字コードの選択に移りましょう。

・【IE】

ツールバーにある表示からエンコードを開き「Unicode(UTF‐8)」を選びます。

・【Chrome】

拡張機能を使用します。検索バーに「Garbled text」と入力し、必要なものをインストールしましょう。

・【SafariとFirefox】

上部にある表示の中からテキストエンコーディングを開き、「Unicode(UTF‐8)」を選びます。

メールが文字化けしていたら?

メールでの文字化けもHP同様に文字コードの変更を行います。

・【Gmail】

文字化けしたメールを開き、右上のその他の中から「文字化けを修復」を選びます。

・【Outlook 2019】

文字化けしたメールを開いたら、メッセージタブをクリックします。移動グループの「その他のアクション」の中の「エンコード」から「日本語(自動選択)」を選びましょう。

文字コードの変更を行っても直らないときは、半角カナや機種依存文字が含まれている可能性があります。

文字コード表は二種類ある

コンピューターに文字を表記するには、二種類のコード表が必要になります。二種類とは、それぞれの文字に番号を振ったものとコンピューターに認識してもらうためのものです。

しかし、文字コードにもいくつかの種類があり、違った対応表と合わせてしまうと文字化けが起こり、文章が読めなくなってしまいます。そのときは、対応表が合っていないのだなと思い、文字をエンコードするようにしましょう。

お問い合わせ・ご相談はこちら

アーカイブ

CONTACT
お問い合わせ

ホームページ制作・保守管理・運用サポート・グラフィックデザイン・動画制作・システム開発

move_top