■メールには使えない文字がある
メールには使えない文字がある、なんていうと、ケータイのメールに慣れちゃっている人は「ええっ!?」とおどろくかもしれませんね。でも、パソコンで送るメールには、どうしても使えない(使ってはいけない)文字があります。
1. メールで使えない文字はこれだけある
ウィンドウズの場合、メールでは次のような文字が使えません。
◆半角カタカナ
濁点や半濁点もふくまれます。これらは、顔文字に使われていることがあるので注意してください。
◆半角句読点類
半角のかぎやナカグロもふくまれます。半角ナカグロは顔文字に使われていることがあります。
◆丸つき数字
シフトJISのコード番号では8740〜8753にある文字。NECのPC-9801シリーズで採用されました。メールでは、(1)、(2)のように、半角かっこと半角数字を組み合わせて書きましょう。
◆ローマ数字の大文字
シフトJISのコード番号では8754〜875Dにある文字。NECのPC-9801シリーズで採用されました。メールでは、I、IV、IXのように、半角アルファベット「アイ」「ブイ」「エックス」の大文字で書きましょう。ちなみにローマ数字の小文字は、i、iv、ixのように、半角アルファベット「アイ」「ブイ」「エックス」の小文字で書きます。
◆単位の記号類
シフトJISのコード番号では875F〜8775にある文字。NECのPC-9801シリーズで採用されました。メールでは、ミリ、キロのように全角カタカナで書いたり、mm、cmのように半角アルファベットを組み合わせて書きましょう。
◆その他の記号類
シフトJISのコード番号では877E〜879Cにある文字。NECのPC-9801シリーズで採用されました。メールでは、No.、Tel、(株)、(有)のように書きましょう。
◆NEC選定のIBM拡張漢字
シフトJISのコード番号ではED40〜EEFCにある文字。IBMのメインフレームで使われていた拡張漢字の一部をNECが選定し、同社のPC-9801シリーズで採用しました。これらの漢字を使いたいときは、ひらがなを使ってください。
◆IBM拡張漢字
シフトJISのコード番号ではFA40〜FC4Bにある文字。IBMのメインフレームで使われていた拡張漢字で、PC/AT互換機(要はDOS/Vパソコンですね)用のOS(MS-DOSやPC-DOS)で採用されました。これもメールでは使えません。ひらがなを使ってください。
*
これらの文字を、画像ではなく、テキストファイルでごらんになりたい方のために、「tukaenaimozi.zip」(1,857バイト)を用意しました。リンクをクリックすると、ダウンロードできます。圧縮ファイルなので、ダウンロードしたら解凍してくださいね。解凍については「添付ファイルはできるだけ圧縮しよう」をどうぞ。
このページをごらんになっているマッキントッシュユーザーの方にお願いがあります。「tukaenaimozi.zip」のなかに入っているテキストファイルをいろいろなフォントで表示してみて、どんなふうに表示されるのか、画面キャプチャを送っていただけないでしょうか。ウィンドウズとマッキントッシュの文字のちがいを、このサイトのなかで紹介したいと考えていますので。どうぞよろしくお願いします。私のメールアドレスは「このウェブサイトについて」をどうぞ。
2. なぜ、メールで使えない文字があるのか
それでは、なぜ、メールで使えない文字があるのでしょうか。
コンピューターで文字を扱うときには、1文字ごとに番号を割り当てなければなりません。この番号の体系を「文字コード」といいます。ウィンドウズXPでは、内部的には「ユニコード」(Unicode)、表面的には「シフトJIS」という文字コードが使われています。
一方、メールでは「ISO-2022-JP」という文字コードが使われています。「メールのヘッダを読んでみよう」で、「text/plain; charset=iso-2022-jp」と書いてあるヘッダ(Content-Type)のことをお話ししましたよね。あの「iso-2022-jp」です。
文字コードがちがうだけなら、なんらかの変換方法を考えてやればいいのですが、これらの文字コードは、もとにしている文字の種類がちがっています。上の図で示した文字は、ユニコードやシフトJISには入っているのですが、ISO-2022-JPには入っていません。
したがって、上の図で示した文字は、メールでは「存在しない文字」となってしまうのです。存在しない文字を使えば、その部分が文字化けすることもあります。
将来、メールで使われる文字コードが別のものになれば状況も変わってくるでしょうが、少なくとも現在は、「メールには使えない文字がある」わけです。