▽ UTF-8ブラウザ別対応状況 | ※このホームページはUTF-8で記述されています。 |
いわゆる機種依存文字(「①」「㈱」「℡」など)とUTF-81stレンタルサーバーなら、LINUX/WINDOWSサーバーどちらでもご利用可能です |
一般的に、Windows上で入力した「①」「㈱」「ⅱ」などは機種依存文字と言われています。Macでは文字化けすると。本当でしょうか?
※ 「①」から「⑮」までの丸付き数字など一部の文字は正しく表示されます。 この一覧表を見ても分かりますように、文字化けするのはMacOS 9.2.2におけるNetscape4.7の場合及びMacOSXにおけるmozilla系ブラウザ(Firefox、Netscape、Mozilla)けでした※。なぜ、他のブラウザで文字化けしなかったかというと、このページはShift_JISではなく、UTF-8で書かれているからです。Shift_JISでは、漢字一文字を現すのに2バイトを使いますが、UTF-8では3バイト使用します。Shift_JISの「あ」は「0x82 A0」(「0x」とはその後に続く文字列が16進数であることを示しています)ですが、「0xE3 81 82」です。Shift_JISで扱える文字量とは比べ物にならない量の文字を同時に使うことが可能です。ですから、このNEC特殊文字 13区の文字(○の中に数字が入ったもの。ローマ数字。「(株)」が一文字になったものなども、ほとんどのブラウザで正しく表示されます。) これらのNEC特殊文字は、UTF-8の環境下である限り、これは機種依存文字ではなく、「ブラウザ依存文字」とも言うべきものであります。 (※ mozilla系ブラウザの場合でも、フォントを明示的にOsakaフォントと指定してあげると文字化けしないことが分かりました。詳細は、こちらの追記をご覧ください。) 余談になりますが、Shift_JISでは漢字一文字を表すのに2バイトで表現可能なのに、UTF-8では3バイト必要なため、同じコンテンツでもファイルサイズが大きくなります。こちらにサンプルを準備しましたが、Shift_JISでは2,174バイトなのに、UTF-8では2,921バイトになっています。約1.34倍に膨れ上がっています。なぜ、ちょうど1.5倍にならないかといえば、HTMLを記述する際に使用しているアルファベット文字は、Shift_JISもUTF-8も1バイトであるためです。日本語の量がページ全体に占める割合が増えるにつれ、「1.5倍」という値に収斂していきます。 ただ、いわゆる機種依存文字はこのNEC特殊文字だけではありません。「髙」(はしご高)や「德」(「徳」の異字体)、「﨑」(「崎」の異字体)などもあります。これらの文字の対応状況を次のページで見てみましょう。
|
【広告】 何円の本でも送料無料(2010年1月7日まで。延長あるかも?) 【広告】 失敗しないレンタルサーバの選び方 【広告】 禁煙草 【広告】 あるある大辞典で大ブレーク!! しみ・しわが取れた!! 【広告】 マジック・トーカーズなど英語教材比較 |