▽ UTF-8ブラウザ別対応状況 ※このホームページはUTF-8で記述されています。

いわゆる機種依存文字(「①」「㈱」「℡」など)とUTF-8



1stレンタルサーバーなら、LINUX/WINDOWSサーバーどちらでもご利用可能です

一般的に、Windows上で入力した「①」「㈱」「ⅱ」などは機種依存文字と言われています。Macでは文字化けすると。本当でしょうか?


Windows上で入力した
①②③④⑤⑥⑦⑧⑨⑩⑪⑫⑬⑭⑮⑯⑰⑱⑲⑳
ⅠⅡⅢⅣⅤⅥⅦⅧⅨⅩ
㍉㌔㌢㍍㌘㌧㌃㌶㍑㍗㌍㌦㌣㌫㍊㌻
㎜㎝㎞㎎㎏㏄㎡
㍻〝〟№㏍℡㊤㊥㊦㊧㊨㈱㈲㈹㍾㍽㍼
∮∑∟⊿

がどのように見えるかテストしてみました。なお、これらの文字はWindows上では正しく表示されることは分かっていますので、一覧結果からは省略されています。Macでの表示結果のみをまとめています。

2005年6月21日
詳細は下記の本文を見ていただきたいですが、MacOSXにおけるmozilla系ブラウザの上記文字に対する対応状況は一見するとぼろぼろに見えますが、実際はフォントを明示的に指定してあげることで文字化けを解消できることが分かりました。Mac版Netscape7.1やFirefoxをご利用の方はこちらをクリックしてください。こちらはフォントを明示的に指定しているために文字化けしないと思います。


MacOS 10.4.1
(Tiger)
Internet Explorer5.2.3
Safari2.0
Netscape7.1×
Netscape7.0.2
Firefox1.0.4×
Mozilla1.7.8×
Opera7.5.3
Opera8.0.1
シイラ1.0
Camino0.8.4×
omniweb5.1

MacOS 10.3.9
(Panther)
Internet Explorer5.2.3
Safari1.3
Netscape7.1×
Firefox1.0.4×
Opera6.0.3
Opera8.0.1
シイラ0.9.3
Camino0.8×

2005年6月21日追記
mozilla系ブラウザで×だらけですが、単純にOsakaフォントを明示的に指定してあげれば文字化けしないことが分かりました。「<font face="Osaka">①②③④⑤⑥⑦⑧⑨⑩ⅰiiⅲⅳ</font>」のようにしてあげれば良いのです。(Macの該当ブラウザでは、このタグのサンプルは文字化けしていると思いますが、次の「①②③④⑤⑥⑦⑧⑨⑩ⅰiiⅲⅳⅴⅵⅶⅷⅸⅹ」)は文字化けしていないと思います。


MacOS 10.2.8
(Jaguar)
Internet Explorer5.2.3
Safari1.0.3
Netscape7.1×
Netscape7.0.2
Firefox1.0.4×
Opera7.5.3
Opera8.0.1

MacOS 9.2.2)Internet Explorer5.1.7
Internet Explorer 5.0
Internet Explorer 4.5
Netscape7.0.2
Netscape6.1
Netscape4.7×

 「①」から「⑮」までの丸付き数字など一部の文字は正しく表示されます。

この一覧表を見ても分かりますように、文字化けするのはMacOS 9.2.2におけるNetscape4.7の場合及びMacOSXにおけるmozilla系ブラウザ(Firefox、Netscape、Mozilla)けでした。なぜ、他のブラウザで文字化けしなかったかというと、このページはShift_JISではなく、UTF-8で書かれているからです。Shift_JISでは、漢字一文字を現すのに2バイトを使いますが、UTF-8では3バイト使用します。Shift_JISの「あ」は「0x82 A0」(「0x」とはその後に続く文字列が16進数であることを示しています)ですが、「0xE3 81 82」です。Shift_JISで扱える文字量とは比べ物にならない量の文字を同時に使うことが可能です。ですから、このNEC特殊文字 13区の文字(○の中に数字が入ったもの。ローマ数字。「(株)」が一文字になったものなども、ほとんどのブラウザで正しく表示されます。)

これらのNEC特殊文字は、UTF-8の環境下である限り、これは機種依存文字ではなく、「ブラウザ依存文字」とも言うべきものであります。

 mozilla系ブラウザの場合でも、フォントを明示的にOsakaフォントと指定してあげると文字化けしないことが分かりました。詳細は、こちらの追記をご覧ください。)

余談になりますが、Shift_JISでは漢字一文字を表すのに2バイトで表現可能なのに、UTF-8では3バイト必要なため、同じコンテンツでもファイルサイズが大きくなります。こちらにサンプルを準備しましたが、Shift_JISでは2,174バイトなのに、UTF-8では2,921バイトになっています。約1.34倍に膨れ上がっています。なぜ、ちょうど1.5倍にならないかといえば、HTMLを記述する際に使用しているアルファベット文字は、Shift_JISもUTF-8も1バイトであるためです。日本語の量がページ全体に占める割合が増えるにつれ、「1.5倍」という値に収斂していきます。

ただ、いわゆる機種依存文字はこのNEC特殊文字だけではありません。「髙」(はしご高)や「德」(「徳」の異字体)、「﨑」(「崎」の異字体)などもあります。これらの文字の対応状況を次のページで見てみましょう。



【広告】 何円の本でも送料無料(2010年1月7日まで。延長あるかも?)    【広告】 失敗しないレンタルサーバの選び方    【広告】 禁煙草

【広告】 あるある大辞典で大ブレーク!! しみ・しわが取れた!!    【広告】 マジック・トーカーズなど英語教材比較