榨菜(ざーさい)の「榨」をHP上に表示するには?



中国語の魅力に聞き入っているうちに中国語をマスターできる秘法

Shift_JISでホームページを作成する場合、Shift_JISに存在しない文字を直接入力すれば文字化けします。例えば、韓国語(ハングル)を直接Shift_JISのページに入力しても文字化けしてしまう現象です。これは当たり前といえば当たり前ですが、これが「榨菜(ざーさい)」のような漢字になると、なぜ「?菜」のような文字化けするのか、一瞬戸惑うことがあります。なぜ、漢字が表示されないのと? 

例えば、「文字コード研究に役立つフリーソフト・シェアウェア」でも紹介した「漢字コード表 Kanji ver1.0」を使えば、「榨菜」の「榨」をコピー&ペーストしても、「?」に変わります。また、秀丸でも、下記のように「?」に置き換わってしまいます。

これらの現象は、右のキャプチャー画像(秀丸のエラーメッセージ)が端的に表しているように、「榨菜」の「榨」の字がShift_JISコードに含まれていないためです。一見不思議にも見えますが、ただ、これも、高校英語の例文でよく見かけた「鯨が魚でないのは、馬が魚でないのと同じだ」(A whale is no more a fish than a horse is. )の例文を用いれば、「『榨菜』の『榨』がShift_JISに含まれていないのは、『안녕하세요?』がShift_JISに含まれていないのと同じだ」ということになります。



シェアウェアのテキストエディタ・秀丸では、Shift_JISで取り扱うことのできない文字が混じった文書をShift_JISで保存しようとすると、上のようなエラーメッセージが表示されます。上の例で言えば、「榨菜」の「榨」がShift_JISに含まれていないため、エラーメッセージが表示されています。Shift_JISで、これらの文字を取り扱うには、数値参照文字というものを使います。

ただし、これらのShift_JISに含まれない漢字やハングル文字をShift_JISのHTMLページの中で表現することは可能です。数値文字参照というものを使います。

数値文字参照とは、例えば「あ」を表現するのに、直接「あ」と入力するのではなく、「あ」と入力することにより表示する方法のこと。この12354という数字は、各文字に固有の番号がありますが、この番号の求め方は、「Javascriptで数値文字参照のを求める方法」のページで解説していますので、そちらを参照してください。

この数値文字参照を使うことで、このページのようにShift_JISで書かれたホームページ上でも中国語固有の文字を表現することも一部可能です。ただ、「」(シェシェ。「ありがとう」の意。)のように、数値文字参照で「&#35874;&#35874;」と入力しても、Windows版IE6や5.5などでは「・・」と文字化けする場合もあります。この場合、フォントを「Arial Unicode MS」などUnicode対応フォントを明示的に指定してあげて、「<font face="Arial Unicode MS">&#35874;&#35874;</font> = 谢谢」」と入力することで、「Arial Unicode MS」がインストールされている端末(かつ、数値文字参照をサポートするブラウザを利用している場合。)であれば、「」とちゃんと表示させることが可能になります。

もしくは、Shift_JISで作成するのではなくUTF-8で作成するようにすれば、フォントの指定などしなくても、日本語と中国語の混合のHTMLページを作成することが可能になります。

(画像)直接入力数値文字参照
?菜(ざーさい)榨菜(&#27048;菜)
?好(ニイハオ)你好(&#20320;好)
??(シェシェ)谢谢(&#35874;&#35874;)
(フォントを明示的に指定しない場合)

谢谢(&#35874;&#35874;)
(フォントを明示的に指定した場合)


← UTF-8版のページに


【広告】 ロゼッタストーン 中国語(北京語) レベル1、2&3セット(オーディオ・コンパニオン付属)     【広告】 中検4級問題集〈2008年版〉

【広告】 (人気参考書)驚くほど身につく中国語      【広告】 中国語学習に役立つサイト     【広告】 中国語マラソン