強火で進め

このブログではプログラム関連の記事を中心に書いてます。

Unicodeを U+ で始まるコードポイントで指定して確認する簡単な方法

Unicodeの仕様書を見ると U+ で始まるコードポイントという形で情報が記載されています。

例えばアルファベットの場合はこちらのPDFファイルに情報が有ります。

このファイルを見ると A の文字は U+0041 である事が確認出来ます。
この場合はこの様なHTMLファイルを作成し、ブラウザで表示するの事で確認可能です。この方法が様々な環境でも使える中では一番簡単だと思います。

<html>
<head>
  <meta http-equiv="content-type" content="text/html; charset=utf-8" />
</head>
<body>
&#x0041;
</body>
</html>

アルファベットは普通にタイピング出来るのでこれだけじゃ面白くないので次は絵文字を表示してみましょう。現在のUnicodeGoogleAppleを中心とした働きかけにより絵文字が割り当てられたコードも存在します。

絵文字のコードポイントについてはこちらに情報が有ります。

Emoji Symbols: Background Data
http://unicode.org/~scherer/emoji4unicode/snapshot/full.html

ここで先頭の太陽は U+2600 と成っています。その為、先程と同じルールで &#x2600; と記述すれば表示出来ます。

しかし、あまりマニアックな文字や今回の絵文字の場合はUnicodeの規格には指定が有ったとしても表示する時に使用するフォントファイルにそのコードポイント用の字形データが存在しないなどといった事も有るのでその点、ご注意下さい。

ちなみに、Mac OSのLionやiPhoneなどで有れば絵文字のデータも存在するのでちゃんと表示する事が出来ます。

サンプルをこちらにアップしておきました。直ぐに確認したい方はこちらにアクセスして下さい。