mabots' blog

知のレバレッジを最大化せよ (旧はてなダイアリーから移転しました。)

google、絵文字のユニコード符号化: 符号化提案用のオープンソースデータを公開。

単に絵文字の変換するというところでは数々のモジュール、ライブラリでやっている車輪の再発明かもしれませんが、googleが提唱することで、携帯のメールがUTF-8化され、かつ絵文字も大体の機種で共通のものは統合コードでUTF-8コードで記載できる日がくるのかもしれません。(とくにsoftbankの絵文字が連続するときのSJISコードの結合とかどうなってるんだ的なかんじなのでなんとかしてほしいです)
新たに変換表などをサイトで作成する場合は、googleの提供するXMLを参考にして作成されると将来的に拡張性が高くなったりメンテナンス性が高くなるかもしれません。http://code.google.com/p/emoji4unicode/source/browse/#svn/trunk/data
ただ端末自体の買い替えサイクルが端末の値段の実質的な値上げ(キャリアの利益向上にしかならない)にもとななって長くなっているため、実際にUTF-8標準対応端末がでたとしても普及には時間がかかってしまいそうな気もしますのでまだまだ地道な携帯対応作業は必要な状況は続いていしまうのかも。

http://googlejapan.blogspot.com/2008/11/blog-post_27.html
http://sites.google.com/site/unicodesymbols/Home/emoji-symbols
http://code.google.com/p/emoji4unicode/

現在、日本の携帯絵文字の全てをユニコードの文字として共通符号化しようという提案が進行しています。そのためには、現在使用されている絵文字のうちどれが既にユニコード符号化されているか、新しく符号化しなければならない絵文字はどれかなどを調査する作業が必要です。この提案を支援する目的で、私たちが提案している絵文字のマッピングや変換表、更に絵文字データからHTMLの表などを作成するのに役立つツールなどを 「emoji4unicode 」という名前でオープンソースプロジェクトとして公開します。 これによりユニコードコンソーシアムの他のメンバーとの協力を強め、携帯電話会社、更に携帯絵文字に関心のある皆様からフィードバックをいただければ幸いです。これらの表やツールを公開することによって、絵文字のユニコード符号化をより迅速に実現できることを願っています。 詳しくは絵文字ユニコード符号化プロジェクトページ 、絵文字オープンソース・データページ をご覧ください。フィードバックはこのページからお願いいたします。