ようこそ!浜村拓夫の世界へ

    ブログ内検索

    最近の記事

    ブックマーク数の多い記事

    Blog Translation

    Powered By FC2ブログ

    Powered By FC2ブログ
    ブログやるならFC2ブログ


    FC2ブログ LOGIN

    with Ajax Amazon

    特殊文字の入力支援サービス「Symbol」

    このエントリーを含むはてなブックマーク はてなブックマーク - 特殊文字の入力支援サービス「Symbol」 あとで読む
    早起き生活を見ていたら、チェックボックス記号付きの箇条書きを書いている人がいた。
    →「☑英語」みたいなかんじ。

    チェック済みのチェックボックスのイラスト


    レ点(チェックマーク)付きのチェックボックス記号は、文字参照とかで表示させているのかな?と思ったが、入力方法が分からなかったので調べてみた。

    入力方法が分からない特殊文字でもワンクリックでコピペできるサイト「Symbol」 : ライフハッカー[日本版]

    「Symbol」はワンクリックで特殊文字をコピーできるサイトです。



    Symbol

    It provides a full list of symbol words with many categories which include star, love heart, smily, math, arrow, graphic and currency symbols. Click the symbol button will automatically copy to the clipboard.



    「Tick Symbol」というところに、レ点付きのチェックボックスの記号(☑)があった。

    特殊文字を一覧表にしてくれている「Symbol」は便利だな。

    プログラマのための文字コード技術入門 (WEB+DB PRESS plus) (WEB+DB PRESS plusシリーズ)
    矢野 啓介
    技術評論社
    2010-02-18
    2709円

    ●文字参照
    文字参照で、チェックボックスの記号が定義されているか、調べてみた。

    HTML特殊文字コード表
    特殊文字文字実体参照
    (実体参照)
    数値文字参照
    (文字参照)
    説明
    ☑チェック付チェックボックス


    レ点(チェックマーク)付きのチェックボックスの記号は、数値文字参照の「9745」で定義されていた。

    数値文字参照の定義について、調べてみた。

    文字参照 - Wikipedia

    文字参照(もじさんしょう、英: character reference)とはHTMLなどのSGML文書においては、直接記述できない文字や記号(マークアップで使われる、半角の不等号「<」や「>」など)を表記する際に用いられる方法である。
    SGML構成素のひとつとして定義されており、文書文字集合中の文字を参照する為の手段を提供する。
    HTMLにおける文字参照には、表記方法により数値文字参照と文字実体参照の二種が存在する。
    XMLにおいては、HTMLにおける「数値文字参照」を「文字参照」と呼ぶ。なおHTMLにおける「文字実体参照」は、XMLでは実体参照と呼び区別する。



    数値文字参照(文字参照)
    数値文字参照は、10進数もしくは16進数によって文書文字集合における該当文字をISO 10646の文字番号で指定する方法である。



    ISO/IEC 10646 - Wikipedia

    ISO/IEC 10646 (UCS; Universal Coded Character Set) は、符号化文字集合や文字符号化方式などを定めた、文字コードの国際標準のひとつで、業界規格のUnicodeと概ね互換であることが特徴である。日本の対応規格はJIS X 0221(国際符号化文字集合)。



    JIS X 0221 - Wikipedia

    JIS X 0221は、日本工業規格(JIS)の制定している文字コード規格の一つで規格の名称は「国際符号化文字集合(UCS)」、ISO/IEC 10646の国際一致規格である。



    はは~ん、なるほど!
    数値文字参照の定義は、JIS規格なら「JIS X 0221」で調べられると。


    ●OSのサポート状況
    文字参照で定義されていても、ブラウザやOS側で対応するフォントを持っていなければ、表示できないはずだ。
    OSが持っている文字コードは、ISOやJISの定義をどの程度サポートしているのだろうか?

    機種依存文字 - Wikipedia

    機種依存文字または環境依存文字とは、電子的に扱う文字データのうち、処理系(ソフトウェアおよびハードウェア)によって違う文字に表示されたり、全く表示・印刷できなかったりするものの慣用的な総称である。
    不特定多数との情報通信で機種依存文字を使用すると文字化けの原因にもなる。

    現在
    現在では、文字表示はオペレーティングシステム(以下OS)の役割となっており、使用するフォントセットによって拡張文字の表示は変化するため、「機種依存文字」の呼称は正確性を失うものとなった。また、機種依存文字の代表格だった丸囲い数字、ローマ数字などは Unicode(ユニコード)に収録され規格内のコードとなった。

    2000年代以降
    現在のほぼすべてのOSでは、さまざまな文字符号化方式(エンコーディング)に対応している。



    Unicode - Wikipedia

    Unicode(ユニコード)とは、符号化文字集合や文字符号化方式などを定めた、文字コードの業界規格である。文字集合(文字セット)が単一の大規模文字セットであること(「Uni」という名はそれに由来する)などが特徴である。
    1980年代に、Starワークステーションの日本語化(J-Star)などを行ったゼロックス社が提唱し、マイクロソフト、アップル、IBM、サン・マイクロシステムズ、ヒューレット・パッカード、ジャストシステムなどが参加するユニコードコンソーシアムにより作られた。
    1993年に、国際標準との一致が図られ、DIS 10646の当初案から大幅に変更されて、Unicodeと概ね[1]互換のISO/IEC 10646が制定された。


    →Microsoft、Appleが参加している。

    UTF-8 - Wikipedia

    UTF-8(ユーティーエフはち、ユーティーエフエイト)はISO/IEC 10646(UCS)とUnicodeで使える8ビット符号単位の文字符号化形式及び文字符号化スキーム。
    正式名称は、ISO/IEC 10646では‘UCS Transformation Format 8’、Unicodeでは‘Unicode Transformation Format-8’という。両者はISO/IEC 10646とUnicodeのコード重複範囲で互換性がある。RFCにも仕様がある。
    Linuxのように、OSの標準文字エンコードとして使用される例も増えている。


    →Linuxで採用されている。

    Unicode、UTF-8は、WindowsやMacOS、Linuxでサポートされている。
    つまり、数値参照文字を表示するフォントは、今時のOSなら持ってるはずと。
    フォントがなくても追加できる=MSは言語別のフォントパックを配布してる。

    Done Listを列挙するとき、☐☑☒を積極的に使おう!


    ●その他のサービス
    「Symbol」を提供しているpiliapp.comには、他にもいろいろ便利なサービス/ツールがあった。
    Measure width and height of any web page elements

    こういう機能って、ブラウザーのアドオン/プラグインでありそうだけど、どうなんだろ?

    ユニコード戦記 ─文字符号の国際標準化バトル
    小林龍生
    東京電機大学出版局
    2011-06-10
    2835円

    関連記事

    コメント

    コメントの投稿


    管理者にだけ表示を許可する

    トラックバック

    トラックバックURL:
    http://hamamuratakuo.blog61.fc2.com/tb.php/913-a61b66df

    FC2Ad