Aller au contenu principal

ブロック (Unicode)


ブロック (Unicode)


Unicodeにおいて、ブロック(英語: block)とは、符号位置 (code points) の連続する範囲を意味する。ブロックには一意に名前が付けられ、重なりはない。各ブロックは hhh0 形式の開始符号位置と hhhF 形式の終了符号位置を持つ。ブロックは、未割当 (unassigned) または非文字 (non-character) である符号位置 (en) を、明示的に含むことができる。名前付きのブロックのいずれにも属さない符号位置、例えば未割当の面である第4面-第13面に属する符号位置は、ブロックとして「No_block」という値を持つ。

逆に言えば、割当済 (assigned) の符号位置はすべて「ブロック名」(Block name) という特性 (property) を持つ。これはその文字 (character) があるブロックの名前である。これは符号位置のみによって決定されるが、ブロック名には説明的な性質がある。例えば「チベット文字」(Tibetan) や「補助矢印A」(Supplemental Arrows-A) が典型である。すべての割当済の符号位置は、それぞれ単一のブロック名を持つ。

その他の記号 (Miscellaneous symbols) ブロック中の「チェスシンボル」(Chess symbols) のような下位区分は、「ブロック」ではない。下位グループの名前は有益な編集上の追加でしかない。

一個のブロックに含まれる符号位置の数は16の倍数になる。ブロックの範囲の大きさは、最小で16個から、最大で65,536個の符号位置までである。

Unicode 9.0 では273個のブロックが定義されている 。

  • 第0面の基本多言語面 (Basic Multilingual Plane; BMP) に、161個。
  • 第1面の追加多言語面 (Supplementary Multilingual Plane; SMP) に、103個。
  • 第2面の追加漢字面 (Supplementary Ideographic Plane; SIP) に、5個。
  • 第14面(十六進数表記でE)の追加特殊用途面 (Supplementary Special-purpose Plane; SSP) に、2個 。
  • 第15面 (Fhex) と第16面 (10hex) の私用面に、それぞれ補助私用領域A (Supplementary Private Use Area-A)、補助私用領域B (Supplementary Private Use Area-B) という名前のブロックが1個ずつ。

ブロックの一覧

ブロックについてはUnicodeコンソーシアムに資料※があり、本一覧表との相違を本一覧表の次に示す。相違はおおむね本一覧表が古いことによる。 ※出元:15.1:<https://www.unicode.org/Public/15.1.0/ucd/Blocks.txt> ※出元:16.0 draft:<https://www.unicode.org/Public/draft/UCD/ucd/Blocks.txt>

脚注

出典

  • JIS X 0221:2014「国際符号化文字集合(UCS)」

関連項目

  • Unicode文字のマッピング
  • 用字 (Unicode)
    • ISO 15924
  • 面 (文字コード)

外部リンク

  • Official web site of the Unicode Consortium (English)
Collection James Bond 007

Text submitted to CC-BY-SA license. Source: ブロック (Unicode) by Wikipedia (Historical)


INVESTIGATION