追加漢字面
追加漢字面(ついかかんじめん、英: Supplementary Ideographic Plane, SIP)は、追加面の一つでISO/IEC 10646の第0群第2面およびUnicodeの第2面。基本多言語面に入りきらなかった漢字を収録する補足面の一つ。補助漢字面(ほじょかんじめん)とも呼ばれる。
符号化
追加漢字面の文字は、2バイト固定長方式のUCS-2では使用することが出来ず、UTF-8、UTF-16、UTF-32のいずれの符号化方式でも4バイトで符号化される。UTF-16ではサロゲートペア(代用対)を使う必要がある。
歴史
- 1996年7月 - Unicode 2.0でサロゲートペア(代用対)が導入され、補足面の存在が可能になった(ただしこの時点では基本多言語面以外の面に具体的な名称や用途は定められていなかった)。
- 2001年 - 3月制定のUnicode 3.1および11月制定のISO/IEC 10646-2:2001でBMP以外の追加多言語面、追加特殊用途面とともに面の具体的な内容が定義され、文字の割り当てが始まり、U+20000 - U+2A6DFにCJK統合漢字拡張Bとして漢字42711字が割り当てられた。
- 2008年 - 12月に発行されたISO/IEC 10646:2003の追補5において、U+2A700 - U+2B734にCJK統合漢字拡張Cとして漢字4149文字が割り当てられた。
- 2010年 - ISO/IEC 10646:2010にて、U+2B740 - U+2B81DにCJK統合漢字拡張Dとして漢字222文字が割り当てられた。
関連項目
外部リンク
|
---|
日本語用の 文字コード |
|
---|
日本語を含む 多言語文字集合 |
|
---|
日本語以外用の 文字集合 |
初期の文字コード | |
---|
ISO/IEC 8859 | |
---|
書誌用 |
- ISO 5426
- ISO 5426-2
- ISO 5427
- ISO 5428
- ISO 6438
- ISO 6861
- ISO 6862
- ISO 9036
- ISO 10585
- ISO 10586
- ISO 10754
- ISO 11822
- ANSEL
- MARC-8
|
---|
国家標準 | |
---|
EUC | |
---|
ISO/IEC 2022 |
- ISO/IEC 2022 CN
- ISO/IEC 2022 KR
- CCCII
|
---|
MacOSコードページ |
- Macintosh Standard Roman Character Set
- アラビア語
- CentralEurRoman
- EUC-CN
- Big5
- クロアチア語
- キリル
- デーヴァナーガリー
- Dingbats
- ペルシャ語
- ギリシア語
- グジャラート語
- グルムキー
- ヘブライ語
- アイスランド語
- EUC-KR
- ルーマニア語
- MacSymbol
- TIS-620
- トルコ語
- ウクライナ語
|
---|
DOSコードページ |
- 437
- 720
- 737
- 775
- 850
- 852
- 855
- 857
- 858
- 860
- 861
- 862
- 863
- 864
- 865
- 866
- 869
- KOI8
- Kamenicky
- Mazovia
- MIK
- Iran System
|
---|
Windowsコードページ | |
---|
EBCDIC コードページ | |
---|
その他標準 | |
---|
記号用 | |
---|
プラットフォーム 固有 |
- ATASCII
- CDC display code
- DEC Radix-50
- Fieldata
- GSM 03.38
- HP roman8
- PETSCII
- TI calculator character sets
- ZX Spectrum character set
|
---|
|
---|
ソフトウェア | |
---|
区分け | |
---|
概念 | |
---|
関連トピック | |
---|
カテゴリ |