用户:Mrhso2014/普及区

本页面有关 Wikipedia:Unicode扩展汉字

在 ISO 10646,一个字符集,里面有 CJKV 统一表意文字,收录了喃字、简化字、繁体字等。Unicode 与其保持同步。

中日韩越统一表意文字也有扩展区,一些生僻字、类推简化在扩展区是有的,例如扩展 E 区就有“𬎆”。截至 2017 年,正式发布的扩展区就有兼容扩展、扩展 A 区、扩展 B 区、扩展 C 区、扩展 D 区、扩展 E 区、扩展 F 区。

目前仍然有很多汉字没有被收录进 Unicode,关于汉字的收录其实和 IRG 有关。

GB 18030 是一种特殊的 UTF,为了兼容 GB 2312 形成了诡异的排序。根据 Ishisashi 制作的 GB 18030Unicode Code Point 的对应表,可以看出 GB 18030 的基本结构。

GB 18030 完全兼容 GB 2312,多数兼容 GBKGB 18030 除了相对 GBK 映射到 PUA 的汉字映射有改变以及欧元的调整外,基本是兼容的。

GB 18030 的报批稿中同时有单字节和双字节欧元,在正式版删去。