《信息交换用汉字编码字符集基本集的扩充》 — 即国家标准GB18030-2000
2000年3月,国家信息产业部和质量技术监督局在北京联合发布了《信息技术和信息交换用汉字编码字符集、基本集的扩充》,国家标准号为:GB18030-2000,收录了27000多个汉字,还收录了藏、蒙、维等主要少数民族的文字,该标准于2000年12月31日强制执行。 GB 18030-2000 作为 GBK for Unicode 3.0 的更新而诞生,并且 作为GB2312-1980《信息交换用汉字编码字符集 基本集》的扩展,向下兼容 GBK 和 GB2312-80 标准。GB18030 编码是一二四字节变长编码:一字节部分从 0x0~0x7F 与ASCII 编码兼容。二字节部分, 首字节从 0x81~0xFE, 尾字节从0x40~0x7E 以及0x80~0xFE,与 GBK标准基本兼容。四字节部分, 第一字节从 0x81~0xFE, 第二字节从 0x30~0x39, 第三和第四字节的范围和前两个字节分别相同。四字节部分覆盖了从 0x0080 开始, 除去二字节部分已经覆盖的所有Unicode3.0码位。也就是说, GB18030 编码在码位空间上做到了与Unicode 标准一一对应,包含了CJK + CJK扩展A的全部汉字。
GB18030是我国继GB2312-1980和GB13000-1993之后最重要的汉字编码标准,是未来我国计算机系统必须遵循的基础性标准之一。 编码空间超过150万个码位,为彻底解决邮政、户政、金融、地理信息系统等迫切需要的人名、地名用字问题提供了解决方案,也为汉字研究、古籍整理等领域提供了统一的信息平台基础。
微软官方GB18030支持包下载地址:http://www.microsoft.com/china/windows2000/downloads/18030.asp