汉字内码是计算机内部用于存储、处理和传输汉字的编码方式,其本质是 二进制编码。以下是具体说明:
编码基础
汉字内码采用 二进制形式,每个汉字由16位(2个字节)组成。例如:
- “中”字的内码为 D6D0(十六进制),对应二进制为 1101 0000 1010 0001。
与ASCII码的关系
- ASCII码使用7位或8位二进制表示(128或256个字符),无法直接表示汉字。
- 汉字内码在国标码(如GB2312)基础上加80H(二进制10000000),避免与单字节ASCII码冲突。
编码规则
- 国标码:每个汉字用两个7位二进制编码(14位),如“中”的国标码为 11100001 10000010(十六进制D6D0)。
- 内码:在国标码基础上加80H,即每个字节的最高位设为1,例如“中”的内码为 11100010 10000100(十六进制D6D0)。
扩展与兼容性
- GBK、GBK等编码在国标码基础上扩展,兼容更多汉字。
- Unicode(如UTF-16)采用双字节或四字节编码,简体中文常用16位(双字节)表示,生僻字可能用四字节。
总结:汉字内码是计算机内部以二进制形式存储汉字的编码体系,通过加80H转换规则实现与ASCII码的兼容,并支持多种汉字扩展标准。