单个汉字在计算机中主要使用 内码进行存储和识别,具体编码方式如下:
内码定义 指汉字在计算机内部存储时使用的二进制编码,用于唯一标识每个汉字。在简体中文系统中,常见的内码包括GB2312、GBK和Unicode的UTF-16编码,码长通常为16位(2个字节)。
编码关系
- 国标码转内码: 内码 = 国标码 + 80H(十六进制)。例如,GB2312国标码的汉字,内码需在国标码基础上加80H。 - 国际码与内码
其他相关编码 - 输入码(外码):
用户通过键盘输入时使用的编码,如拼音码、区位码等,不同输入法对应不同的外码。 - 字形码(字模码):存储汉字具体字形的编码,采用点阵式存储(如16×16、32×32点阵),占用不同空间。
总结:单个汉字在计算机内部以 内码形式存在,用于存储和系统识别;用户输入时使用 外码,系统输出时转换为 字形码。