汉字在计算机中的存储编码涉及多个层面的转换,具体可分为以下几种类型:
输入码(外码)
用户通过键盘输入汉字时使用的编码,如拼音码、五笔码等。
机内码(内码)
汉字在计算机内部存储、处理和传输时使用的编码。由于计算机底层以二进制形式处理数据,而汉字是多字节的字符,因此需要转换为固定长度的编码形式。机内码是内码的扩展形式,通常比区位码多1位(如GB2312国标码扩展为GB18030),用于解决区位码中未使用的编码问题。
交换码(国标码)
用于计算机之间交换汉字信息的标准编码,如GB2312、GBK等。国标码是二维编码,每个汉字由两个七位二进制数组成,但存在重码现象(如“我”和“也”共用一个编码)。
字形码(字模码)
用于汉字输出(如显示或打印)的编码,描述汉字的点阵结构。字形码是最终显示汉字的依据。
总结
汉字在计算机中的存储编码流程为: 输入码 → 交换码 → 机内码 → 字形码。其中,机内码是计算机内部处理的核心编码形式。