计算机中汉字的转换涉及多种编码方式,主要包括以下几种:
一、汉字的输入编码(外码)
全码输入 :直接输入汉字的完整编码(如国标码)简码输入:
使用拼音或全码的简化形式(如“zhong”代替“zhongguo”)
输入法无关性:
输入码转换为机内码的过程由操作系统统一处理,与具体输入法无关
二、汉字的存储与处理编码(机内码)
定义:
计算机内部存储、处理和传输汉字时使用的二进制代码
转换方式:
基于汉字国际码(GB2312/GBK)加8080H(十六进制)转换
作用:
解决国标码与ASCII码冲突的问题,是汉字处理的核心编码
三、汉字的输出编码(字形码)
定义:
将汉字转换为点阵或矢量图形的编码,用于显示或打印
常见形式
- 点阵码:
如16×16点阵汉字占用2字节
- 矢量码:通过数学公式描述字形,占用较少存储空间
转换过程:
操作系统根据机内码在字模库中查找对应字形码
四、其他相关编码
交换码(国标码):汉字信息交换的标准编码,但需修改最高位为1才能转为机内码
扩展信息:部分系统可能使用Unicode等更广泛的编码标准
总结流程
输入:
用户通过输入法输入汉字(外码)
转换:
操作系统将外码转换为机内码
存储/处理:
机内码用于内部运算
输出:
根据需要转换为字形码并显示或打印
通过以上编码体系,计算机能够实现汉字的输入、存储、处理和输出。