汉字编码根据应用目的和实现方式的不同,主要分为以下四类:
一、输入码
用于将汉字输入到计算机中的编码方式,需与英文键盘兼容。常见类型包括:
拼音码 (如全大写拼音)五笔字型码
区位码: 通过汉字在94×94区位表中的位置表示 根据汉字笔画顺序编码 根据字形特征编码 二、交换码(信息交换码) 用于计算机之间传输汉字信息的编码,通常为二进制形式。例如: 国标码自然码:
表形码/认知码:
区位码:扩展为11位二进制数(如“我”对应11101110)
三、机内码
计算机内部存储和处理的编码方式。我国目前普遍采用:
GB2312码:简体汉字编码,包含6763个汉字
GBK码:在GB2312基础上扩展至2万多个汉字
Unicode码:全球通用编码,支持所有汉字及符号
四、字形码
用于计算机显示或打印汉字的编码方式,需与字体文件关联。例如:
字形表:存储每个汉字的点阵或向量信息
位图字体:如TrueType、OpenType等
补充说明
扩展编码:如Big5码(繁体汉字)、HZ码(简繁混用)等
编码标准:国标、区位“准国标”等
以上分类综合了不同应用场景下的编码需求,覆盖了从输入到输出的完整流程。