汉字的编码方式多种多样,主要分为以下几类:
一、常用汉字编码标准
GB2312 - 中国国家标准,包含6763个常用汉字及682个符号,采用二维矩阵编码法,将汉字映射到94×94的区位码中。
- 早期计算机系统(如DOS、Windows)的基础编码,兼容英文字符存储。
GBK
- GB2312扩展版,增加2万多个简繁体汉字及符号,是Windows系统默认编码。
GB18030
- 覆盖全中文字符(简/繁体及少数民族文字),是目前汉字编码标准中覆盖范围最广的。
Unicode(UTF-16)
- 国际通用编码,支持全球所有字符,采用双字节编码(如“啊”为B0A1H)。
- 现代软件和网络系统(如Web、iOS、macOS)主流采用。
二、编码特点与适用场景
单字节编码: 如ASCII(7位)仅支持128个字符,无法表示汉字。 双字节编码
兼容性:Windows系统同时支持GB2312/GBK和Unicode,但旧系统可能仅识别GB2312。
三、其他相关概念
输入码(外码):如拼音、五笔等,用于将汉字输入计算机。
内码:计算机内部存储的编码(如UTF-16),不同系统可能采用不同实现(如Windows的GB2312/Unicode混用)。
输出码:显示或传输时的编码,需与终端或浏览器兼容。
四、未来趋势
随着国际化需求增加, Unicode已成为主流,而 双轨制(如音码+形码)也在汉字输入领域逐步推广。