汉字信息在计算机中通常以 机内码形式存储,具体说明如下:
存储形式 汉字在计算机内部以 机内码
(又称汉字ASCII码)存储,这是计算机处理、传输和存储汉字时使用的二进制代码。
与国标码的区别
- 国标码: 为每个汉字分配唯一编号(如GB2312编码中每个汉字2字节),但与ASCII码存在冲突(如30H和21H同时表示汉字“啊”和ASCII字符“0”)。 - 机内码
编码标准演变 - 早期主要使用 GB2312
等国标码,每个汉字2字节。 - 现代系统更广泛采用 Unicode(如UTF-8),支持多语言字符集,汉字通常以1-4个字节表示,兼容性更强。
其他相关概念
- 区位码: 早期汉字编码方式,通过行列定位汉字,需转换为机内码使用。 - 字形码
总结:当前主流存储方式为 机内码(基于Unicode的UTF-8),兼顾兼容性与扩展性;早期系统多采用国标码,需转换后使用。