汉字在计算机中的编码涉及多个层面的术语,具体如下:
内码(机内码) 指汉字在计算机内部存储、处理和传输时使用的编码。目前最常用的是 Unicode码
(也称为 字符编码),它能够表示全世界的汉字、字母和符号。例如,汉字“中”的内码可能是`E4BDA0`(具体数值因编码标准不同而有所差异)。外码(输入码) 指用户通过输入设备(如键盘)输入汉字时所使用的编码。常见的输入码包括:
- 拼音码:
指用户通过输入设备(如键盘)输入汉字时所使用的编码。常见的输入码包括:
- 拼音码:
按汉字读音输入,如全拼(zhōng)、简拼(zhōng)、双拼(zhōng-gōng)
- 区位码:按汉字在字库中的位置编码
- 字型码:部分输入法(如五笔)按笔画或部首编码
交换码(国标码) 指计算机之间传输汉字信息时使用的标准编码,如 GB2312
、 GBK等。国标码是内码的扩展,通过将内码的两个字节的最高位加1得到。
字形码
指汉字的字形信息,通常以点阵或向量形式存储,用于在屏幕或打印设备上显示汉字。
总结关系图:
```
用户输入(拼音码/区位码) → 外码 → 交换码 → 内码 → 字形码 → 显示
```
常见误区
误将“内码”称为“ASCII码”:实际上,ASCII码仅支持英文字符,而汉字需使用专门的编码(如GB2312、Unicode)。
混淆“字形码”与“内码”:字形码是显示用的,而内码是存储用的。
希望以上解释能帮助你理解汉字在计算机中的编码体系。