汉字的内外码是计算机处理汉字时使用的两种不同编码方式,具体区别如下:
一、内码(存储码)
定义 内码是汉字在计算机内部存储、处理和传输时使用的二进制编码。它将汉字转换为计算机能够识别的数字形式,是系统内部通用的编码标准。
特点
- 兼容性: 必须与ASCII码兼容且不冲突,通过将国标码每个字节的最高位加1(即“区位码+0x20”)实现转换。 - 示例
常见类型 - 字符编码:
如国标码、Unicode(Windows系统)、UTF-8等。
- 汉字内码:特指计算机内部存储的汉字编码。
二、外码(输入码)
定义 外码是用户通过输入设备(如键盘)输入汉字时使用的编码方式。由于键盘只有26个英文字母,无法直接输入汉字,因此需要通过拼音、笔画等规则将汉字转换为计算机可识别的代码。
特点
- 多样性: 包括拼音码(如拼音输入法)、五笔码、仓颉码等多种形式。 - 非唯一性
常见类型 - 拼音编码:
如全拼音、简拼输入法。
- 字形编码:如五笔字型、仓颉码等。
三、其他相关概念
交换码:用于不同系统或设备之间传输汉字的标准化编码,通常与内码一致(如Windows的Unicode)。
字形码:描述汉字具体字形的编码,与字体相关,同一内码可能对应不同字形(如宋体、黑体)。
总结
| 编码类型 | 功能 | 示例 | 特点 |
|----------|------------|--------------------|--------------------|
| 内码| 存储传输 | `D0A1`(“中”) | 兼容ASCII,避免冲突 |
| 外码| 输入 | 拼音码“mā” | 多样化输入方式 |
| 交换码| 系统间传输 | Unicode | 与内码一致 |
| 字形码| 文字显示 | 宋体字形代码 | 与字体相关 |
通过内码实现计算机内部处理,外码完成用户输入,交换码保障系统间兼容性,字形码则负责最终显示。