汉字机内码的生成过程涉及多个编码层级,具体关系如下:
区位码转国标码
区位码(十进制)的两个字节分别转换为十六进制后加2020H(即十进制的3232),得到国标码(十六进制)。
国标码转机内码
国标码的两个字节的最高位(第7位)分别加1(即加80H),得到机内码。 例如:
- 国标码:4E2D(十六进制)
- 机内码:561D(十六进制)
机内码的物理存储形式
机内码以二进制形式存储在计算机内存中,通常用十六进制表示以便于人类阅读和调试。
补充说明
机内码的设计确保了与ASCII码的兼容性,因为每个字节的最高位都加了1,避免了与ASCII码的冲突。
输入的汉字外码(如拼音或全码)需要通过输入法转换为对应的国标码,再由系统转换为机内码后才能被计算机处理。
通过以上步骤,汉字机内码从国标码转换而来,确保了汉字在计算机系统中的唯一性和兼容性。