二进制记录汉字主要通过编码转换和存储实现,具体分为以下五个核心步骤:
一、编码转换过程
外码转国标码 输入的汉字通过输入法(如拼音、五笔)转换为对应的国标码(GB2312编码),例如“大”字的国标码为B3F3H。
国标码转机内码
机内码=国标码+8080H。例如“大”字的机内码为B3F3H+8080H=BBE3H。
机内码转字形码
字形码用于存储汉字的点阵数据,通常采用16×16点阵,每个点用1位二进制表示,例如“大”字的字形码为BBE3H对应的二进制数据。
二、存储与显示机制
二进制存储
汉字以二进制形式存储在计算机内存中,包括机内码和字形码。例如,16×16点阵的汉字需32字节存储空间。
点阵显示
字形码通过点阵数据控制显示器或打印机输出汉字。例如,点阵中1表示点亮,0表示不点亮。
三、扩展与优化
扩展编码: GB2312仅支持7000多个汉字,后续采用GBK、UTF-8等扩展编码,支持更多字符。 压缩技术
四、关键术语总结
外码:输入码(如拼音、五笔)。
国标码:GB2312编码。
机内码:计算机内部处理码(如GBK)。
字形码:点阵数据,用于显示。