汉字的二进制表示主要通过字符编码实现,不同标准对应不同编码方式。以下是主要方法:
GB2312/GBK编码(2字节) 适用于简体中文,采用国标码表示。例如:
- 汉字“大”对应十六进制`B3F3`,转换为二进制为`10110011 11110011`。
- 汉字“小”对应十六进制`D0A1`,转换为二进制为`11010000 10100001`。
Unicode编码(3-4字节)
- UTF-8: 兼容性强,常用汉字多用3个字节(如“张”对应`GCZD`)。 - UTF-16