汉字的区码由 区号和位号组合构成,具体如下:
基本结构 区位码采用双字节表示,其中 高两位为区号,低两位为位号
。例如,汉字“啊”的区位码为`0xB0A1`,其中`B0`为区号(16×16=256),`A1`为位号(1×16+1=17)。
取值范围
- 区号: 1-94(共94个区) - 位号
因此,区码和位号均为两位十进制数,组合后总共有94×94=6763个汉字编码。
功能区分 - 1-9区:
682个非汉字符号(如标点、数字等)
- 16-55区:一级常用汉字(3755个,按拼音排序)
- 56-87区:二级次常用汉字(3008个,按部首排序)。
应用场景
区位码是GB2312编码标准的基础,用于汉字的输入、存储和显示。在计算机系统中,通过将区号和位号分别转换为十六进制后组合成双字节编码。
总结:
汉字区码由1-94的区号和1-94的位号组成,通过组合形成双字节编码,用于区分汉字及符号。