汉字编码主要分为以下五类,按使用范围和兼容性排序如下:
GB2312 - 特点:
国内最早的汉字编码标准,收录6763个汉字及符号,采用双字节(区位码)表示,适用于中国大陆及新加坡等地。 - 适用场景:早期中文系统、部分国际化软件(如旧版操作系统)。
GBK - 特点:
GB2312的扩展版,增加繁体中文支持,兼容更多字符,覆盖国内主流应用场景。 - 适用场景:Windows系统、网页浏览器等。
GB18030 - 特点:
更完善的汉字编码标准,包含简体、繁体及少数民族文字,兼容性最佳。 - 适用场景:现代操作系统、多语言软件。
Unicode(UTF-8) - 特点:
国际通用编码,支持超过14亿字符,兼容多种语言文字,包括汉字、英文等。 - 适用场景:网页、数据库、国际化应用。
ASCII码 - 特点:
基础编码标准,仅支持128个字符(含英文、数字等),不直接用于汉字。 - 适用场景:特定场景下的简单字符处理(如控制字符)。
总结:国内主流场景优先使用 GB18030或 GBK,国际通用场景推荐 UTF-8。