汉字在计算机中通常采用 Unicode编码进行存储,对于汉字来说,常用的是UTF-8编码。
Unicode编码是一种国际通用的字符编码标准,它涵盖了世界上大多数语言的字符,包括汉字。UTF-8是Unicode编码中的一种实现方式,它使用可变长度的字节序列来表示字符,对于汉字,UTF-8通常使用3个字节来表示。
在计算机内部,汉字的存储和处理主要依赖于机内码。机内码是计算机内部存储、处理和传输汉字时所使用的编码,它与输入码、输出码和字型码不同。输入码是用户通过键盘输入汉字时使用的编码,输出码是汉字在屏幕上显示或打印机输出时使用的编码,而字型码则用于描述汉字的字形信息,通常以点阵形式存储。
因此,对于汉字的存储,主要采用的是Unicode编码中的UTF-8形式,而在计算机内部处理时,则使用机内码。