JavaIO字符、字节和编码

mac2022-06-30  243

【声明】本文参考自极客学院视频

1、字节(Byte) 字节是通过网络传输信息或在硬盘或内存中存储信息的单位,是计算机信息技术用于计量存储容量和传输容量的一种计量单位。 1个字节等于8位二进制,即一个8位的二进制数,是一个很具体的存储空间。 如0x01,0x45,0xFA…

2、字符(char) 字符是人们使用的记号,抽象意义上的一个符号。 如’1’,‘中’,‘a’,’$’,‘¥’…

3、字符集(charset) 字符集也成为“编码”。 各个国家和地区所制定的不同ANSI编码标准中,都只规定了各自语言所需的“字符”。 这些ANSI编码标准所规定的内容包括两层含义: (1)字符集。使用哪些字符。 (2)编码。规定每个字符分别用一个字节还是多个字节存储,用哪些字节来存储。 各个国家和地区在制定编码标准时,字符集和编码一般都是同时制定的。

4、ANSI 字符串在内存中,如果字符以ANSI编码形式存在的,一个字符可能使用一个字节或多个字节来表示,那么我们称这种字符串为ANSI字符串或多字节字符串。不同ANSI编码所规定的标准是不同的。因此,对于一个给定的多字节字符串,我们必须知道它采用的是哪一种编码规则,才能知道它包含了哪些字符。

5、UNICODE 字符串在内存中,如果字符以UNICODE编码形式存在的,那么我们称这种字符串为UNICODE字符串或宽字节字符串。对于UNICODE字符串来说,不管在什么环境下,它所代表的字符内容总是不变的。用来给UNICODE字符集编码的标准有很多种,比如:UTF-8,UTF-7,UTF-16,UnicodeLittle,UnicodeBig等。


最新回复(0)