二进制数据中的一个位(bit)简写为b,音译为比特,是计算机存储数据的最小单位。一个二进制位只能表示0或1两种状态,要表示更多的信息,就要把多个位组合成一个整体,一般以8位二进制组成一个基本单位。计算机内部数据以二进制的形式存储和运算的,一字节表示8位(在二进制里面8位长),一个汉字是两个字节,也就是16位。计算机型号不同其字长不同,常用的字长有8、16、32和64位。一般情况下IBM PC/XT的字长为8位,80286微机字长为16位,80386/80486微机字长为32位,Pentium系列微机字长为64位。不同的计算机型号使用不同的长度。为了避免混乱,在大多数国际文献中,使用byte代替。字节(Byte)是计算机数据处理的最基本单位,简记为B,每个字节由8个二进制位组成,即1B=8bit。一个ASCII码占用一个字节,一个汉字国际码占用两个字节。数据的换算关系:
1B(字节)=8b(位),1 KB = 1024 B,1 MB = 1024 KB,1 GB = 1024 MB,1TB = 1024GB。
不同的编码格式占字节数:
s.getBytes(encodingName).length
单个英文字母:
字节数:1;编码:GB2312
字节数:1;编码:GBK
字节数:1;编码:GB18030
字节数:1;编码:ISO-8859-1
字节数:1;编码:UTF-8
字节数:4;编码:UTF-16
字节数:2;编码:UTF-16BE
字节数:2;编码:UTF-16LE
单个中文汉字:
字节数:2;编码:GB2312
字节数:2;编码:GBK
字节数:2;编码:GB18030
字节数:1;编码:ISO-8859-1
字节数:3;编码:UTF-8
字节数:4;编码:UTF-16
字节数:2;编码:UTF-16BE
字节数:2;编码:UTF-16LE