编码
编码是指信息按照某种格式转化为另一种格式的过程。
在计算机领域编码主要分为字符编码、条形码、二维码、声音编码、图像编码、视频编码
计算机存储容量单位
计算机中最小的存储单位:位,bit或b
计算机中基本单位:字节,Byte或B
1字节=8位
常用单位间的换算关系:
1B=8 bit
1KB=1024B
1MB=1024KB
1GB=1024MB
1TB=1024GB
字符编码
常见有ASCII、Unicode以及各种汉字编码
ASCII码(American Standard Code for Information Interchange,美国信息交换标准代码)是一套基于拉丁字母的计算机编码系统。
ASCII码共有128个字符,由数字、字母、特殊符号组成。用1个字节中的低7位编码。二进制范围为00000000·01111111,即一六进制的00~7F。下图为ASCII码表
汉字编码分为输入码、交换码、 字形码和机内码。
在计算机系统中,输入码、交换码、机内码、字形码之间的关系如下图:
根据国标码的规定,每一个汉字都有确定的二进制代码,在计算机内部汉字代码都用机内码,在磁盘上记录汉字代码也使用机内码,在早期的GB2312字符集中,1个汉字在计算机中用2个字节表示。如图1.3.5中的“中国China”这几个字符,其中“中国”两个汉字的内码为D6 DO B9 FA,用二进制表示就是110101101101000010111001 11111010;而英文字符“China”是ASCI字符,其中每个字母都用1个字节编码表示。
ASCII码和GB2312码的区别
两个都为交换码,他们在内码中表示的区别如下
ASCII码在内码中占1个字节,用1个内码表示,为半角字符
GB2312码在内码中占2个字节,用2个内码表示,为全角字符
如何在UltraEdit中判断内码
上图中,32H对应字符“2”,A3 ACH 对应字符“奥”
声音编码
声音是振动产生的声波,通过介质(空气、固体或液体)传播并能被人或动物的听觉器官所感知的
Wave格式音频文件的存储容量可以通过下面的公式进行计算:
音频容量=采样频率(Hz)x量化位数( bit)x声道数x时长(s)/8
图像编码
图像分为矢量图和位图,矢量图与位图之间的区别如下:
①矢量图形由指令集合或数学公式描述,色彩少,存储容量小,任意放大其清晰度不变。
②位图图像通过像素点描述,色彩丰富,存储容量大,放大或缩小其清晰度会变化。
位图图像又称栅格图或点阵图,将图像数字化也需要经过采样、量化、编码等环节。图像的采样就是把一张图像分解成一个一个大小相同的点,这些点称作像素,是组成位图图像的基本单位。图1.3.8甲为512x320像素的图像,也就是水平方向有512个像素,垂直方向有320个像素,而图1.3.8乙由32x20像素组成。可以直观地看出,点越多,图像越真实,越能体现细节,同时也需要更多的存储空间。
图像容量计算公式如下:
图像容量=水平像素x垂直像素x颜色位深度/8
其中颜色位深度为:表示一个像素点颜色数量所需要的二进制位数。
常见的颜色对应的位数如下:
16色——4b
16位色——16b
256色——8b
黑白两色——1b
256级灰度——8b
RGB/8——24b
视频编码
静态的图像连续播放就形成视频,如早期的模拟电视中,
PAL制式的视频每秒播放25帧图像
NTSC制式的视频每秒播放30帧图像。
视频的容量公式:
视频容量=图像容量x帧频x时长(s)/8