1.4.1 数值编码
计算机中数的正负号也是用二进制数表示的。通常,数的符号用最高位表示,正号和负号分别用“0”和“1”表示。将符号数字化后的数被称为机器数,而用正负号(即+和-)表示的数被称为真值。为讲解方便,除非特殊说明,以后讲解中机器数都用一个字节(即8位)表示。比如在后面将要叙述的原码中,真值+110(二进制)对应的机器数为00000110,真值-110对应的机器数为10000110。
1.定点数与浮点数
在计算机中,小数点并不占据任何二进制位,其位置是通过约定实现的。若将小数点的位置约定在机器数的末段,该机器数就是定点整数;若将小数点的位置约定在符号位的右侧,该机器数就是定点小数。
2.原码、反码与补码
下面叙述常用的原码、反码和补码。
(1)原码
正数(含0)的符号位为0,负数(含0)的符号位为1,数值部分为对应数的绝对值,该表示法即为原码。
原码的最大优点是与真值间的相互转换容易实现,其主要缺点是算术运算不方便。
0的原码有两种编码,比如定点整数中的00000000和10000000,定点小数中的0.0000000和1.0000000。
8位定点整数原码的表示范围从-127(即-27+1)到+127(即27-1);8位定点小数原码的表示范围从-1+2-7到1-2-7,绝对值最小的非0数为-2-7(即1.0000001)和2-7(即0.0000001)。
(2)反码
正数(含0)的反码与原码一样,将负数(含0)原码除符号位外每位变反即可得到反码。
(3)补码
正数(含0)的补码与原码一样,将负数的反码末位加1即可得到对应的补码。表1-2和表1-3分别列出了4位定点整数和定点小数的补码、原码、反码以及十进制数的对应关系。
补码加减法运算非常方便,符号位可以像数值一样直接参见运算,因为补码有如下性质:
[[X]补]求补 = [-X]补
[X+Y]补 = [X]补 +[Y]补
[X-Y]补= [X]补 +[-Y]补 = [X]补 + [[Y]补]求补
求补是指包括符号位在内,每位变反,末位加1。对某个数的补码求补即可得到该数相反数的补码。
1.4.2 字母与字符编码
由于计算机中的基本物理器件是具有两个状态的器件,它只能直接表示和识别0和1这两个二进制数符。所以,在计算机中数是用二进制表示的,英文字母、各种运算符号、标点符号、汉字等都是用若干位二进制数码的组合即二进制编码来表示。
如前所述,字母和各种字符在计算机中也必须采用一种二进制编码来表示。当前使用最普遍的是ASCII码(American Standard Code forInformation Interchange,美国国家标准信息交换码),ASCII码被国际化标准组织确定为世界通用的国际标准。
1.4.5 多媒体信息压缩编码
1.数据压缩的含义
数据压缩是信息论的一个重要研究内容,称信源编码。就是以尽可能少的数据表示信源发出的信号,减少数据所占用的存储空间。信源编码主要是利用信源的统计特性,解决信源的相关性,去掉信源冗余信息,从而达到压缩信源输出的信息率,提高系统有效性的目的。第三代移动通信中的信源编码包括语音压缩编码、各类图像压缩编码及视频压缩编码。信源编码分为无失真编码有失真编码(或称限失真编码)。
2.数据压缩的必要性
计算机中存储和处理的信息除数值和文字外,还有各类被称为多媒体的信息,包括声音、图像、视频等。这些多媒体信息不同于字符编码,它们是连续变化的模拟信号,无法直接用计算机进行存储和处理,必须首先转换为由0和1组成的二进制位串,这一过程称为数字化。数字化后的媒体信息量很大,可以说是海量数据,与计算机存储资源和网络带宽有太大的差距。对多媒体信息的存储和传输带来巨大困难,所以数字化媒体数据压缩后存储和传输是非常必要的。
3.数据压缩的可能性
研究发现,多媒体信息表示中存在大量的冗余,通过去除冗余数据,达到减少多媒体数据量的目的。因此,数据压缩就是研究并去除多媒体冗余。