首页 > 代码库 > 浮点数存储方式

浮点数存储方式

任何数据在内存中都是以二进制的形式存储的,例如一个short型数据1156,二进制表示形式为00000100 10000100。则在Intel CPU架构的系统中,存放方式为 10000100(低地址单元) 00000100(高地址单元),因为Intel CPU的架构是小端模式。但是对于浮点数在内存是如何存储的?目前,所有的C/C++编译器都是采用IEEE所制定的标准浮点格式,即二进制科学表示法

 

在二进制科学表示法中,S=M*2^N 主要由三部分构成:符号位+阶码(N)+尾数(M)。对于float型数据,二进制有32位,其中符号位1位,阶码8位,尾数23位;对于double 型数据,二进制为64位,符号位1位,阶码11位,尾数52位

                31        30-23       22-0

float       符号位     阶码        尾数

                63        62-52       51-0

double    符号位     阶码        尾数

 

符号位:0表示正,1表示负

阶码:阶码采用移码表示,对于float型数据规定偏置量为127,阶码有正有负。8位二进制,则表示范围为 -128~127,double型规定为1023,表示范围为-1024~1023。比如对于float型数据,若阶码真实值为2,加上127后为129,阶码表示形式为10000010

尾数:有效数字位,即部分二进制位(小数点后面的二进制位),因为规定M整数部分恒为1,所以1就不进行存储


下面举例说明:float型数据125.5转换为标准浮点格式

125二进制表示形式为1111101,小数部分表示二进制为1,则125.5二进制表示为1111101.1。由于规定尾数整数部分恒为1,则表示为1.1111011*2^6阶码为6加上127为133,表示为10000101。对于尾数将整数部分1去掉,为1111011后面补0使位数达到23位,则为111101100000000000000000

 

二进制表示形式为

0 10000101 1111011 00000000 00000000,内存存放方式为:

00000000   低地址

00000000

11111011

01000010   高地址


若要根据二进制形式求算浮点数如0 10000101 11110110000000000000000

由于符号为为0,则为正数阶码为133-127=6,尾数为11110110000000000000000,则真实尾数为1.1111011。大小为1.1111011*2^6,小数点右移6位得到1111101.1,而1111101的十进制为125,0.1的十进制为1*2^(-1)=0.5,大小为125.5

同理float型数据0.5转换为二进制形式:

0.5的二进制形式为0.1,由于规定正数部分必须为1,小数点右移1位,则为1.0*2^(-1),阶码为-1+127=126,表示为 01111110,而尾数1.0去掉整数部分为0,补齐0到23位00000000000000000000000,则其二进制表示形式为

0 01111110 00000000000000000000000

 

上述分析可知float型数据最大表示范围为1.11111111111111111111111*2^127=3.4*10^38。对于double型数据情况类似,只不过其阶码为11位,偏置量为1023,尾数为52位

 

测试程序:

hebfep:/home/hebfep>cat main.c

#include <stdio.h>

#include <stdlib.h>

int main(int argc, char *argv[])

{

    float a = 125.5;

    char *p = (char *)&a;

    printf("%d\n", *p);

    printf("%d\n", *(p+1));

    printf("%d\n", *(p+2));

    printf("%d\n", *(p+3));

    return 0;

}

hebfep:/home/hebfep>./a.out

0

0

-5

66


通过上面测试程序知道float型125.5在内存存放方式为:

00000000   低地址

00000000

11111011

01000010   高地址

因此,对于p和p+1指向的单元,存储的二进制数对应的十进制整数为0。对于p+2指向单元,因为是带符号char型指针,因此11111011,符号位为1为负数。由于内存二进制是以补码存储的,所以真值为-5。对于p+3指向单元,01000010为正数,则大小为66。上面程序输出结果验证了正确性

浮点数存储方式