IEEE浮点标准

首页 > 代码库 > IEEE浮点标准

2024-08-03 21:34:04 219人阅读

　　原文地址：http://www.math.byu.edu/~schow/work/IEEEFloatingPoint.htm

Floating point system

Floating point arithmetic

　　浮点型标准是什么？

　　IEEE浮点标准是上世纪80年代初由IEEE采用的一个浮点计算系统。

　　计算机采用IEEE浮点标准的要求：

　　1.正确计算舍入；

　　2.浮点数应该被计算机正确表示；

　　3.异常处理应该是明确一致的。

　　引用：见顶部

　　浮点数表示法

　　32位机的单精度数：

　　32位机的单精度模式会将一个字表示为b1b2b3...b9b10b11...b32的实数形式

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　(-1)^s x 2^e-127 x (1.f)₂

　　　where s = b₁, e = (b₂...b₉)₂, and f = b₁₀b₁₁...b₃₂.

符号位	偏移指数	正常数字尾部的分数
1 bit	8 bits	23 bits
s	e	f

　　　需要注意的是，尾部的分数部分由一个隐藏位和实际尾部数字共24位二进制数存储。

　　32位的双精度数

　　32位机的双精度模式会将两个字表示为b₁b₂b₃...b₁₂b₁₃b₁₄...b₆₄ 的实数形式

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　(-1)^s x 2^e-1023 x (1.f)₂

　　where s = b₁, e = (b₂...b₁₂)₂, and f = b₁₃b₁₄...b₆₄.

符号位	偏移指数	尾部的小数
1 bit	11 bits	52 bits
s	e	f

　　尾部的分数部分由一个隐藏位和实际尾部数字共53位二进制数存储。

　　32位机浮点数的十进制值：

	单精度	双精度
Machine epsilon	2^-23 or 1.192 x 10^-7	2^-52 or 2.220 x 10^-16
最小正数	2^-126 or 1.175 x 10^-38	2^-1022 or 2.225 x 10^-308
最大正数	(2- 2^-23)2¹²⁷ or 3.403 x 10³⁸	(2- 2^-52) 2¹⁰²³ or 1.798 x 10³⁰⁸
最小负数	2^-150 or 7.0 x 10^-46	2^-1075 or 2.5 x 10^-324
十进制精度	6 位标识	15 位标识

　　　　　　　　（Machine epsilon：大于1的机器所能表示的最小浮点数；Smallest subnormal：低于最小值？无穷小？）　　　　

　　　　　　　　(In computer science, denormal numbers or denormalized numbers (now often called subnormal numbers) fill the underflow gap around zero in floating-point arithmetic. Any non-zero number with magnitude smaller than the smallest normal number is ‘subnormal‘.)

　　IEEE标准舍入

　　通常使用舍入到最近值的方式。基本上，给定一个实数x，它正确的舍入值是最接近x的浮点数fl(x)。

　　IEEE浮点标准的特殊值

　　单精度表示

	标志位	指数偏移	小数部分
	1 bit	8 bits	23 bits
7/4	0	0 1 1 1 1 1 1 1	1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
-34.432175	1	1 0 0 0 0 1 0 0	0 0 0 1 0 0 1 1 0 1 1 1 0 1 0 1 0 0 0 1 1 0 0
-959818	1	1 0 0 1 0 0 1 0	1 1 0 1 0 1 0 0 1 0 1 0 1 0 0 1 0 1 0 0 0 0 0
+ 0	0	0 0 0 0 0 0 0 0	0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
- 0	1	0 0 0 0 0 0 0 0	0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
macheps	0	0 1 1 0 1 0 0 0	0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
"smallest"	0	0 0 0 0 0 0 0 1	0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
"largest"	0	1 1 1 1 1 1 1 0	1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
infinity	0	1 1 1 1 1 1 1 1	1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
NaN	0	1 1 1 1 1 1 1 1	Not all 0s or 1s
2^-128**	0	0 0 0 0 0 0 0 0	0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

　　　（macheps = machine epsilon，infinity：无穷大）

　　**这些是非标准数。这些数计算机可以表示，但是相比于正常值，它们的精度要低一些。

IEEE浮点标准

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > IEEE浮点标准

IEEE浮点标准

看完仍有疑问？有类似问题直接问程序猿