IEEE 754 Rounding‐Modes

(1)

+ / −

IEEE 754 Rounding‐Modes

Synonym Ergebnis Beispiel 21,7 Beispiel ‐21,7 Round

toward +∞

Ceil Kleinster Wert nicht kleiner als M Round

toward

−∞

Floor Größter Wert nicht größer als M

Round toward 0

Truncate Genau M

Round to

nearest

Wert, der am nächsten zu M liegt

Mantisse M G R S

(2)

IEEE Rounding‐Modes: Round to Nearest

Eingabe Form bei Tie Rundung Ergebnis M Mantisse|000 Same M = Mantisse

Mantisse|001 Down M = Mantisse

Mantisse|100 (Tie)

...0|100 Down M = Mantisse

...1|100 Up M = Mantisse + 1

Mantisse|101 Up M = Mantisse + 1

Mantisse G R S

(3)

Quiz

Was ist das Rundungsergebnis bei Round‐to‐Nearest für folgende Instanzen von „8‐Bit‐Mantisse | Guard‐Round‐Sticky“?

A.) 0000 1101 | 110

B.) 0011 0011 | 100

C.) 0101 0101 | 010

GRS Mantisse Richtung

001 Down

010 Down

011 Down

100 ...0 Down

...1 Up

101 Up

110 Up

111 Up

Übersicht zu Round‐to‐Nearest

(4)

Beispiel für die Genauigkeitssteigerung

Wir betrachten 8‐Bit Mantissen. Zu addieren sei:

1,100 0110 * 2⁶ (dezimal = 99,0000) + 1,011 1010 * 2² (dezimal = 5,8125) (Summe dezimal = 104,8125) Das Mantissen‐Alignment und GRS‐Bits kennen wir schon, also:

Rechnung: Mantisse|GRS Mantisse 11000110|000 11000110 + 00001011|101 + 00001011 --- --- 11010001|101 11010001 Rundung: 11010010 ohne 11010001

Ergebnis: 1,1010010 * 2⁶ 1,1010001 * 2⁶ Dezimal : 105,0 104,5

Also hat man mit GRS‐Bits und Rundung einen Abstand von 105,0 –

104,8125 = 0,1875. Ohne GRS‐Bits und Rundung ist der Abstand 104,8125 – 104,5 = 0,3125.

(5)

Denormalized‐Numbers

Kleinste mit IEEE754 Single‐Precision darstellbare normalized Zahl > 0:

1,000 0000 0000 0000 0000 0000 * 2⁻¹²⁶

Der Exponent −127 ist für die 0 reserviert; die Fraction ist dabei 0:

.,000 0000 0000 0000 0000 0000 * 2⁻¹²⁷

Warum die Fraction für Exponent −127 nicht sinnvoll nutzen?

Eine Denormalized‐Number der Form

.,000 1010 1110 1000 1111 0011 * 2⁻¹²⁷ bedeutet:

0,000 1010 1110 1000 1111 0011 * 2⁻¹²⁶

Somit, kleinste mit IEEE754 Single‐Precision darstellbare Zahl > 0:

0,000 0000 0000 0000 0000 0001 * 2⁻¹²⁶ = 1,0 * 2⁻¹⁴⁹

(6)

Was ist mit denormalized Numbers bei IEEE 754 Double‐Precision die kleinste darstellbare Zahl > 0?

Quiz

Erinnerung:

IEEE 754 Double‐Precision:

Fraction: 52 Bits

Exponent‐Bias: 1023

(7)

Webseiten‐Tipp zum Üben

users‐tima.imag.fr/cis/guyot/Cours/Oparithm/english/Flottan.htm

Floating point numbers format

Addition and subtraction

Rounding to the nearest

(8)

Zusammenfassung und Literatur

(9)

Zusammenfassung

• Rechnerarithmetik endlich und stimmt damit nicht exakt mit Arithmetik über reellen Zahlen überein

– Häufig Approximation realer Zahlen – Assoziativgesetz gilt z.B. nicht

– Hat z.B. Konsequenz auf paralleles Rechnen

• Beschränkter Zahlenbereich

– Overflow, Underflow

• Wichtigste Entwicklung über die Jahre

– Zweierkomplement und IEEE 754

– In jedem modernen Computer so

(10)

Quiz

Annahme es gäbe ein 16‐Bit IEEE 754 Floating‐Point‐Format mit 5 Bits für den

Exponenten. Welcher Zahlenbereich wird durch dieses Format abgedeckt?

A: 1.0000 0000 00 * 2⁰ bis 1.1111 1111 11 * 2³¹, 0

B: +/‐ 1.0000 0000 0 * 2^‐14 bis +/‐ 1.1111 1111 1 * 2¹⁵ +/‐ 0, +/‐ , NaN

C: +/‐ 1.0000 0000 00 * 2^‐14 bis +/‐ 1.1111 1111 11 * 2¹⁵, +/‐ 0, +/‐ , NaN

D: +/‐ 1.0000 0000 0 * 2^‐15 bis +/‐ 1.1111 1111 1 * 2¹⁴, +/‐ 0, +/‐ , NaN

(11)

IEEE 754 Rounding‐Modes