En la discusión anterior, hemos ignorado la posibilidad de que el
resultado de una operación del punto flotante pueda no ser
representable mediante el esquema fijo (l-bits) empleado por el
ordenador. La magnitud más grande que puede representarse mediante la
fórmula general (18) es:
Ejemplo: Con q = 8 (y por tanto
F = 27 - 1 = 127), las
siguientes operaciones aritméticas dan lugar a desbordamiento por
exceso:
El desbordamiento por defecto (underflow en inglés)
se produce cuando el resultado de una operación en punto flotante es
demasiado pequeño, aunque no nulo, como para que se pueda expresar en
la forma dada por la ecuación (18). El número más pequeño
representable suponiendo que siempre trabajamos con mantisas
normalizadas es
,
en donde -F es el
exponente negativo más grande permitido (generalmente
-2-q-1). Por ejemplo, con q=8 resulta -F = -128.
Ejemplo: Con q = 8 (y por tanto -F = -128), la
siguiente operación aritmética da lugar a desbordamiento por defecto:
El desbordamiento por exceso es casi siempre resultado de un error en el cálculo. Sin embargo, en el caso del desobordamiento por defecto, en muchas ocasiones es posible continuar el cálculo reemplazando el resultado por cero.