Precedente Indice Successivo



Capitolo 1


Sistemi aritmetici


Per sistema aritmetico s'intende un criterio di rappresentazione dei dati di tipo numerico e le relative operazioni aritmetiche definite su di loro. Ogni volta che si utilizza uno strumento di misurazione, le misure ottenute avranno senso soltanto se è nota la sensibilità dello strumento, in altre parole la capacità di discriminazione dello strumento.

In un elaboratore, utilizzante il sistema di numerazione binario, un numero reale x è rappresentato in una forma detta floating-point, consistente nello scrivere il numero come prodotto di una parte frazionaria per una potenza della base di sistema, in altre parole x = f * be. Tale rappresentazione non è, tuttavia, unica. E' possibile, infatti, scrivere x come f' be-p con f'= f * be. Occorre quindi un criterio non ambiguo che fissi la rappresentazione in maniera univoca. Si è convenuto che la prima cifra della parte frazionaria sia diversa da zero, in modo che, fissata la base, il numero x = m * be sia univocamente determinato dalla coppia (m, e), in cui m è la mantissa ed e l' esponente. Questa rappresentazione è detta normalizzata. In questa rappresentazione il numero di cifre di m coincide con il numero di cifre espressive di x.

A causa della sua capacità di memoria finita un calcolatore non è in grado di rappresentare esattamente l'intero insieme dei numeri reali, ma soltanto un sottoinsieme finito, F, di essi, che sarà, quindi, dotato di un minimo e di un massimo. Tutti i numeri appartenenti all'intervallo I (intervallo di rappresentabilità), avente tali coppia d'estremi, potranno essere esattamente rappresentati o approssimati da elementi di F. Le operazioni elementari eseguite su tali numeri possono, a loro volta, generare dei risultati non rappresentabili esattamente nel calcolatore. La cardinalità di F dipende dalla lunghezza della voce di memoria utilizzata per la rappresentazione di un numero reale e quindi, dal numero di cifre destinate rispettivamente alla mantissa e all'esponente: il primo numero è detto precisione e limita l'accuratezza della rappresentazione, il secondo stabilisce i valori minimo Emin e massimo Emax dell'esponente e quindi limita l'intervallo di rappresentabilità. In sostanza l'insieme F, detto sistema floating-point o insieme dei numeri macchina, è caratterizzato dai seguenti 4 parametri: b, t, Emin, Emax e si usa denotarlo con F(b,t, Emin, Emax).

Riassumendo, dato un numero reale x e la coppia (m,e) che lo rappresenta, detto p il numero di cifre di m, possono presentarsi i seguenti casi:

  1. e > Emax , si è in una situazione d'overflow, in quanto xÏ I, e non può essere rappresentato.
  2. e < Emin , si e in una situazione d'underflow, in questo caso alcuni sistemi approssimano x con lo 0, mentre altri danno un avvertimento.
  3. Emin £ e £ Emax, p £ t, allora x Î F, cioè è un numero macchina, e quindi è rappresentato esattamente.
  4. Emin £ e £ Emax , p > t, allora x Ï F, ma x Î I, e quindi può essere rappresentato con una certa approssimazione da un numero macchina che è indicato con fl(x).

Esistono due tecniche d'approssimazione: la prima, detta di troncamento, considera solo le prime t cifre della mantissa; la seconda, detta d'arrotondamento, considera la prime t cifre se la t+1-esima è minore di b/2 altrimenti le incrementa di una unità. E' interessante avere, quindi, una maggiorazione dell'errore che si commette nell'applicare tale tipo d'approssimazioni, per poter determinare la sensibilità del particolare calcolatore che si sta utilizzando. Si dimostra che, nel caso dell'arrotondamento, l'errore assoluto |fl(x)-x| non supera il valore 1/2bp-t, mentre l'errore relativo (fl(x)- x )/x è maggiorato dalla quantità u = 1/2b1-t, detta precisione relativa del sistema floating-point.






Precedente Indice Successivo