3. DISTRIBUZIONI DISCRETE
3.1 Il megaproblema di Boole
George Boole nel suo trattato Investigazioni sulle leggi del pensiero del 1854 scriveva a proposito della p.: «L’oggetto della teoria della probabilità potrebbe essere definito così: date le probabilità di eventi qualsiasi, di qualunque specie, trovare la probabilità di qualche altro evento connesso con i primi». Nel 1934, in un famoso articolo, Lomnicki e Ulam ribadivano l’idea affermando che «lo scopo di una teoria delle probabilità è quello di calcolare nuove probabilità a partire da probabilità già note». Questo è il megaproblema del calcolo delle p., che oggi esprimiamo nel seguente modo.
Siano date n v.a. Xi qualsiasi, con funzioni di distribuzioni note, ed una nuova v.a. Y funzione delle prime: Y = g(X1, ..., Xn ). Determinare la funzione di distribuzione di Y.
In altre parole, determinare la p. che Y prenda il valore k, cioè P(Y=k) se Y è discreta, oppure, se Y è continua, per ogni y Î R, determinare la p. che Y prenda un valore non superiore ad y, cioè P(Y£y), essendo note rispettivamente P(Xi=k) o P(Xi £ x) per ogni i = 1,2,…,n.
E’ bene dire subito che le v.a. Y che noi considereremo in modo particolare saranno le seguenti:
aX+b con a, b reali
Xr, r razionale
X(X-1)(X-2)…(X-n+1), n = 2,3,…
X(1) = min(X1 ,X2 ,...,Xn )
X(n) = max(X1 ,X2 ,...,Xn )
Sn = X1 +X2 +…+Xn
Mn = Sn/n (media campionaria)
S2 = Si (Xi – Mn )2/(n-1) (varianza campionaria)
Prima di studiare queste (ed altre) nuove v.a., vediamone alcune che nascono dai primi due spazi di p. speciali.
3.2 Distribuzione ipergeometrica
Consideriamo un’urna con r biglie rosse e b biglie bianche; ne vengono estratte n a caso e sia Rn il numero di biglie rosse estratte. Sia poi Xi = 0 se esce pallina bianca alla i-esima estrazione, Xi = 1 se esce rossa, allora Rn = X1 +X2 +…+Xn . Con un semplice ragionamento combinatorio si trova che se le biglie sono estratte in blocco (tutte insieme) allora la p. P(Rn=k), cioè la p. che delle n biglie estratte k siano rosse ed n-k bianche, che indicheremo con i(k,n,r,b),vale
distribuzione ipergeometrica |
3.3 Distribuzione binomiale
Se I1, I2,…,In sono v. a. di Bernoulli, allora Sn = I1+ I2+…+In è il numero di teste (=successi) su n lanci di una moneta. Si dimostra che per ogni k = 0,1,2,...,n, la p. P(Sn=k), scritta anche b(n,p,k), di avere k teste su n lanci di una moneta, vale
distribuzione binomiale (Bernoulli, 1713) |
3.4 Distribuzione di Poisson
La formula della distribuzione binomiale non è comoda per fare calcoli numerici quando n è molto grande e p molto piccolo. Se però il loro prodotto np rimane costante, per esempio uguale ad un valore l, allora la formula può essere approssimata con un’altra di più facile applicazione. Per esempio, quando si vuole calcolare la p. di fare 5 volte ambo giocandolo 1000 volte. In tal caso risulta n = 1000, p = 2/801 ma np = l = 2000/801 » 2,496.
Teorema di Poisson Se n ® ¥, p ® 0 ma np ® l, allora
approssimazione di Poisson |
| k | | p(k,l) | .082 | .206 | .257 | .214 | .133 | .066 | .028 | .010 | .003
| |
|---|
Nota Ora possiamo giustificare la misura di p. di Poisson assegnata al quarto spazio di p. speciale per la v.a. N( a, t). Infatti si scelgano n punti Ui a caso su [0,a] come nello spazio W3. Fissato un t di [0,a], diciamo "testa" se il punto Ui cade in [0,t], diciamo "croce" altrimenti. Così p = t/a è la p. che esca testa. Allora la p. che su n punti estratti k cadano in [0,t] ed n-k in [t, a] è b(n,t/a,k). Se poi si fanno tendere n ed a all’infinito, con l’ipotesi che però il rapporto n/a resti costante, uguale ad a; allora si ottiene come limite ( a t)ke- a t/k!.
3.5 Distribuzioni geometrica e di Pascal
Sia T1 il numero di lanci necessari per avere la prima testa in uno spazio di Bernoulli; T1 è il più piccolo indice n tale che I1 = I2 = …= In-1 = 0 ma In = 1. Si vede subito che
distribuzione geometrica |
Il paradosso della scimmia di Borel
La formula della distribuzione geometrica permette di risolvere il problema della scimmia che batte a caso sulla tastiera di un computer: riuscirà, prima o poi, a scrivere la Divina Commedia? La risposta è si, se può battere anche infinite volte. Infatti supponiamo che l’opera di Dante abbia c caratteri tra lettere, segni di interpunzione, spazi tra le parole ecc. Siano poi s i tasti della tastiera. Se la scimmia fa c battute a caso, la p. di scrivere la Divina Commedia è p = s-c. Costruiamo un processo di Bernoulli dicendo che il lancio di una moneta consiste nel fare c battute a caso sulla tastiera: esce testa se la scimmia scrive la Divina Commedia, croce altrimenti. La p. che la scimmia scriva per la prima volta la Divina Commedia al lancio n-esimo è p(1-p)n-1. La p. che prima o poi la scriva, per l’assioma della s-additività, è Sn>0 p(1-p)n-1, ma tale somma vale 1. Quindi è certo che la scimmia prima o poi scriverà la Divina Commedia. Non solo, ma la scriverà un numero grande a piacere di volte, per esempio (1000!)! volte, come vedremo. Naturalmente il risultato non cambia se invece della Divina Commedia vogliamo che la scimmia scriva uno dopo l’altro, tutti i libri scritti dall’uomo, in qualsiasi lingua. Morale della favola: il concetto di infinito è sempre misterioso!
Sia Tk il numero di lanci necessari per avere la k-esima testa dopo aver avuto la (k-1)-esima. Questa v.a. è la k-esima lacuna del processo di Bernoulli. Ad esempio, se uscissero le facce ccctctccccttcctc…sarebbe T1 = 4, T2 = 2, T3 =5, T4 =1 ecc. Allora Wk = T1 +T2 +…+Tk è il numero di lanci necessari per avere la k-esima testa. Si può dimostrare che la distribuzione di p. di Wk è:
distribuzione di Pascal (binomiale negativa) |
Problema di Banach. Il famoso matematico polacco Stefan Banach portava sempre due scatole di cerini, una per tasca. Quando aveva bisogno di accendere la sigaretta sceglieva a caso una delle tasche. Se ad un certo istante trovava una scatola vuota, quanti cerini erano rimasti nell’altra?
Per risolvere questo problema supponiamo che sia s il numero di cerini in ciascuna scatola. Quando per la prima volta viene trovata una scatola vuota, sia C il numero di cerini nell’altra. Supponiamo che venga trovata vuota quella di sinistra. In tal caso l’evento (C=c) per c = 0, 1, 2,…, s, accade quando è stata scelta s + 1 volte la scatola sinistra ed s – c volte l’altra con la condizione che, l’ultima volta che Banach ha cercato un cerino, ha scelto quella di sinistra (e l’ha trovata vuota). Esso quindi equivale all’evento (Wk = n) in un processo di Bernoulli, dove testa è "scelgo a sinistra", di parametro ½ , quando k = s+1 ed n = s+1+s –c = 2s-c+1. Considerando inoltre che può essere trovata vuota la scatola destra, P(C=c) è il doppio di P(Ws+1 = 2s-c+1). Sostituendo i valori nella formula di Pascal si ottiene infine
Mauro Cerasoli
10/11/2000