4.1 Densità uniforme
La densità uniforme è stata introdotta con una giustificazione geometrica: la relativa p. era un rapporto di lunghezze (o di aree, o di volumi ecc.). Vediamo ora come si può introdurre in modo combinatorio e nello spirito del megaproblema di Boole. Sia (Cn , n = 1, 2,…) la successione di v.a. (cifra decimale)indipendenti che assumono i valori 0, 1, 2,…, 9 con p. 1/10. Sia poi
R = Sn>0 Cn 10-n
la nuova v.a. ottenuta da queste, che chiameremo numero random o v.a. uniforme su [0,1]. Essa infatti assume un valore reale in tale intervallo e corrisponde alla scelta a caso di un numero in [0,1]. Fissato un numero reale x dell’intervallo unitario, si può dimostrare che P(R<x), cioè la p. che il numero scelto a caso R sia minore di x, vale proprio x. Infatti sia 0,c1c2c3… lo sviluppo in base 10 di x; allora
P(R<x) = P(R<0,c1c2c3…) = P((C1<c1)È(C1 = c1, C2<c2) È(C1 = c1,C2 =c2,C3 <c3) È…)
= P(C1<c1) + P(C1 = c1, C2<c2) + P(C1 = c1, C2 =c2, C3 <c3) + …
= c1/10 + (1/10)c2/10 + (1/100)c3/10 + …
= x. Dato un numero reale a>0, sia U = aR.; questa nuova v.a. U ha funzione di ripartizione (o di distribuzione) di p.
P(U<x) = P(aR<x) = P(R<x/a) = x/a
per x in [0,a], così U è uniforme su [0,a].
Densità di Pareto Dato c>0 si consideri la v.a. R-1/c; essa prende valori maggiori di 1. La sua distribuzione è
P(R -1/c<x) = P(R>x -c) = 1-x -c.
Derivando rispetto ad x otteniamo la densità c/x1+cche è detta densità di Pareto. Nota I grafici delle densità di p. che verranno studiate possono essere osservati facilmente su una calcolatrice grafica, come la TI-89, perciò, in genere, non saranno riportati.
Esercizi 6.27; 8.18
4.2 Densità di Dirichlet e beta Siano U1,U2,…,Un v.a. uniformi in [0,a] ed indipendenti. Se U(1) = min(U1,U2,…,Un)è la più piccola delle U ed U(n) = max(U1,U2,…,Un)è la più grande, risulta, per ogni x di [0,a]:
P(U(1) <x) = 1-(1-x/a)n e P(U(n) <x) = (x/a)n
Per determinare la distribuzione della k-esima statistica d’ordineU(k) uguale al k-esimo punto estratto tra tutti gli n, possiamo ragionare nel modo seguente.
Paragoniamo la scelta a caso di un punto Ui in [0,a] al lancio di una moneta: esce testa se il punto Ui è a sinistra di x; esce croce se il punto Ui è a destra di x. Il primo evento ha p. x/a ed il secondo 1-x/a. L’evento (U(k)<x)equivale a dire che almeno k punti sono caduti a sinistra del punto di ascissa x. Poiché le v.a. uniformi U1,U2 ,...,Un sono ipotizzate indipendenti, possiamo applicare la formula binomiale con p = x/a. Quindi, per l’assioma dell’additività,
P(U(k) <x) = S k £ r £ n (nr)(x/a)r(1-x/a)n-r.
Questa formula però non è utile per calcoli numerici e conviene considerare la densità di p.. La derivata rispetto ad x è
f(U(k) ,x) = k(nk)xk-1(a-x)n-ka-n 0£x£a
densità di Dirichlet
Si noti che integrando questa densità tra 0 ed a si deve avere la p. dell’evento certo, cioè 1. Si ottiene così l’identità
ò(xk-1(a-x)n-k,x,0,a) = an/[k(nk)].
La densità di Dirichlet ha un massimo, cioè una moda, per x = (k-1)a/(n-1). In generale, una moda per una v.a. X è un punto x in cui la sua densità f(X,x) assume un valore massimo.
La densità di Dirichlet è un caso particolare di una più vasta famiglia di densità, note come densità beta. Il nome viene dalla funzione euleriana beta
B(u,v) = ò(xu-1(1-x)v-1,x,0,1)
definita per u, v > 0. Allora la funzione
xu-1(1-x)v-1/B(u,v)
è una densità di p. sull’intervallo [0,1] chiamata appunto densità beta di parametri u e v. La densità di Dirichlet si ottiene per u = k e v = n-k+1.
La densità beta, quando u > 1 e v > 1 ha la moda in x = (u-1)/(u+v-2); per u < 1 e v < 1 ha un minimo, antimoda, e possiede una forma ad È. Di particolare interesse è il caso u = v = ˝. Se u = v = 1 la densità beta si riduce a quella uniforme su [0,1]. Negli altri casi il grafico ha una forma a æ o a è .
Se X ha una densità beta (u,v)allora 1-X è beta (v,u). Pertanto se u = v le v.a. X ed 1-X hannola stessa densità.
Infine, per v = 1 ed u º 1+u si ha la densità (1+u)xu , chiamata densità potenza su [0,1].
4.3 Densità esponenziale e di Weibull Nel processo di Poisson di intensità a consideriamo la v.a. T1uguale al tempo d’attesa per il primo arrivo.
L’evento (T1<t) = " il primo arrivo accade in [0, t] " equivale all’evento (N(a, t)>0) = "almeno un arrivo cade in [0, t]". Ma P(N(a,t)>0) = 1-P(N(a,t)=0) =1-e-atper t>0. Pertanto la v.a. tempo d’attesa T1ha funzione di ripartizione P(T1<t) = 1-e-at per t>0. Derivando rispetto a t si ottiene
f(T1,t) = ae-at t > 0 densità esponenziale di parametro
a > 0
Sia T una v.a. esponenziale di parametro unitario; fissati a, n>0 si consideri la v.a. W = T1/n/a.
Essa ha distribuzione P(W<x) = P(T1/n/a <x)= P(T<(ax)n) = 1-exp[-(ax)n]. Derivando rispetto ad x si ottiene la densità detta di Weibull:
f(W,x) = n anxn -1 exp[-(ax)n] x > 0
densità di Weibull di parametri a, n > 0
Essa ha una moda per n ³1 in [(n-1)/(n a n-1)]1/n.
Esercizi
6.12; 6.14; 9.14; 9.20
4.4 Densità di Erlang e gamma Più in generale si può considerare la v.a. Wk uguale al tempo d’attesa per il k-esimo arrivo. Sia Tk il tempo d’attesa per il k-esimo arrivo a partire dall’istante in cui è avvenuto il (k-1)-esimo arrivo.
Allora Wk = T1+T2+…+Tk e l’evento (Wk<t)= "il k-esimo arrivo accade in [0,t]" equivale all’evento (N(a,t)³k)= "almeno k arrivi accadono in [0,t]. Pertanto
Anche questa formula, come nel caso della densità di Dirichlet, è poco utile per calcoli numerici. Conviene considerare la densità di Wk; derivando rispetto a t si ottiene la funzione
f(Wk, t) = aktk-1e-at/(k-1)! t>0
densità di Erlang di parametro a > 0
L’integrale della densità di Erlang rispetto a t, tra 0 e ¥, deve essere uguale ad 1. Per a = 1 risulta l’identità
ò(tk e-t,t,0,¥) = k!
Più in generale possiamo considerare la funzione G(x), o di Eulero, così definita
G(x) = ò(tx -1 e-t,t,0,¥), x > 0.
Ricordiamo alcune proprietà fondamentali della funzione gamma:
G(n+1) = n!, per ogni naturale n
G(x+1) = xG(x)
G(1/2) =òRexp(-x2
)dx = Ö p
G(x+1 ) ~ Ö(2px)xx
e-x
B(u,v) = G(u)G(v)/G(u+v)
.
Fissato poi n >0, risulta che la funzione
f(n, a,t) = antn -1e -a t/ G ( n), t>0
densità gamma di parametri a>0 e n>0
è una densità di p., chiamata densità gamma di parametri ae n. Se n è un naturale positivo, n = 1, 2, 3,..., si ottiene la densità di Erlang.
La densità gamma, quando n ³ 1, ha la moda in x = (n-1)/a.
4.5 Densità di aX+b, X2e ÖX Una v.a. X è detta continua se, per ogni numero reale x, risulta P(X=x) = 0. Se X è continua, P(X£x) = P(X<x). Indicheremo con F(X,x) ed f(X,x) rispettivamente P(X<x) e la sua derivata. Nel continuo, il megaproblema di Boole può essere riassunto nella tabella seguente:
X v.a. data
g trasforma X in Y
Y = g(X)
¯ corrisponde
¯ corrisponde
Densità f(X,x)
Come si trasforma f(X,x) ?
Densità f(g(X),x)
Le più frequenti trasformazioni g di una v.a. X continua sono aX+b, con a e b parametri fissati, X2 e Ö
X. Le loro densità vengono calcolate facilmente come segue. Allora F(aX+b,x) = P(aX+b<x) = P(X<(x-b)/a) se a>0 mentre vale P(X>(x-b)/a) = 1 – P(X<(x-b)/a) se a<0. Pertanto quando si deriva rispetto ad x, si ottiene la seguente densità per aX+b:
f(aX+b,x) = f(X,(x-b)/a)/|a|
Esempio 4.5.1 Si può vedere facilmente che se X è uniforme su [0,1] allora Y = (b-a)X+a è uniforme su [a,b] con densità costante uguale ad 1/(b-a).
Esempio 4.5.2 Sia X la v.a. avente densità normale standard
n(x)= exp(-x2/2)/Ö(2p);
fissati due numeri reali s>0 e µ, la v.a.
Y = sX + µ
ha densità n((x-µ)/s)/s. Una v.a. con tale densità è chiamata normale di parametri µ e s; l’insieme di queste v.a. viene indicato con N(µ,s).
Consideriamo ora la trasformazione Y = X2; per x<0 risulta P(X2<x) = 0 , mentre per x³0 si ha
P(X2<x) = P(-Öx<X<Öx) = F(X,Öx) – F(X, -Öx).
Derivando rispetto ad x otteniamo
f(X2,x)= [f(X,Öx)+f(X,-Öx)] /(2Öx), x>0 densità di X2
Analogamente, per x<0 risulta P(ÖX<x) = 0, mentre per x³0 si ha P(ÖX<x) =P(X<x2) = F(x2). Derivando rispetto ad x si ottiene
f(ÖX,x) = 2xf(X,x2), x>0
densità di ÖX
Esempio 4.5.3 Scelto a caso un punto X sull’asse orizzontale, Y = Ö(1+X2) è la sua distanza dal punto (0,1). Dimostrare che la densità di Y , per x > 1 è:
Ö(2e/p)xexp(-x2/2)/Ö(x2-1), se X è N(0,1);
2/[pxÖ(x2-1)], se X è di Cauchy (vedi Esempio 4.5.5);
xexp[-Ö(x2-1)]/Ö(x2-1), se X è esponenziale di parametro unitario.
La trasformazione Y = F(X) Una notevole trasformazione della v.a. X è Y = F(X) dove F è la funzione di ripartizione di X. Essendo F una funzione limitata tra 0 ed 1, risulta 0 £F(X)£ 1. Inoltre F è non decrescente quindi si ha
Così F(X) è uniforme su [0,1]. Questo risultato è fondamentale per la simulazione al computer di fenomeni casuali. Se si vuole simulare una v.a. di funzione di ripartizione F(x) basta richiedere al computer il numero F -1(R) dove R è il numero random visto al § 4.1. Può essere utile ricordare che R ed 1-R hanno la stessa densità.
Esempio 4.5.4 Per simulare una v.a. esponenziale basta invertire la funzione 1-e-at rispetto a t. Così la v.a. X = -logR /a ha una densità esponenziale di parametro a.
Lasciamo come esercizio la dimostrazione delle seguenti formule:
Esempio 4.5.5 Di particolare importanza è la v.a. Y = tanX quando X è uniforme su [-p/2,p/2] cioè quando f(X,x) = 1/p. Allora la densità di tanX è 1/[p(1+x2)] ed è chiamata densità di Cauchy. Il suo grafico assomiglia a quello din(x) ed ha una forma a campana. Se dal punto (0,a) dell’asse y, con a>0, si tira una semiretta a caso con un angolo X rispetto alla verticale, allora atanX è il punto intersezione della semiretta con l’asse x (problema del tiro a segno alla cieca) ed ha densità
a/[p(a2+x2)].
4.6 Convoluzione Siano X ed Y v.a. naturali con distribuzioni di p. ak = P(X=k), bk = P(Y=k), k = 0, 1, 2,…. Se X e Y sono indipendenti, la distribuzione della somma X+Y, cioè P(X+Y=k), è data dalla formula
P(X+Y=k) = aobk + a1bk-1 +…+ akb0 .
Infatti, per la legge delle alternative,
P(X+Y=k) = Si P(X=i)P(X+Y=k|X=i) = Si ai P(Y=k-i) = Si ai bk-i
La formula trovata definisce una operazione tra successioni, chiamata convoluzione, molto importante, che riprenderemo più avanti quando parleremo di funzioni generatrici.
Con la legge delle alternative nel continuo è possibile risolvere facilmente il megaproblema di Boole anche per la somma di v.a. continue e indipendenti.
Teorema di convoluzione nel continuo.Siano X e Y v.a. continue e indipendenti; la somma X+Y ha densità data dalla formula
f(X+Y,x) = òR f(X,t)f(Y,x-t)dt
formula di convoluzione
Dim. Consideriamo l’evento A = (X+Y<x); condizionando ad (X = t) risulta
Derivando rispetto ad x sotto il segno d’integrale, si ottiene la formula di convoluzione.
La formula appena dimostrata definisce un’operazione tra funzioni f e g di variabile reale, chiamata appunto convoluzione ed indicata con il simbolo *. Così h = f * g è il prodotto di convoluzione tra f e g. Si prova facilmente che esso gode delle seguenti proprietà:
f * g = g * f commutatività
(f * g)* h= f * (g * h) associatività
(f + g)* h = f * h + g * h distributività
(cf) * g = c(f * g), c costante
Si noti che se X ed Y sono v.a. positive, ovvero se le loro densità f e g sono nulle per x<0, allora la formula di convoluzione si scrive più semplicemente
f(X+Y,x) = ò[0,x] f(X,t)f(Y,x-t)dt
Infatti f(t) = 0 se t<0, quindi l’integrale parte da 0; poi g(x-t) = 0 se x-t<0 ovvero se t>x, quindi l’integrale termina in x.
Nella tabella seguente sono riportati i risultati relativi alla somma di due v.a. rispettivamente uniformi, esponenziali e normali.
Variabili aleatorie X e Y indipendenti
Densità di X+Y
Uniformi di parametro a
Simpson: xa-2su [0,a]; (2a-x)a-2su [a,2a]
Esponenziali di parametro a
Erlang k = 2
Normali N(m,s)
Normale N(2m, s Ö2)
Esempio4.6.1Densità di Rayleigh Si sceglie un punto (X,Y) a caso nel piano con X ed Y v.a. indipendenti e normali N(0,s);
dimostrare che la v.a. Ö(X2+Y2), distanza del punto dall’origine degli assi, ha una densità, detta di Rayleigh, xexp[-x2/(2s2)]/s2 per x >0.
Esempio 4.6.2 Densità di Maxwell Tenendo presente l’esempio precedente, dimostrare che se il punto viene scelto nello spazio, la distanza Ö(X2+Y2+Z2) dall’origine ha densità s-3Ö(2/p) exp[-½ x2/s2), per x > 0. Essa è chiamata densità di Maxwell.
Formule analoghe alla somma valgono per la differenza, il prodotto ed il quoziente di due v.a. continue ed indipendenti. Si può dimostrare infatti che le densità di X - Y, XY e X/Y sono rispettivamente
Esempio 4.6.3 Siano X ed Y due v.a. indipendenti ed esponenziali di parametro a. Si può dimostrare che la v.a. X-Y ha densità ˝a exp(-a|x|) per x>0, detta esponenziale bilaterale.
Esercizi 8.2; 8.12; 8.13; 8.18
4.7 Le densità di Pearson, Student e Fisher Siano Zi , i = 1, 2, …,n, v.a. N(0,1) indipendenti; la somma dei loro quadrati è chiamata v.a. chi-quadrato (o di Pearson, 1900) ed indicata con c
2n . Il numero n è detto anche numero di gradi di libertà di c
2n . Posto n/2 = v, si può dimostrare che la sua densità è
f(c2n, x) = xv-1 e-x/2/[2vG(v)] x>0
densità c2n di Pearson
Si noti che essa non è altro che una densità gamma di parametri v = n/2, a
=1/2.
Se poi Z è N(0,1) ed indipendente da una c
2n
T = Z/Ö(c2n/n)
è la v.a. di Student (pseudonimo di William Gosset, 1908). Posto sempre n/2 = v, si può dimostrare che la sua densità è
f(T, x) = G(v+1/2)/[Ö(2pv)G(v)(1+x2/n)v+1/2]
x>0
densità di Student
Per n = 1 questa densità si riduce a quella di Cauchy.
Infine, una terza densità, fondamentale in statistica, è quella di Fisher:
Fn,d = dc2n/[nc2d]
Posto n/2 = u e d/2 = v si dimostra che la sua densità è
f(Fn,d ,x) = (u/v)uxu-1/[B(u,v)(1+ux/v)u+v]
x>0
densità di Fisher
Grafici di queste tre densità possono essere osservati al computer. Oggi non è più necessario ricorrere a tabelle numeriche in quanto la calcolatrice TI-83, per esempio, fornisce i valori numerici, al variare dei parametri u, v e della variabile indipendente x, sia delle densità che dei loro integrali, cioè delle loro probabilità.