ELEMENTI DI STOCASTICA

ELEMENTI DI STOCASTICA
Mauro Cerasoli - 21.11.00

4. DENSITA’ SPECIALI

4.1 Densità uniforme
La densità uniforme è stata introdotta con una giustificazione geometrica: la relativa p. era un rapporto di lunghezze (o di aree, o di volumi ecc.). Vediamo ora come si può introdurre in modo combinatorio e nello spirito del megaproblema di Boole. Sia (C_n, n = 1, 2,…) la successione di v.a. (cifra decimale) indipendenti che assumono i valori 0, 1, 2,…, 9 con p. 1/10. Sia poi

R = S_n>0 C_n 10^-n
la nuova v.a. ottenuta da queste, che chiameremo numero random o v.a. uniforme su [0,1]. Essa infatti assume un valore reale in tale intervallo e corrisponde alla scelta a caso di un numero in [0,1]. Fissato un numero reale x dell’intervallo unitario, si può dimostrare che P(R<x), cioè la p. che il numero scelto a caso R sia minore di x, vale proprio x. Infatti sia 0,c₁c₂c₃… lo sviluppo in base 10 di x; allora
P(R<x) = P(R<0,c₁c₂c₃…) = P((C₁<c₁)È(C₁= c₁, C₂<c₂) È(C₁= c₁,C₂=c₂,C₃ <c₃) È…)
= P(C₁<c₁) + P(C₁= c₁, C₂<c₂) + P(C₁= c₁, C₂=c₂, C₃ <c₃) + …
= c₁/10 + (1/10)c₂/10 + (1/100)c₃/10 + …
= x.
Dato un numero reale a>0, sia U = aR.; questa nuova v.a. U ha funzione di ripartizione (o di distribuzione) di p.

P(U<x) = P(aR<x) = P(R<x/a) = x/a
per x in [0,a], così U è uniforme su [0,a].
Densità di Pareto
Dato c>0 si consideri la v.a. R^-1/c; essa prende valori maggiori di 1. La sua distribuzione è

P(R^-1/c<x) = P(R>x^-c) = 1-x^-c.
Derivando rispetto ad x otteniamo la densità c/x^1+c che è detta densità di Pareto.
Nota I grafici delle densità di p. che verranno studiate possono essere osservati facilmente su una calcolatrice grafica, come la TI-89, perciò, in genere, non saranno riportati.

Esercizi 6.27; 8.18

4.2 Densità di Dirichlet e beta
Siano U₁,U₂,…,U_n v.a. uniformi in [0,a] ed indipendenti. Se U₍₁₎ = min(U₁,U₂,…,U_n) è la più piccola delle U ed U_(n) = max (U₁,U₂,…,U_n) è la più grande, risulta, per ogni x di [0,a]: P(U₍₁₎<x) = 1-(1-x/a)ⁿ e P(U_(n)<x) = (x/a)ⁿ
Per determinare la distribuzione della k-esima statistica d’ordine U_(k) uguale al k-esimo punto estratto tra tutti gli n, possiamo ragionare nel modo seguente.

Paragoniamo la scelta a caso di un punto U_i in [0,a] al lancio di una moneta: esce testa se il punto U_i è a sinistra di x; esce croce se il punto U_i è a destra di x. Il primo evento ha p. x/a ed il secondo 1-x/a. L’evento (U_(k)<x) equivale a dire che almeno k punti sono caduti a sinistra del punto di ascissa x. Poiché le v.a. uniformi U₁,U₂,...,U_n sono ipotizzate indipendenti, possiamo applicare la formula binomiale con p = x/a. Quindi, per l’assioma dell’additività,

P(U_(k)<x) = S _{k £ r £ n}(ⁿ_r)(x/a)^r(1-x/a)^n-r.
Questa formula però non è utile per calcoli numerici e conviene considerare la densità di p.. La derivata rispetto ad x è

f(U_(k) ,x) = k(ⁿ_k)x^k-1(a-x)^n-ka^-n 0£x£a
densità di Dirichlet

Si noti che integrando questa densità tra 0 ed a si deve avere la p. dell’evento certo, cioè 1. Si ottiene così l’identità

ò(x^k-1(a-x)^n-k,x,0,a) = aⁿ/[k(ⁿ_k)].
La densità di Dirichlet ha un massimo, cioè una moda, per x = (k-1)a/(n-1). In generale, una moda per una v.a. X è un punto x in cui la sua densità f(X,x) assume un valore massimo.
La densità di Dirichlet è un caso particolare di una più vasta famiglia di densità, note come densità beta. Il nome viene dalla funzione euleriana beta

B(u,v) = ò(x^u-1(1-x)^v-1,x,0,1)
definita per u, v > 0. Allora la funzione

x^u-1(1-x)^v-1/B(u,v)
è una densità di p. sull’intervallo [0,1] chiamata appunto densità beta di parametri u e v. La densità di Dirichlet si ottiene per u = k e v = n-k+1.
La densità beta, quando u > 1 e v > 1 ha la moda in x = (u-1)/(u+v-2); per u < 1 e v < 1 ha un minimo, antimoda, e possiede una forma ad È. Di particolare interesse è il caso u = v = ½. Se u = v = 1 la densità beta si riduce a quella uniforme su [0,1]. Negli altri casi il grafico ha una forma a æ o a è .

Se X ha una densità beta (u,v) allora 1-X è beta (v,u). Pertanto se u = v le v.a. X ed 1-X hanno la stessa densità.
Infine, per v = 1 ed u º 1+u si ha la densità (1+u)x^u, chiamata densità potenza su [0,1].

4.3 Densità esponenziale e di Weibull
Nel processo di Poisson di intensità a consideriamo la v.a. T₁ uguale al tempo d’attesa per il primo arrivo.

L’evento (T₁<t) = " il primo arrivo accade in [0, t] " equivale all’evento (N(a, t)>0) = "almeno un arrivo cade in [0, t]". Ma P(N(a,t)>0) = 1-P(N(a,t)=0) =1-e^-at per t>0. Pertanto la v.a. tempo d’attesa T₁ ha funzione di ripartizione P(T₁<t) = 1-e^-at per t>0. Derivando rispetto a t si ottiene

f(T₁,t) = ae^-at t > 0
densità esponenziale di parametro
a > 0

Sia T una v.a. esponenziale di parametro unitario; fissati a, n>0 si consideri la v.a. W = T^1/n/a.
Essa ha distribuzione P(W<x) = P(T^1/n/a <x)= P(T<(ax)ⁿ) = 1-exp[-(ax)ⁿ]. Derivando rispetto ad x si ottiene la densità detta di Weibull:

f(W,x) = n aⁿxⁿ -1 exp[-(ax)ⁿ] x > 0
densità di Weibull di parametri a, n > 0

Essa ha una moda per n ³1 in [(n-1)/(n a n^-1)]^1/n.

Esercizi 6.12; 6.14; 9.14; 9.20

4.4 Densità di Erlang e gamma
Più in generale si può considerare la v.a. W_k uguale al tempo d’attesa per il k-esimo arrivo. Sia T_k il tempo d’attesa per il k-esimo arrivo a partire dall’istante in cui è avvenuto il (k-1)-esimo arrivo.

Allora W_k = T₁+T₂+…+T_k e l’evento (W_k <t) = "il k-esimo arrivo accade in [0,t]" equivale all’evento (N(a,t)³k) = "almeno k arrivi accadono in [0,t]. Pertanto

P(W_k<t) = P(N(a,t) ³k) = 1-P(N(a,t)<k) = 1-S_{0£ r£ k-1} (at)^re^{-a t}/r!
Anche questa formula, come nel caso della densità di Dirichlet, è poco utile per calcoli numerici. Conviene considerare la densità di W_k; derivando rispetto a t si ottiene la funzione

f(W_k, t) = a^kt^k-1e^-at/(k-1)! t>0
densità di Erlang di parametro a > 0

L’integrale della densità di Erlang rispetto a t, tra 0 e ¥, deve essere uguale ad 1. Per a = 1 risulta l’identità

ò(t^k e^-t,t,0,¥) = k!
Più in generale possiamo considerare la funzione G(x), o di Eulero, così definita

G(x) = ò(t^{x -1} e^-t,t,0,¥), x > 0.
Ricordiamo alcune proprietà fondamentali della funzione gamma:

G(n+1) = n!, per ogni naturale n
G(x+1) = xG(x)
G(1/2) =ò_Rexp(-x²)dx = Ö p
G(x+1 ) ~ Ö(2px)x^xe^-x
B(u,v) = G(u)G(v)/G(u+v).

Fissato poi n >0, risulta che la funzione

f(n, a,t) = aⁿtⁿ -1e^{-a t}/ G ( n), t>0
densità gamma di parametri a>0 e n>0

è una densità di p., chiamata densità gamma di parametri a e n. Se n è un naturale positivo, n = 1, 2, 3,..., si ottiene la densità di Erlang.
La densità gamma, quando n ³ 1, ha la moda in x = (n-1)/a.

4.5 Densità di aX+b, X² e ÖX
Una v.a. X è detta continua se, per ogni numero reale x, risulta P(X=x) = 0. Se X è continua, P(X£x) = P(X<x). Indicheremo con F(X,x) ed f(X,x) rispettivamente P(X<x) e la sua derivata. Nel continuo, il megaproblema di Boole può essere riassunto nella tabella seguente:

X v.a. data	g trasforma X in Y	Y = g(X)
¯ corrisponde		¯ corrisponde
Densità f(X,x)	Come si trasforma f(X,x) ?	Densità f(g(X),x)

Le più frequenti trasformazioni g di una v.a. X continua sono aX+b, con a e b parametri fissati, X²e Ö X. Le loro densità vengono calcolate facilmente come segue. Allora F(aX+b,x) = P(aX+b<x) = P(X<(x-b)/a) se a>0 mentre vale P(X>(x-b)/a) = 1 – P(X<(x-b)/a) se a<0. Pertanto quando si deriva rispetto ad x, si ottiene la seguente densità per aX+b:
f(aX+b,x) = f(X,(x-b)/a)/|a|
Esempio 4.5.1 Si può vedere facilmente che se X è uniforme su [0,1] allora Y = (b-a)X+a è uniforme su [a,b] con densità costante uguale ad 1/(b-a).
Esempio 4.5.2 Sia X la v.a. avente densità normale standard

n(x) = exp(-x²/2)/Ö(2p);
fissati due numeri reali s>0 e µ, la v.a.

Y = sX + µ
ha densità n((x-µ)/s)/s. Una v.a. con tale densità è chiamata normale di parametri µ e s; l’insieme di queste v.a. viene indicato con N(µ,s).
Consideriamo ora la trasformazione Y = X²; per x<0 risulta P(X²<x) = 0 , mentre per x³0 si ha

P(X²<x) = P(-Öx<X<Öx) = F(X,Öx) – F(X, -Öx).
Derivando rispetto ad x otteniamo

f(X²,x)= [f(X,Öx)+f(X,-Öx)] /(2Öx), x>0
densità di X²

Analogamente, per x<0 risulta P(ÖX<x) = 0, mentre per x³0 si ha P(ÖX<x) =P(X<x²) = F(x²). Derivando rispetto ad x si ottiene

f(ÖX,x) = 2xf(X,x²), x>0
densità di ÖX

Esempio 4.5.3
Scelto a caso un punto X sull’asse orizzontale, Y = Ö(1+X²) è la sua distanza dal punto (0,1). Dimostrare che la densità di Y , per x > 1 è:

Ö(2e/p)xexp(-x²/2)/Ö(x²-1), se X è N(0,1);
2/[pxÖ(x²-1)], se X è di Cauchy (vedi Esempio 4.5.5);
xexp[-Ö(x²-1)]/Ö(x²-1), se X è esponenziale di parametro unitario.

La trasformazione Y = F(X)
Una notevole trasformazione della v.a. X è Y = F(X) dove F è la funzione di ripartizione di X. Essendo F una funzione limitata tra 0 ed 1, risulta 0 £F(X)£ 1. Inoltre F è non decrescente quindi si ha

P(Y < x) = P(F(X) < x) = P(X <F ^-1(x)) = F(F ^-1(x)) = x.
Così F(X) è uniforme su [0,1]. Questo risultato è fondamentale per la simulazione al computer di fenomeni casuali. Se si vuole simulare una v.a. di funzione di ripartizione F(x) basta richiedere al computer il numero F ^-1(R) dove R è il numero random visto al § 4.1. Può essere utile ricordare che R ed 1-R hanno la stessa densità.
Esempio 4.5.4 Per simulare una v.a. esponenziale basta invertire la funzione 1-e^-at rispetto a t. Così la v.a. X = -logR /a ha una densità esponenziale di parametro a.

Lasciamo come esercizio la dimostrazione delle seguenti formule:

f(X ^-2,x) = f(X,1/Öx)/(2xÖx), x>0
f(logX,x) = e^xf(X,e^x)
f(e^-X,x) = f(X,-logx)/x, x>0
f(tanX,x) = f(X,arctanx/(1+x²))

Esempio 4.5.5 Di particolare importanza è la v.a. Y = tanX quando X è uniforme su [-p/2,p/2] cioè quando f(X,x) = 1/p. Allora la densità di tanX è 1/[p(1+x²)] ed è chiamata densità di Cauchy. Il suo grafico assomiglia a quello di n(x) ed ha una forma a campana. Se dal punto (0,a) dell’asse y, con a>0, si tira una semiretta a caso con un angolo X rispetto alla verticale, allora atanX è il punto intersezione della semiretta con l’asse x (problema del tiro a segno alla cieca) ed ha densità
a/[p(a²+x²)].
4.6 Convoluzione
Siano X ed Y v.a. naturali con distribuzioni di p. a_k = P(X=k), b_k = P(Y=k), k = 0, 1, 2,…. Se X e Y sono indipendenti, la distribuzione della somma X+Y, cioè P(X+Y=k), è data dalla formula

P(X+Y=k) = a_ob_k + a₁b_k-1 +…+ a_kb₀.
Infatti, per la legge delle alternative,

P(X+Y=k) = S_i P(X=i)P(X+Y=k|X=i) = S_i a_i P(Y=k-i) = S_i a_i b_k-i
La formula trovata definisce una operazione tra successioni, chiamata convoluzione, molto importante, che riprenderemo più avanti quando parleremo di funzioni generatrici.
Con la legge delle alternative nel continuo è possibile risolvere facilmente il megaproblema di Boole anche per la somma di v.a. continue e indipendenti.
Teorema di convoluzione nel continuo. Siano X e Y v.a. continue e indipendenti; la somma X+Y ha densità data dalla formula

f(X+Y,x) = ò_R f(X,t)f(Y,x-t)dt
formula di convoluzione

Dim. Consideriamo l’evento A = (X+Y<x); condizionando ad (X = t) risulta

P(X+Y<x) = ò_R P(X+Y<x| X=t)f(X,t)dt = ò_RP(Y<x-t)f(X,t)dt
Derivando rispetto ad x sotto il segno d’integrale, si ottiene la formula di convoluzione.
La formula appena dimostrata definisce un’operazione tra funzioni f e g di variabile reale, chiamata appunto convoluzione ed indicata con il simbolo *. Così h = f * g è il prodotto di convoluzione tra f e g. Si prova facilmente che esso gode delle seguenti proprietà:

f * g = g * f commutatività
(f * g)* h = f * (g * h) associatività
(f + g)* h = f * h + g * h distributività
(cf) * g = c(f * g), c costante

Si noti che se X ed Y sono v.a. positive, ovvero se le loro densità f e g sono nulle per x<0, allora la formula di convoluzione si scrive più semplicemente

f(X+Y,x) = ò_[0,x] f(X,t)f(Y,x-t)dt
Infatti f(t) = 0 se t<0, quindi l’integrale parte da 0; poi g(x-t) = 0 se x-t<0 ovvero se t>x, quindi l’integrale termina in x.
Nella tabella seguente sono riportati i risultati relativi alla somma di due v.a. rispettivamente uniformi, esponenziali e normali.

Variabili aleatorie X e Y indipendenti	Densità di X+Y
Uniformi di parametro a	Simpson: xa^-2 su [0,a]; (2a-x)a^-2 su [a,2a]
Esponenziali di parametro a	Erlang k = 2
Normali N(m,s)	Normale N(2m, s Ö2)

Esempio 4.6.1 Densità di Rayleigh
Si sceglie un punto (X,Y) a caso nel piano con X ed Y v.a. indipendenti e normali N(0,s);
dimostrare che la v.a. Ö(X²+Y²), distanza del punto dall’origine degli assi, ha una densità, detta di Rayleigh, xexp[-x²/(2s²)]/s²per x >0.

Esempio 4.6.2 Densità di Maxwell
Tenendo presente l’esempio precedente, dimostrare che se il punto viene scelto nello spazio, la distanza Ö(X²+Y²+Z²) dall’origine ha densità s^-3Ö(2/p) exp[-½ x²/s²), per x > 0. Essa è chiamata densità di Maxwell.
Formule analoghe alla somma valgono per la differenza, il prodotto ed il quoziente di due v.a. continue ed indipendenti. Si può dimostrare infatti che le densità di X - Y, XY e X/Y sono rispettivamente

f(X-Y,x) = ò_Rf(Y,t)f(X,x+t) dt
f(XY,x) = ò_R f(Y,t)f(X,x/t)/|t| dt
f(X/Y,x) = ò_R f(Y,t)f(X,xt)|t| dt

Esempio 4.6.3 Siano X ed Y due v.a. indipendenti ed esponenziali di parametro a. Si può dimostrare che la v.a. X-Y ha densità ½a exp(-a|x|) per x>0, detta esponenziale bilaterale.

Esercizi 8.2; 8.12; 8.13; 8.18

4.7 Le densità di Pearson, Student e Fisher
Siano Z_i , i = 1, 2, …,n, v.a. N(0,1) indipendenti; la somma dei loro quadrati è chiamata v.a. chi-quadrato (o di Pearson, 1900) ed indicata con c ²_n. Il numero n è detto anche numero di gradi di libertà di c ²_n . Posto n/2 = v, si può dimostrare che la sua densità è

f(c²_n, x) = x^v-1 e^-x/2/[2^vG(v)] x>0
densità c²_n di Pearson

Si noti che essa non è altro che una densità gamma di parametri v = n/2, a =1/2.
Se poi Z è N(0,1) ed indipendente da una c ²_n
T = Z/Ö(c²_n/n)
è la v.a. di Student (pseudonimo di William Gosset, 1908). Posto sempre n/2 = v, si può dimostrare che la sua densità è

f(T, x) = G(v+1/2)/[Ö(2pv)G(v)(1+x²/n)^v+1/2]
x>0
densità di Student

Per n = 1 questa densità si riduce a quella di Cauchy.
Infine, una terza densità, fondamentale in statistica, è quella di Fisher:

F_n,d = dc²_n/[nc²_d]
Posto n/2 = u e d/2 = v si dimostra che la sua densità è

f(F_n,_d,x) = (u/v)^u x^u-1/[B(u,v)(1+ux/v)^u+v]
x>0
densità di Fisher

Grafici di queste tre densità possono essere osservati al computer. Oggi non è più necessario ricorrere a tabelle numeriche in quanto la calcolatrice TI-83, per esempio, fornisce i valori numerici, al variare dei parametri u, v e della variabile indipendente x, sia delle densità che dei loro integrali, cioè delle loro probabilità.