inora,
nelle note precedenti, abbiamo sempre parlato di statistiche di
"presenza". Con questo termine si vuol significare che
tutte le statistiche illustrate (LT, NT, PT, DT, BT, WT, VT e HT)
hanno fatto tutte riferimento, sia pure in modo diverso,
esclusivamente alle colonne dell'ultimo ritardo nelle quali
sono presenti, ai vari ritardi R, i 90 lottroni (così
denominiamo i numeri del Lotto) di ciascuna ruota. Ciò che è
accaduto prima della formazione di tali colonne non ha alcuna
importanza.
E' possibile
costruire un altro gruppo di statistiche dette di
"caduta", concettualmente molto diverse da quelle di
presenza. In questa nota introduciamo l'argomento presentando la
prima di esse, detta CT, alla quale faremo corrispondere una
statistica reale, detta CR e, dal loro confronto, effettuato
con regole analoghe ma diverse da quelle finora usate, una
aspettabilità parziale (o Apz), detta AC.
Allo scopo è
necessario riprendere la distribuzione di probabilità della serie
geometrica, già descritta in Appendice della Nota 1 (Teoria
della colonna dei ritardi):
1).....
P = p + p.q + p.q2
..+ p.q(n-1) +..
|
Questa serie, la cui
somma degli infiniti termini è pari all'unità, assume nel caso che
sia p=1/18 e q=1-p= 17/18 un significato assai
preciso nel gioco del Lotto; infatti, in tale ipotesi, il termine
generale pn corrispondente all'indice n
2).....pn
= p.q(n-1) = (1/18).(17/18)(n-1)
|
rappresenta
esattamente la probabilità che un prefissato lottrone venga
estratto alla n-esima estrazione (in una serie di estrazioni
successive, come sono appunto considerate quelle di ciascuna ruota
del Lotto).
E' facile verificare
che ogni termine diminuisce progressivamente al crescere di n;
per i lettori che hanno meno confidenza con la matematica, può
essere utile meditare sui seguenti valori, scelti a titolo di
esempio:
estrazione
n |
valore
di pn |
1 |
0,055.600.0 |
2 |
0,052.500.0 |
3 |
0,049.600.0 |
10 |
0,033.200.0 |
20 |
0,018.800.0 |
50 |
0,007.580.0 |
100 |
0,000.193.7 |
150 |
0,000.011.1 |
200 |
0,000.000.6 |
Come si vede la
probabilità, massima in fase iniziale, diminuisce fortemente al
crescere di n (in modo detto esponenziale) ma non diventa mai
zero (!). En passant, questa è la ragione per la
quale un lottrone può tardare moltissimo ad uscire, e causare
notevoli perdite al giocatore.
Ritornando alla
statistica 1), osserviamo in primo luogo che al posto di n
possiamo scrivere il ritardo R, purché si assegni il valore R=1
al lottrone sul quale si immagina di cominciare la serie di prove di
estrazioni successive ( cfr. quanto detto nella Nota 1). Ciò
premesso, supponiamo di considerare un insieme di N (da non
confondersi con n) estrazioni consecutive pregresse
(precedenti quella ultima su cui stiamo lavorando), e di aver
registrato ogni volta con quali ritardi R sono caduti i 5
lottroni estratti ad ogni estrazione. Essendo 5*N le cadute
totali da registrare, in base alla 1) esse si distribuiranno secondo
una curva statistica data da:
3).....CT(R)
= 5.N. p.q(R-1)
|
Per avere un dato
numerico supponiamo di considerare le ultime 100 estrazioni
pregresse (N=100) e il ritardo R=10; si ottiene CT(10)
= 16,61. Questo numero ci dice che, secondo la teoria, nelle
ultime 100 estrazioni dovrebbero essere caduti al ritardo R=10
(della ruota considerata) 16,61 lottroni. Un simile dato si può
ovviamente avere per ogni valore di R; pertanto l'insieme dei
valori CT(R) rappresenta una statistica teorica, detta
di caduta: essa infatti riguarda le estrazioni avvenute nelle N
prove precedenti e non l'ultima colonna dei ritardi sulla quale
andiamo a fare le previsioni.
Ovviamente in pratica
è possibile, per ciascuna ruota, andare a vedere come sono andate
effettivamente le cose nelle N estrazioni precedenti. Allo
scopo si deve immaginare di disporre, per ciascuna delle N
prove precedenti, della colonna dei ritardi e di registrare da
qualche parte per quali valori di R sono caduti i 5 lottroni
ogni volta estratti. Sommando su tutto gli R e su tutte le N
prove, si ottiene la statistica reale CR(R), la quale
non solo differirà da quella reale ma sarà anche diversa da ruota
a ruota (concettualmente la procedura è semplice; in pratica si
può fare rapidamente solo con un computer e un apposito programma).
Può una
statistica del genere essere utile per le previsioni? Certamente;
nello stesso modo in cui sono utili le altre statistiche. Supponiamo
ad esempio che nella ruota di BA al ritardo R=10 sia
risultato (nelle 100 prove pregresse) CR(10)=11 mentre per la
ruota di CA sia risultato CR(10)=22; intuitivamente ci
attendiamo che se, alla prossima estrazione (la 101-esima) cadrà un
lottrone al ritardo R la ruota di Ba sia più
"aspettabile" della ruota di CA (la probabilità sarà
però la stessa).
Come già detto nelle
note precedenti l'aspettabilità è soltanto la misura della
deviazione di una statistica reale rispetto alla corrispondente
statistica teorica. La misura è anche "normalizzata" nel
senso che è contenuta fra 0 e 1; il valore 0,5 rappresenta la piena
corrispondenza fra le due statistiche (nessuna deviazione) mentre
valori superiori indicano che se l'evento atteso accadrà, esso ci
riavvicinerà all'equilibrio statistico. La formula da adottare per
le Apz legate alle statistiche di caduta è del tipo:
e come si vede a
numeratore compare ora la statistica teorica, mentre per le
statistiche di presenza compariva la statistica reale. Per
verificare che questa è la formula giusta calcoliamo i valori che
risultano dai due esempi precedenti: per la ruota di BA si ottiene
AC= 16,61/(16,61+11) = 0,60 mentre per la ruota di CA si ha AC=
16,61/(16,61+22)= 0,43. Come era da attendersi, nel caso che CR
sia minore di CT si ha effettivamente una aspettabilità
maggiore di 0,5 e viceversa nel caso contrario.
A quali lottroni
vanno attribuiti tale valori di AC? Chiaramente ai lottroni che dopo
la centesima estrazione pregressa si trovano (in vista della
101-esima estrazione: la prossima ) al ritardo R =10 nelle
ruote considerate. E' chiaro che ciascuno dei 90 lottroni, secondo
il valore R a cui si trova, riceverà un valore diverso di
AC.
Per chiudere
l'argomento si noti che se CR=0 si ottiene AC=1 anche se i
valori di CT sono molto piccoli; in casi del genere il valore
di AC potrebbe entrare in saturazione nel senso che potrebbe non
dare una particolareggiata graduatoria delle differenze di
aspettabilità di molti dei 90 lottroni. Ma ciò significa solo che
è stato troppo piccoli il valore del parametro N cioè del
numero delle prove pregresse. D'altronde è chiaro che un solo
valore di N non può coprire bene tutto l'arco dei possibili
ritardi.
Vi sono due modi per
superare questo inconveniente; il primo è ovviamente quello di
variare N al crescere di R; l'altro, anche se parziale
ma molto più semplice, consiste nel raggruppare progressivamente le
colonne dei ritardi delle 10 ruote. Ad esempio fino ad un certo
valore R1 di R le colonne sono considerate isolate;
fra R1 e un successivo valore R2 le colonne sono
raggruppate in 5 gruppi di due colonne ciascuno; fra R2 e un
successivo valore R5 le colonne sono raggruppate in due
gruppi di 5 colonne ciascuno; infine al di sopra di R5 le 10
colonne sono considerate tutte insieme. Ovviamente la statistica
teorica data dalla 3) va moltiplicata per 2 al di sopra di R1;
per 5 al di sopra di R2 e per 10 al di sopra di R5.
Naturalmente anche per avere le statistiche reali si dovranno
sommare i lottroni presenti al ritardo R nelle colonne
raggruppate; in questo modo si evitano molti casi con RC=0.
Questa procedura è stata attuata nel programma che GDS33 che
utilizza fra le varie Apz anche AC.
(Il fisico)