Lo schema ipergeometrico

robertoboggiani — Sep 13, 2013, 5:47 PM

#Supponiamo di avere a disposizione un'urna contenente:
#   7 palline bianche 
#   3 palline nere
#ed estraiamo per 1000 volte 4 palline senza reinserimento.
#I risultati sono riportati dal seguente scritp
urna<-c(rep("bianca",7),rep("nera",3))
nrep<-1000
out<-rep(NA,nrep)
for (i in 1:nrep)
{
  x<-sample(urna,4)
  y<-sum(x=="bianca")
  out[i]<-y
}
table(out)
out
  1   2   3   4 
 35 305 485 175 
#lo schema cosi proposto si riferisce ovviamente al modello ipergeometrico i cui risultati relativi
#ad una estrazione sarebbero i seguenti:
dhyper(0:4,7,3,4,0.7)
[1] 0.00000 0.03333 0.30000 0.50000 0.16667
#mentre per 1000 estrazioni sarebbero:
dhyper(0:4,7,3,4,0.7)*1000
[1]   0.00  33.33 300.00 500.00 166.67
#da cui si nota una evidente analogia di risultati. Se effettuiamo il test di chi quadrato per la
#bontà dell'adattamento si ottiene che:
chisq.test(table(out)/1000,p=dhyper(1:4,7,3,4,0.7),correct=T)
Warning: Chi-squared approximation may be incorrect

    Chi-squared test for given probabilities

data:  table(out)/1000
X-squared = 0.001, df = 3, p-value = 1
#dal quale si evidenzia la bontà dell'adattamento della simulazione al modello ipergeometrico