Reti Bayesiane

 Descrizione del metodo

 Campo di applicazione

 Link e riferimenti

 Esempi

 

 Descrizione del metodo

Il vantaggio principale del ragionamento probabilistico rispetto a quello logico sta nel permettere all’agente di giungere a descrizioni razionali anche quando non vi è abbastanza informazione per dimostrare che qualsiasi azione data funzionerà.

Le reti Bayesiane sono modelli grafici che permettono di rappresentare la conoscenza in un dominio incerto. Nel contesto della regola di Bayes, le relazioni di indipendenza condizionale fra le variabili possono semplificare il calcolo dei risultati delle interrogazioni e ridurre notevolmente il numero di probabilità condizionale che devono essere specificate.

Si usa una struttura di dati chiamata rete bayesiana (o rete di credenze)  per rappresentare la dipendenza fra le variabili e per dare una specifica concisa della distribuzione di probabilità congiunta.

In breve, una rete Bayesiana, è un grafo in cui valgono le seguenti proprietà: 

1)      Un insieme di variabili casuali costituiscono i nodi della rete;   

2)      Un insieme di archi con verso connette le coppie di nodi (Il significato intuitivo di una freccia dal nodo X al nodo Y è che X ha un’influenza diretta su Y);

3)      Ogni nodo ha una tabella delle probabilità condizionate che quantifica gli effetti che i “genitori” hanno sul nodo, dove per “genitori” si intendono tutti quei nodi che hanno frecce che puntano al nodo;

4)      Il grafo non ha cicli diretti;  

La topologia della rete può essere pensata come una base di conoscenza astratta che può incorporare un’ ampia varietà di situazioni differenti.

Si consideri la seguente situazione. Un Comune può decidere se bloccare o no le auto per una giornata nel caso in cui si verifichi uno dei seguenti casi: 

-  viene raggiunto il livello massimo di inquinamento, 

-  si verifica una congestione delle strade.  

A seconda della situazione i cittadini dovranno decidere se spostarsi con i mezzi pubblici o prendere la macchina.

 

             

  

Una volta che la topologia della rete è specificata dobbiamo solo specificare le probabilità condizionate per i nodi che partecipano nelle dipendenze dirette, usando queste per il calcolo di qualunque altro valore di probabilità. Ogni nodo è caratterizzato da una tabella delle probabilità condizionate. Ogni riga della tabella contiene la probabilità condizionata del valore di ogni nodo per un caso condizionante. La somma degli elementi di ogni riga di una tabella delle probabilità condizionate deve essere 1 perché gli elementi rappresentano un caso esaustivo di casi della variabile. Ad esempio la tabella delle probabilità condizionate per la variabile casuale Auto bloccate potrebbe essere così:

Massimo livello d'inquinamento

     Congestione stradale

P(auto bloccate  |max liv. Inq.,cong.Strad.)

 

 

       Vero

        Falso

VERO

VERO

0,95

0,05

VERO

FALSO

0,94

0,06

FALSO

VERO

0,29

0,71

FALSO

FALSO

0,001

0,999

La rete di credenze è una rappresentazione corretta del dominio solo se ogni nodo è condizionalmente indipendente dai suoi predecessori nell’ordinamento dei nodi, dati i suoi genitori. Pertanto per poter costruire una rete di credenze con la corretta struttura per il dominio, dobbiamo scegliere i genitori di ogni nodo in maniera tale che questa proprietà valga. Intuitivamente i genitori di un nodo Xi dovrebbero contenere quei nodi in X1,…, X(i-1) che influenzano direttamente Xi. 

La procedura generale per la costruzione incrementale della rete è riportata di seguito:

1.      Si scelga un insieme di variabili rilevanti Xi che descrivono il dominio.

2.      Si scelga un ordinamento per le variabili.

3.      Finché sono rimaste delle variabili:

a)      Si prenda una variabile Xi e si aggiunga un nodo alla rete.

b)      Si ponga Genitori(Xi) come un qualche insieme minimo di nodi già presenti nella rete, tale che la proprietà di indipendenza condizionale sia soddisfatta.

c)      Si definisca la tabella delle probabilità condizionate per Xi. 

Poiché ogni nodo è connesso solo ai nodi precedenti, questo metodo di costruzione garantisce che la rete sia aciclica. Pertanto l’ordine corretto per aggiungere nodi è quello che prevede prima l’inserimento delle “cause alla radice” quindi delle variabili che influenzano e così via fino ad arrivare alle “foglie” che non hanno nessuna influenza causale sulle altre variabili. 

La compattezza della rete di credenze è un esempio di una proprietà generale di sistemi localmente strutturati nei quali ogni sottocomponente interagisce direttamente solo con un numero limitato di altri componenti, indipendentemente dal numero totale di componenti.

In alcuni domini vi saranno piccole dipendenze che dovranno essere incluse introducendo nuovi archi.  Ma se queste dipendenze sono molto tenui, allora può non valere la pena aumentare la complessità della rete per il piccolo guadagno in accuratezza.

  

 Campo di applicazione

Il compito fondamentale di ogni sistema di inferenza probabilistico è quello di calcolare la distribuzione di probabilità a posteriori per un insieme di variabili di interrogazione, dati i valori esatti per alcune variabili di prova. Ovverosia il sistema calcola P( Interrogazione|Prova).

Nell’ esempio del blocco delle auto, Congestione stradale è una variabile di interrogazione, Mezzi pubblici e Auto possono servire come variabili di prova.

Le reti di credenze sono abbastanza flessibili in modo tale che ogni nodo può servire sia come variabile di prova che di interrogazione.

In generale un agente acquisisce valori per una variabile di prova dalle proprie percezioni ( o da un ragionamento ) e si informa a proposito di valori possibili per le altre variabili in modo da poter decidere quale azione compiere.

A parte il calcolo delle credenze nelle variabili di interrogazione dati i valori definiti per le variabili di prova, le reti di credenze possono anche essere usate per: 

·      prendere decisioni basandosi su probabilità nella rete e sull’ unità dell’ agente;

·      decidere quali variabili di prova aggiuntive dovrebbero venire osservate per ottenere informazioni utili;

·      effettuare analisi di sensibilità per comprendere quali aspetti del modello hanno il maggiore impatto sulle probabilità delle variabili di interrogazione (e pertanto devono essere più accurate);

·      spiegare i risultati dell’ inferenza probabilistica all’utente. 

Le reti di credenze possono esser anche a connessioni multiple, cioè un grafo si dice a connessioni multiple se due nodi sono connessi da più di un cammino. Questo accade quando vi è più di una causa per una qualche variabile e le cause condividono un antenato.

In alternativa si può pensare alle reti a connessioni multiple come rappresentanti situazioni in cui una variabile può influenzarne un’ altra attraverso più di un meccanismo causale.

  

 Link e riferimenti

Link:

Ø      http://bayesware.com

Ø      http://kmi.open.ac.uk/projects/bkd

Ø      www.ce.unipr.it/people/poggi/teaching/ia/incertezza.pdf

Testi:

Ø      P. Sebastiani, M. Ramoni, P. Cohen, J. Warwick and J. Davis, Discovering Dynamics using Bayesian Clustering, KMi Technical Report KMi-TR-77, Knowledge Media Institute, The Open University, February 1999.

Ø      S. Russell, P. Norvig, Artificial Intelligence - A Modern Approach, Prentice Hall, 1995.

Ø      E. Rich, K. Knight, Intelligenza Artificiale, II edizione, McGraw Hill, 1993.

Ø      E. Charniak, D. McDermott, Introduzione alla Intelligenza Artificiale, Masson - Addison Wesley, 1988.

  

 

Home Modelli Top