Il data mining serve per trasformare i dati contenuti in un database in informazioni.
Nell'analisi dei dati esistono quattro fondamentali livelli:
La piramide rappresenta una "evoluzione" lineare dell'analisi dati per il supporto alle decisioni. Seguendo questa piramide dal livello inferiore a quello superiore si potrà sviluppare da pari passo la capacità dell'impresa di effettuare l'analisi nonché accrescerne gradualmente l'infrastruttura Data Warehouse (magazzino dati).
Query standard
Cercare informazioni utilizzando un solo criterio di ricerca.
Analisi multi dimensionali
Cercare informazioni utilizzando più criteri di ricerca. Generalmente sono utilizzate per affinare il risultato di una query standard.
Modellizzazione e segmentazione
Modello: è uno strumento teorico che descrive il comportamento di un sistema reale.
I modelli offrono alle aziende la possibilità di determinare in modo semplice e costante nel tempo il futuro comportamento della clientela, oltre a stabilirne la redditività economico-finanziaria a lungo termine.
La segmentazione consente di classificare e riclassificare la clientela in base alle caratteristiche demografiche, alle costanti di acquisto, alla propensione all'acquisto ed ad altre categorie simili. Riportiamo di seguito alcuni esempi di possibili segmenti:
clienti che rispondono a nuove promozioni;
clienti che rispondono agli sconti;
clienti che rispondono a offerte di nuovi prodotti;
clienti che non rispondono alle promozioni;
La segmentazione offre suggerimenti su come un'azienda dovrebbe trattare una determinata fascia di clienti e consente di rispondere a domande come queste:
Inizialmente a quale gruppo di clienti dovrebbe essere mirato un determinato nuovo servizio?
Chi è più probabile che chiami per richiedere un nuovo servizio dopo che è stato messo a disposizione?
Quali clienti potrebbero assumere atteggiamenti fraudolenti?
Quali clienti potrebbero rispondere con più probabilità ai saldi?
Quali clienti potrebbero essere pienamente soddisfatti per un nuovo servizio?
Alcuni esempi di modellizzazione potrebbero essere i seguenti:
Durata media della relazione di clientela. Quali sono gli attributi che influenzano il valore a lungo termine di un cliente per l'azienda.
Perdita della clientela. Quante probabilità ci sono che un cliente lasci l'azienda? In quanto tempo lascerà l'impresa? Vi sono altre caratteristiche(configurazione degli acquisti, rallentamenti nella prestazione dei servizi ) da prendere in considerazione quando si esamina la perdita di un cliente?
Modellizzazione predittiva. In che modo le vendite di un determinato prodotto saranno influenzate dal cattivo tempo di questa primavera? Che effetto avrà l'economia sulle vendite?
Knowledge Discovery
A differenza degli altri tipi di analisi, la Knowledge Discovery è un'analisi che parte da "zero ipotesi" e dato che non sappiamo quali domande porre non possiamo prevedere quali saranno le risposte che otterremo. La Knowledge Discovery, nota anche come scoperta non guidata della conoscenza (undirected knowledge discovery), scopre i modelli nei dati che riflettono il comportamento della clientele, le disdette, gli acquisti futuri o altri eventi aziendali. Questi modelli sono troppo particolari e apparentemente arbitrari per essere specificati e quindi l'analista sarebbe costretto a un continuo "gioco degli indovinelli" per cercare di immaginare i possibili modelli esistenti in un database. Fortunatamente il procedimento è esattamente l'opposto: speciali strumenti di Knowledge Discovery scoprono questi schemi e li comunicano all'analista specificando di cosa si tratta e dove reperirli. Naturalmente, poche aziende possono giustificare una simile ricerca randomizzata tra i propri e-data, specialmente se si considerano i costi degli strumenti e la complessa preparazione necessaria per analizzare i dati. Per queste ragioni prima di attuare una simile ricerca dati è comunque opportuno stabilire un, seppur vago, obbiettivo aziendale. Una casa farmaceutica utilizza Knowledge Discovery per esaminare cosa accade quando certe medicine vengono prese contemporaneamente, rendendo possibile l'analisi dei modelli di affinità dei prodotti. Inoltre l'azienda analizza successivi acquisti di prodotti in modo da determinare se certi medicinali portino a necessitarne degli altri (figura 1).
IMAGE
Figura 1. Un esempio di classificazione di analisi effettuate mediante la Knowledge Discovery.
L'analisi delle affinità è una delle molte analisi di Knowledge Discovery possibili. Un potente algoritmo delle affinità legge tutti gli elementi informativi contenuti nei Data Warehouse e collega ogni attributo con ogni altro oggetto informativo prescindendo dal loro significato. Sebbene questa possa sembrare a prima vista un'analisi "forzata", il suo valore effettivo è dato dai risultati cui porta. Il risultato è un insieme di regole che descrive determinate relazioni tra i dati e queste regole possono portare sorprese interessanti. Considerate il valore dei risultati della seguente analisi di affinità:
Dei clienti che acquistano patatine e chupa-chups, il 74 percento acquista anche vino rosso.
Grazie a questo tipo di informazione, che non avrebbe potuto essere raccolta servendosi di query e analisi multidimensionali ma che risiede nel Data Warehouse come una pepita d'oro, il proprietario di un alimentari potrebbe attuare una serie di azioni, dalla spedizione di coupons ai clienti che acquistano più spesso uno di questi tre prodotti, all'eliminazione di sconti sul vino rosso, ad una più efficace disposizione dei prodotti nel negozio. Riportiamo di seguito un sorprendente elenco di dati che possono essere acquisiti mediante la Knowledge Discovery.
Si possono individuare i prodotti che innescano altri acquisti. Per esempio, la probabilità che una agenzia di intermediazione riesca a commercializzare una carta di debito ai clienti che hanno già un conto corrente bancario è relativamente alta.
Si può prevedere quale sarà il prossimo acquisto. Il tipo di analisi sequenziale degli eventi combina il comportamento della clientela con lo storico delle vendite dei prodotti per stabilire delle costanti negli acquisti in modo da prevedere quale sarà l'acquisto successivo di un determinato cliente o di un segmento di clienti prima che questo venga effettuato.
Si possono rilevare costanti nelle flessioni delle vendite o nelle disdette di un servizio. In altri termini, la Knowledge Discovery consente di determinare le ragioni, i fattori, che hanno portato a queste flessioni o alla disdetta di un servizio. Per fare un esempio, questo tipo di analisi può consentire a una Pay TV di prevedere eventuali disdette del servizio in modo più efficace che ricorrendo ai modelli di perdita standard.
Si possono determinare le caratteristiche del cliente che influenzano la durata della vita di un prodotto. In un caso è stato possibile determinare che le famiglie nelle quali i figli si erano appena diplomati erano più propense a permutare una vecchia auto con una nuova.
Nell'ambito della Knowledge Discovery i dati non mentono mai, l'unico aspetto discutibile resta l'attendibilità dell'interpretazione di questi dati. Proprio come accade nel caso della modellazione e della segmentazione, anche i risultati delle analisi di Knowledge Discovery possono essere presentati in modi diversi e devono essere analizzati da specialisti che abbiano una certa familiarità sia con gli strumenti principali sia con i dati che risiedono nel Data Warehouse.