back

Data mining

Il data mining serve per trasformare i dati contenuti in un database in informazioni.

 Nell'analisi dei dati esistono quattro fondamentali livelli:

  1. Knowledge Discovery 

  2. Modelli e segmentazione

  3. Analisi multidimensionali

  4. Query standard

La piramide rappresenta una "evoluzione" lineare dell'analisi dati per il supporto alle decisioni. Seguendo questa piramide dal livello inferiore a quello superiore si potrà sviluppare da pari passo la capacità dell'impresa di effettuare l'analisi nonché accrescerne gradualmente l'infrastruttura Data Warehouse (magazzino dati).

 

Query standard

Cercare informazioni utilizzando un solo criterio di ricerca.

Analisi multi dimensionali

Cercare informazioni utilizzando più criteri di ricerca. Generalmente sono utilizzate per affinare il risultato di una query standard.

Modellizzazione e segmentazione

    Modello: è uno strumento teorico che descrive il comportamento di un sistema reale.

I modelli offrono alle aziende la possibilità di determinare in modo semplice e costante nel tempo il futuro comportamento della clientela, oltre a stabilirne la redditività economico-finanziaria a lungo termine.

La segmentazione consente di classificare e riclassificare la clientela in base alle caratteristiche demografiche, alle costanti di acquisto, alla propensione all'acquisto ed ad altre categorie simili. Riportiamo di seguito alcuni esempi di possibili segmenti:

La segmentazione offre suggerimenti su come un'azienda dovrebbe trattare una determinata fascia di clienti e consente di rispondere a domande come queste:

Alcuni esempi di modellizzazione potrebbero essere i seguenti:

Knowledge Discovery

A differenza degli altri tipi di analisi, la Knowledge Discovery è un'analisi che parte da "zero ipotesi" e dato che non sappiamo quali domande porre non possiamo prevedere quali saranno le risposte che otterremo. La Knowledge Discovery, nota anche come scoperta non guidata della conoscenza (undirected knowledge discovery), scopre i modelli nei dati che riflettono il comportamento della clientele, le disdette, gli acquisti futuri o altri eventi aziendali. Questi modelli sono troppo particolari e apparentemente arbitrari per essere specificati e quindi l'analista sarebbe costretto a un continuo "gioco degli indovinelli" per cercare di immaginare i possibili modelli esistenti in un database. Fortunatamente il procedimento è esattamente l'opposto: speciali strumenti di Knowledge Discovery scoprono questi schemi e li comunicano all'analista specificando di cosa si tratta e dove reperirli. Naturalmente, poche aziende possono giustificare una simile ricerca randomizzata tra i propri e-data, specialmente se si considerano i costi degli strumenti e la complessa preparazione necessaria per analizzare i dati. Per queste ragioni prima di attuare una simile ricerca dati è comunque opportuno stabilire un, seppur vago, obbiettivo aziendale. Una casa farmaceutica utilizza Knowledge Discovery per esaminare cosa accade quando certe medicine vengono prese contemporaneamente, rendendo possibile l'analisi dei modelli di affinità dei prodotti. Inoltre l'azienda analizza successivi acquisti di prodotti in modo da determinare se certi medicinali portino a necessitarne degli altri (figura 1).

IMAGE

Figura 1. Un esempio di classificazione di analisi effettuate mediante la  Knowledge Discovery.

L'analisi delle affinità è una delle molte analisi di Knowledge Discovery possibili. Un potente algoritmo delle affinità legge tutti gli elementi informativi contenuti nei Data Warehouse e collega ogni attributo con ogni altro oggetto informativo prescindendo dal loro significato. Sebbene questa possa sembrare a prima vista un'analisi "forzata", il suo valore effettivo è dato dai risultati cui porta. Il risultato è un insieme di regole che descrive determinate relazioni tra i dati e queste regole possono portare sorprese interessanti. Considerate il valore dei risultati della seguente analisi di affinità:

Dei clienti che acquistano patatine e chupa-chups, il 74 percento acquista anche vino rosso.

Grazie a questo tipo di informazione, che non avrebbe potuto essere raccolta servendosi di query e analisi multidimensionali ma che risiede nel Data Warehouse come una pepita d'oro, il proprietario di un alimentari potrebbe attuare una serie di azioni, dalla spedizione di coupons ai clienti che acquistano più spesso uno di questi tre prodotti, all'eliminazione di sconti sul vino rosso, ad una più efficace disposizione dei prodotti nel negozio. Riportiamo di seguito un sorprendente elenco di dati che possono essere acquisiti mediante la Knowledge Discovery.

Nell'ambito della Knowledge Discovery i dati non mentono mai, l'unico aspetto discutibile resta l'attendibilità  dell'interpretazione di questi dati. Proprio come accade nel caso della modellazione e della segmentazione, anche i risultati delle analisi di Knowledge Discovery possono essere presentati in modi diversi e devono essere analizzati da specialisti che abbiano una certa familiarità sia con gli strumenti principali sia con i dati che risiedono nel Data Warehouse.