Gli ultimi decenni hanno visto un grande incremento della quantità di informazioni e di dati
memorizzati in formato elettronico.
Questo accumulo di dati è avvenuto con tassi di crescita
esplosivi. Si è stimato che la quantità di informazioni nel mondo raddoppia ogni 20 mesi
e le dimensioni e il numero dei database aumentano ancora più velocemente.
La disponibilità dei dati è favorita dall'uso di periferiche per l'acquisizione di dati,
quali i POS (Point of sale) negli esercizi commerciali, di terminali remoti, e di connessioni
alle reti.
Dopo aver concentrato una così grande quantità di dati, il problema è stabilire quale valore si possa ottenere da queste risorse di informazione. I database management system (DBMS) facilitano l'accesso ai dati memorizzati, ma questo è solo una piccola parte di quello che si può ottenere dai dati.
L'analisi dei dati può fornire ulteriori conoscenze sul business andando al di là dei dati esplicitamente memorizzati per derivare conoscenze riguardo alla situazione dell'impresa e dei mercato esterno: questo si chiama Data Mining o scoperta di conoscenza estratta dalla miniera dei dati aziendali.
Gli aspetti pratici del data mining possono essere:
Il data mining serve a vagliare grandi quantità di dati per produrre associazioni tra i dati, per scoprire regole e fatti. Tutto questo lavoro diventa produttivo se i dati appropriati vengono raccolti e memorizzati in un Data Warehouse