Database Management System e Datawarehouse: che cosa sono ?

Prima di descrivere i concetti e le differenze tra il DataBase Management System e il Datawarehouse occorre definire il concetto di Database.
Il database è una collezione di dati che viene gestita e organizzata da un software specifico, il Database Management System (DBMS).

Il DBMS è un sistema software progettato per consentire la creazione, la manipolazione e l’interrogazione efficiente di database, per questo detto anche “gestore o motore del database”, è sostanzialmente uno strato software che si frappone fra l’utente ed i dati.
In passato i DBMS, a causa dell’elevato valore economico occorrente per l’acquisto delle grandi infrastrutture necessarie per realizzare un sistema di database efficiente, erano all’esclusiva portata delle grandi aziende e istituzioni, oggi il loro utilizzo è ben più accessibile e diffuso praticamente in ogni contesto.

Un DBMS ha la funzione di:

  • consentire l’accesso ai dati attraverso uno schema concettuale;
  • permettere la condivisione e l’integrazione dei dati fra applicazioni differenti;
  • controllare l’accesso concorrente ai dati;
  • assicurare la sicurezza e l’integrità dei dati.

I DBMS devono garantire affidabilità (cioè la capacità del sistema di conservare sostanzialmente intatto il contenuto della base di dati in caso di malfunzionamento hardware e software) e la privatezza dei dati, nonché deve risultare efficiente ed efficace, efficiente nella capacità di svolgere le operazioni utilizzando un insieme di risorse (tempo e spazio) che sia accettabile per gli utenti , ed efficace nella capacità della base di dati di rendere produttive in ogni senso, le attività dei suoi utenti.
Tra i vari DBMS occorre menzionare: Oracle, SQL, Access.

Il datawarehouse, invece, definisce quella raccolta d’informazioni e di dati che diventano il cuore del sistema di definizione delle strategie aziendali, una base di dati sulla quale si fondano le analisi a supporto delle scelte manageriali (di fatto un database con funzioni speciali).
Il DW è un archivio fisicamente separato dalle basi di dati usate per le operazioni quotidiane che non richiede operazioni di aggiornamento continuo, le uniche operazioni effettuabili su questo database sono il caricamento iniziale dei dati e l’accesso in lettura.
I dati in un sistema di Datawarehousing vengono caricati con strumenti ETL (Extract, Transform, Load), che eseguono tre operazioni:

  • Estraggono i dati dai sistemi sorgenti;
  • Trasformano i dati eseguendo operazioni di pulizia dei dati;
  • Caricano i dati nel data warehouse.

Il ruolo degli strumenti di ETL consiste nell’alimentare una singola sorgente di dati, per fare in modo che sia dettagliata, esauriente e di alta qualità.
Questa a sua volta andrà ad alimentare il data warehouse.

Un altro concetto da conoscere è quello dell’OLAP (OnLine Analytical Processing), un insieme di tecniche software per l’analisi interattiva e veloce di grandi quantità di dati, che è possibile esaminare in modalità piuttosto complesse.
Gli strumenti OLAP si differenziano dagli OLTP (On-Line Transaction Processing) per il fatto che i primi hanno come obiettivo la performance nella ricerca e il raggiungimento di interrogazioni quanto più articolate sia possibile; i secondi, invece, mirano ad una garanzia di integrità e sicurezza delle transazioni. L’applicazione tipica di OLAP è all’interno di strumenti di Business Intelligence (BI).

Differenze tra DataBase Management System e Datawarehouse

Una fondamentale differenza tra i due database è data dalla funzione che esercitano, mentre il DBMS ha l’obiettivo di registrare in tempo reale i dati con il quale esso viene alimentato, il DW è progettato (generalmente) sulla base di sistemi OLAP per compiere aggregazioni di dati a fini analitici.
La seconda differenza: uno è legato all’applicazione, l’altro è al servizio dell’analista.
Effettuare analisi di business su un database è una soluzione che richiede di effettuare un’istantanea della situazione attuale, estrapolare i dati dal DB operativo e procedere con lo studio dei dati e la reportistica. Quando tutto ciò non richiede d’interrompere l’esecuzione dell’applicazione.

Il valore aggiunto di un data warehouse è l’elevato livello di qualità delle analisi possibili anche grazie all’integrazione con piattaforme di Business intelligence e analytics.
Attraverso un data warehouse le interrogazioni a fini analitici possono avvenire senza interferire con i processi di repository dei dati.

Lascia un commento