Natura dei dati analizzabili e soluzioni d'analisi
9 settembre 2016

2 premesse fondamentali:

  1. affrontiamo il tema in una logica di Information Technology;
  2. partiamo da un dato che ci è stato fornito da indagini globali sulla “struttura” dei dati che sono potenzialmente disponibili “in giro per il mondo”: l’80% di questi sono “non strutturati”.





Innanzitutto, abbiamo le idee chiare su come possano essere suddivisi i dati in relazione alla loro struttura e, non meno, cosa sia la “struttura” dei dati?


Sulla base delle premesse indicate, i “dati strutturati” sono i dati conservati in database, organizzati secondo schemi e tabelle rigide e conosciute.

Questa è la tipologia di dati che consente la creazione immediata di modelli di gestione relazionale delle informazioni.


I “dati non strutturati” sono i dati conservati, ammesso lo siano, al di fuori di database e senza alcuno schema. Parliamo, esemplificando, di file di testo e/o file multimediali.

Anche quando la conservazione fosse “sistematizzata”, i sistemi utilizzabili di gestione di dati sono quelli dell’information retrieval (IR).

L’IR, il reperimento delle informazioni, secondo Wikipedia, è” l'insieme delle tecniche utilizzate per gestire la rappresentazione, la memorizzazione, l'organizzazione e l'accesso ad oggetti contenenti informazioni quali documenti, pagine web, cataloghi online e oggetti multimediali”.                   

 
Esiste, poi, una categoria intermedia di dati: i "dati semi strutturati”.

Nei dati semi strutturati, s’incontrano alcune delle caratteristiche dei dati strutturati e alcune delle caratteristiche dei dati non strutturati.  Pensiamo ai file XML, ad esempio, nei quali, nonostante non vi siano limiti strutturali all’inserimento dei dati, le informazioni vengono, comunque, organizzate secondo logiche strutturate e interoperabili.

 

Abbiamo già affrontato il tema “big data/analytics/business intelligence”.

Qui riflettiamo sul fatto di come sia sfidante la conquista del 100% dei dati potenzialmente disponibili (e delle conseguenti informazioni) e di come il viatico sia l’acquisizione di modelli d’analisi che vadano oltre le soluzioni di business intelligence.

La potenza e le prestazioni delle tecniche analitiche impiegate avvalora il processo decisionale e consente una valutazione puntuale (e tempestiva) degli esiti futuri delle decisioni assunte.

Questo consente un approccio alla progettualità d’impresa meno condizionato dal fattore tempo, poiché i “decisori” aziendali possono valutare in tempi rapidi quali siano le ricadute delle scelte operate, e non solo in termini strettamente economico-finanziari.


 

Business Intelligence vs Advanced Analytics

 


Ci proponiamo di definire, in modo sintetico, i confini delle due modalità d’analisi, sia per una corretta capacità comunicativa, sia per un altrettanto precisa capacità interpretativa.

Se confrontiamo i sistemi di business intelligence con i sistemi di advanced  analytics, secondo 2 logiche sostanziali:

  • quali obiettivi si propongono (o a quali esigenze rispondono);
  • quali strumenti utilizzino;

quello che segue potrebbe essere un quadro comparativo che ci consente, con buona approssimazione, di mettere in relazione le problematiche che fossimo in grado d’indagare con la tipologia di soluzione coerente, avendo un riferimento agli strumenti da attivare:


 

Business Intelligence

Advanced Analytics

Obiettivi   e domande a cui rispondono

Cos’è accaduto?

Quando?

Di chi sono i   dati/risultati in esame?

Quanto/quanti?

Perché è accaduto?

Potrebbe accadere di   nuovo?

Cosa accadrebbe se   cambiassimo “X” o “Y”?

Cos’altro ci dicono i   dati che non abbiamo mai pensato di chiedere?

Strumenti   utilizzati/bili

Reportistica, inclusi   KPI –Key Performance Indicators

Costruzione di “query”   ad hoc

Tecniche OLAP, come   cubi multidimensionali, strumenti di segmentazione bidimensionale di dati   (slice & dice), drilling

Cruscotti di sintesi e   pannelli d’analisi (scorecards)

Analisi dati in tempo   reale –Operational BI

Sistemi automatici di   monitoraggio ed allerta

Analisi statistiche   per la individuazione dei trend, sino a

Modelli ed analisi   predittive

Estrazioni di   specifiche “conoscenze” dallo scrutinio (automatico o semiautomatico) di   grandi quantità di dati –Data Mining

Modelli ed analisi   predittive

Analisi di relazioni,   tendenze, preferenze, ecc. – Big Data Analytics

Analisi dei dati   contenuti in testi di linguaggio naturale –Text Analytics/Mining

Statistiche   multivariate (a più dimensioni) e relativi test

Contenuti

Collegamenti

Download

“Target Cross è un prodotto di Cross Software Ltd – Malta, distribuito e sviluppato in Italia da Four Solutions s.r.l – Modena”
©  Fourbytes s.r.l. - Via Bottego 243/B - 41126 Cognento MO - Italy - Tel. +39 059 2919811 - Fax +39 059 2919825 - info@fourbytes.it
C.F/P.Iva 03143960361 - Rea cciaa 362374 - Cap.Sociale € 50.000,00 i.v.