I Big Data sono dei Big OGM?

I dati non esistono in Natura: c’è sempre qualcuno che li ha prodotti, raccolti e pubblicati. 

Con quale metodo?
Quello casuale è il meno dannoso, cercare conferme per la propria teoria è il male assoluto. I dati sono prima di tutto espressione dei metodi soggettivi di chi li ha raccolti. Non hanno alcun valore oggettivo: sono stati toccati dall’Uomo e dai suoi pregiudizi (bias), anche inconsapevoli, quindi non sono mai naturali una volta che sono entrati in contatto con le persone.

Cosa cambia adesso?
Un piccolo database ci consentiva di controllare i dati, quali erano le fonti e il metodo di raccolta.
Nei grandi database, una volta che la prima macchina ha ingerito il dato diventa una comunicazione “machine to machine”, con processi paralleli (Hadoop) e attraverso strati di elaborazione concatenati. L’uomo ne è escluso: dato il volume, la varietà e la velocità dei dati il risultato che emergerà non è più controllabile dalle persone comuni, neanche dagli specialisti.

Di sicuro sono tante le persone che hanno prodotto quei dati e sono purtroppo diverse dalle altre persone che li useranno. Inoltre nessuno è consapevole dei dati mancanti. Nel suo ultimo post Luca De Biase scrive appunto che non dobbiamo partire dai Big Data a disposizione per iniziare un ragionamento.

Prendiamo in esame il campo medico: chissà con quali finalità e con quali protocolli in giro per il mondo sono state raccolte le cartelle cliniche nel mondo sanitario; non vorremmo che una macchina oggi diventasse il nostro medico, perché il Big Data è una scienza(?) ancora troppo giovane, ci sono troppe incognite e troppa esagerazione, al momento.

Big data o no, l’analisi sui dati resta molto importante per il nostro futuro. Avrà successo chi individuerà il giusto mix nel confidare sui Big Data e sull’intuizione. Ancora più importante è capire lo sfruttamento di una risorsa fondamentale per le imprese, che ha un mercato immenso, e i danni potenziali che si possono fare per accapparrarsi prima degli altri dati pieni di pregiudizi.

Il rischio è la delega alle macchine; è attendere il loro responso (senza sapere neanche cosa abbiano ingerito e macinato) invece del nostro giudizio. Speriamo solo non sia una fuga dalle nostre responsabilità.

Takeaways:
I Big Data sono utili per capire il mondo? Si
Gli OGM possono essere utili? Si
I Big Data, come gli OGM, se non sappiamo cosa contengono possono far male? Si

Twitter: @massimochi