Indica un intervallo di date:
  • Dal Al

Critica della ragion pura contro i Big Data

12_08_28_c03

Photo: http://www.computerweekly.com/news/2240179890/Cloud-big-data-and-social-media-is-transforming-HR

In questi tempi di
fervore digitale ci siamo così infatuati del modello Big Data da inasprire
ancor di più il classico bipolarismo per la conquista della verità. Da una parte chi
ama i numeri e per questo aggrega miliardi di dati, credendo che in tal modo
possano avvicinarsi all’essenza dei fatti. Dall’altra parte
ci sono quelli che studiano le azioni delle persone attraverso i comportamenti
e le sensazioni, confidando sulle discipline sociali e sull’istinto primordiale.

Ora le due fazioni
si scontrano su chi può prevedere meglio il futuro. I matematici
vantano un privilegio momentaneo: la tecnologia è dalla loro parte, pertanto si
sentono in grado di predire chi vincerà le elezioni, chi guadagnerà da quella
azione di marketing, etc. Gli “umanisti”
d’altro canto ritengono che le singole persone, con le loro interazioni
determinano il risultato, che rimane imprevedibile. Lo studioso più
famoso nel campo statistico-matematico è Nate Silver; in quello
psicologico-economico è Daniel Kahneman.

L’abbondanza di dati
non assicura l’esattezza di una previsione, per esempio sul risultato di una
partita di calcio. Mai come di questi
tempi abbiamo così tanti dati sui calciatori, sui loro movimenti e serie
storiche, perfino sul successo dei singoli passaggi. Tuttavia nelle interazioni
tra giocatori non esistono modelli matematici degli eventi, come in fisica. Essi
interagiscono con aspettative ed emozioni –prima- dell’evento e la loro
reazione non varia in modo lineare né razionale in funzione della risposta
altrui. Dove altrui può essere una squadra, una comunità o un insieme molto
grande.

Un'altra esemplificazione: non è il numero degli ingredienti a disposizione di un cuoco la garanzia di un buon piatto, ma è la conoscenza che si mette nella ricetta. Tra i tanti input e l'output c'è un problema di epistemologia, che diventa rilevante con i Big Data.

Oltre ai
dati strutturati, che conosciamo abbastanza bene, ora l’enfasi è su quelli non ancora
strutturati
. Sono i più importanti, che non analizziamo perché
non li abbiamo ancora modellati. Questa massa di dati
pone molti problemi sul metodo da adottare per orientarsi. Occorre servirsi di
una bussola “mentale”: sapere prima cosa vogliamo cercare. Per questo non
possiamo partire dai dati, ci sono due ragioni: 1. potrebbero non esserci. 2. perché
bisogna partire dall’ipotesi e poi falsificarla con i dati a
disposizione, purtroppo solo con quelli modellati, che restano una minoranza.

Il percorso che
ora si vuol intraprendere -con troppa foga- è passare dalla congettura a una
nuova legge, grazie alla potenza dei computer. La congettura è
caratterizzata da un grado di confidenza molto basso, perché non ci sono state
verifiche indipendenti sulle cause di correlazione. Inoltre, con molti dati a
disposizione aumenta la varianza e quindi il rischio di tradurli in false
informazioni.  

Il computer può diventare così il braccio armato di fanatici numerologi che, con algoritmi costruiti su congetture, volano sulle ali della tecnologia e si allontanano dagli
altri. Il timore è che se ci sono i
dati allora siamo portati a pensare, troppo velocemente, di avere anche la
teoria e la previsione. Abbiamo visto che non è così: i dati rilevano cosa le
persone hanno fatto, ma non il perché. Questo è il bipolarismo che dobbiamo
ricomporre. 

Twitter:
@massimochi