Critica della ragion pura contro i Big Data

12_08_28_c03

Photo: http://www.computerweekly.com/news/2240179890/Cloud-big-data-and-social-media-is-transforming-HR

In questi tempi di
fervore digitale ci siamo così infatuati del modello Big Data da inasprire
ancor di più il classico bipolarismo per la conquista della verità. Da una parte chi
ama i numeri e per questo aggrega miliardi di dati, credendo che in tal modo
possano avvicinarsi all’essenza dei fatti. Dall’altra parte
ci sono quelli che studiano le azioni delle persone attraverso i comportamenti
e le sensazioni, confidando sulle discipline sociali e sull’istinto primordiale.

Ora le due fazioni
si scontrano su chi può prevedere meglio il futuro. I matematici
vantano un privilegio momentaneo: la tecnologia è dalla loro parte, pertanto si
sentono in grado di predire chi vincerà le elezioni, chi guadagnerà da quella
azione di marketing, etc. Gli “umanisti”
d’altro canto ritengono che le singole persone, con le loro interazioni
determinano il risultato, che rimane imprevedibile. Lo studioso più
famoso nel campo statistico-matematico è Nate Silver; in quello
psicologico-economico è Daniel Kahneman.

L’abbondanza di dati
non assicura l’esattezza di una previsione, per esempio sul risultato di una
partita di calcio. Mai come di questi
tempi abbiamo così tanti dati sui calciatori, sui loro movimenti e serie
storiche, perfino sul successo dei singoli passaggi. Tuttavia nelle interazioni
tra giocatori non esistono modelli matematici degli eventi, come in fisica. Essi
interagiscono con aspettative ed emozioni –prima- dell’evento e la loro
reazione non varia in modo lineare né razionale in funzione della risposta
altrui. Dove altrui può essere una squadra, una comunità o un insieme molto
grande.

Un'altra esemplificazione: non è il numero degli ingredienti a disposizione di un cuoco la garanzia di un buon piatto, ma è la conoscenza che si mette nella ricetta. Tra i tanti input e l'output c'è un problema di epistemologia, che diventa rilevante con i Big Data.

Oltre ai
dati strutturati, che conosciamo abbastanza bene, ora l’enfasi è su quelli non ancora
strutturati
. Sono i più importanti, che non analizziamo perché
non li abbiamo ancora modellati. Questa massa di dati
pone molti problemi sul metodo da adottare per orientarsi. Occorre servirsi di
una bussola “mentale”: sapere prima cosa vogliamo cercare. Per questo non
possiamo partire dai dati, ci sono due ragioni: 1. potrebbero non esserci. 2. perché
bisogna partire dall’ipotesi e poi falsificarla con i dati a
disposizione, purtroppo solo con quelli modellati, che restano una minoranza.

Il percorso che
ora si vuol intraprendere -con troppa foga- è passare dalla congettura a una
nuova legge, grazie alla potenza dei computer. La congettura è
caratterizzata da un grado di confidenza molto basso, perché non ci sono state
verifiche indipendenti sulle cause di correlazione. Inoltre, con molti dati a
disposizione aumenta la varianza e quindi il rischio di tradurli in false
informazioni.  

Il computer può diventare così il braccio armato di fanatici numerologi che, con algoritmi costruiti su congetture, volano sulle ali della tecnologia e si allontanano dagli
altri. Il timore è che se ci sono i
dati allora siamo portati a pensare, troppo velocemente, di avere anche la
teoria e la previsione. Abbiamo visto che non è così: i dati rilevano cosa le
persone hanno fatto, ma non il perché. Questo è il bipolarismo che dobbiamo
ricomporre. 

Twitter:
@massimochi

  • Luca |

    Egregio, sono spiacente per il tono che ho contrapposto ad una presentazione che mi é parsa eccessivamente dura. Semplicemente rifiuto la contrapposizione e la dipartita di quella che percepisco come unica disciplina. Conosco alcuni dei principi che sono alla base del Machine Learning ed avendo studiato da autodidatta su testi anglosassoni posso citarli con il nome di Learning Theory, Bias Variance Tradeoff, Texas Sharpshooter Fallacy, Clustering Illusion, etc .., etc… Essendo principi che si studiano nell’ambito dell’Intelligenza Artificiale in essi si trova la controtesi. Piuttosto, mi viene da dire che non sempre gli uomini hanno piena consapevolezza e padronanza degli strumenti che adottano (anche alcuni matematici). Ciononostante i successi del ML sono sotto gli occhi di tutti. Cordiali Saluti

  • Massimo |

    Sig. Luca, questo è un post dove si esprime una riflessione sul tema dei big data. Faccia una domanda specifica e proverò a rispondere se conosco la risposta, oppure le indicherò un paper o un link per approfondire la questione.
    Grazie per il commento.

  • Luca |

    Credo che queste affermazioni, per come poste, siano da rifiutare. E’ probabile che l’indagine giornalistica non sia sufficentemente approfondita da poter conoscere le materie di cui parla (per lo meno entrambe). Occorrono anni di studio per porre basi di conoscenza solide utili allo scopo ed a comprendere come far buon uso degli strumenti in questione, sia da un lato, che dall’altro. A noi occorrono menti aperte.

  • raffaele |

    Gli Italiano lo chiamano BUON SENSO o equilibrio le emozioni/pensieri influenzano—

  • Simone Magnani |

    Io questa contrapposizione tra matematica e resto del mondo non la vedo. Vedo limiti alla infallibilità del modello big data (matematico). Sono qui che servono cultura e approccio qualitativo per fare passi avanti.

  Post Precedente
Post Successivo