06.12.2021 Guglielmo Lanzani

Se cento frecce mancano il bersaglio. Big data e metodo scientifico

La scienza rappresenta la più imponente narrazione che l’umanità abbia mai saputo esprimere. 

Il suo metodo prevede di fare ipotesi e di verificarle quantitativamente. La matematica è il suo linguaggio. Lo scopo è di comprendere e spiegare in maniera sempre più completa i fenomeni della natura che ci circondano. Questo modo di concepire la conoscenza trova le sue radici nella civiltà greca. In greco antico il termine physis, che noi traduciamo “natura”, rappresenta la struttura di tutto ciò che è. Conoscere le leggi che governano la natura è la strada maestra non soltanto per arrivare alla verità, ma anche per orientare e organizzare la società. È un sapere in continuo divenire, capace di spostare i confini di ciò che va ritenuto vero, attraverso la progressiva capacità di eliminare le false credenze. La verità, nell’accezione scientifica, non è data una volta per tutte. Scienza – dal greco epistème – significa etimologicamente ciò che sta in piedi da sé. Ciò che ha in sé tutti i riferimenti per essere ritenuto vero, senza essere influenzato da fattori di distorsione quali opinioni, suggestioni, emotività, ideologie, credenze, falsi sillogismi, persuasione, imposizioni autoritarie, passioni. La scienza contemporanea concretizza questo principio con l’utilizzo della matematica e cioè la capacità sul mondo delle opinioni di quantificare, replicare e rendere verificabile qualsiasi affermazione. Le affermazioni della scienza sono leggi espresse sotto forma di equazioni più o meno complesse.

Nella società di oggi ricorre molto spesso l’espressione “algoritmo”. Un algoritmo è una funzione o un insieme di funzioni atte a rappresentare un fenomeno nella sua complessità, costruito in modo tale da poter fare delle previsioni circa i comportamenti del fenomeno analizzato. Le previsioni, per essere verificate e quindi considerate attendibili o vere, devono passare il vaglio della prova sperimentale. Sembra che Leonardo da Vinci abbia detto che gli esperimenti non mentono mai. Con questo voleva affermare la superiorità dell’esperienza sul mondo delle false opinioni. Il fatto cioè che solo attraverso di essi possiamo conoscere il mondo. Questa affermazione è il cuore della scienza, che è un metodo, non una risposta. Il metodo scientifico valida una teoria basandosi solo sugli esperimenti. È il modo migliore che l’umanità ha escogitato per trovare un sapere che sta in piedi da sé, ripulito di tutti gli effetti distorsivi. Sulla porta di un ufficio in un dipartimento di fisica ho letto una volta questa battuta: «possiamo credere in Dio, tutti gli altri devono mostrare i dati». Eppure, anche questa strategia di basarsi sulla sperimentazione non è esente da difficoltà di varia natura. Certo gli esperimenti dicono sempre qualcosa, ma capire che cosa può non essere facile. Una misura è sempre affetta da errore, se non lo si valuta correttamente, si sbaglia. Una misura può essere precisa, ma se presenta un errore sistematico sarà poco accurata, cioè non fornirà il valore vero. Una misura rumorosa è invece affetta da errore casuale, e sarà poco precisa. Per questo motivo gli esperimenti devono essere ripetuti molte volte. Solo i risultati ripetibili, sia pur con una certa variabilità, sono accettabili. Se paragoniamo la misura di una cosa con il tiro al bersaglio di cento frecce, possiamo immaginarci con chiarezza i due tipi di errore. Se tutte le frecce colpiscono il bersaglio esattamente a 10 cm dal centro la misura è precisa ma non accurata, c’è errore sistematico (l’arco è storto); se invece si distribuiscono attorno al centro, sopra, sotto, di fianco, a distanze variabili, c’è errore casuale (l’arciere trema). Quindi è importante fare gli esperimenti, ma sono i risultati che devono essere analizzati con cura e metodo. Ripetendo molte volte una misura si riesce, applicando la statistica, a valutare l’errore casuale. Quello sistematico invece è più subdolo da scoprire. Tuttavia, avere una buona misura, per la quale abbiamo valutato correttamente il livello di incertezza ed escluso l’errore sistematico, può non essere sufficiente.

A volte interpretiamo male anche osservazioni sperimentali corrette. Un esempio eclatante riguarda il moto del sole visto dalla terra. In un interessante film di Derek Jarman intitolato “Wittgenstein” viene riportato un aneddoto: uno studente – eroico per il solo fatto di seguire un corso di Wittgenstein – dice al professore che sembra comprensibile che gli antichi pensassero che il sole gira attorno alla terra, perché in fondo è proprio ciò che si vede. Wittgenstein gli risponde: e cosa si vedrebbe se fosse la terra a girare attorno al sole? Lo studente si illumina e lo ringrazia. Ha imparato che a volte i fatti sono chiari, ma siamo noi a interpretarli male perché facciamo errori concettuali basati su presunzioni non giustificate.

(Copertina)  Iconographies #20-07: “Tiger Hunt” after Rubens, Davide Quayola, 2014, stampa a getto d’inchiostro. (Sopra) Interferenza ottica a tre pattern, Enzo Ragazzini, 1969, ingrandimenti a colori su carta Cibachrome

Se il moto della terra rientra nell’osservazione della natura di tipo aristotelico, in generale la progettazione di esperimenti, la loro realizzazione e quindi l’interpretazione dei risultati sperimentali sono il pane quotidiano dello scienziato moderno. Qui interviene il ragionamento scientifico, che si esprime in linguaggio matematico. Fu Galilei il primo a parlarne, e ad applicarlo in questi termini. È pura speculazione chiedersi se sia la natura a essere matematica, o la nostra mente ad avere una griglia matematica per interpretare il mondo, perché il risultato non cambia: un modello matematico permette di descrivere il risultato ottenuto e prevederne di nuovi in maniera quantitativa. Per fare questo tipo di ragionamento usiamo quella parte della mente che Daniel Kahneman chiama sistema 2. Non si tratta di parti fisiche ben definite del cervello, ma piuttosto di un algoritmo della mente, una qualità. Il sistema 2 è quello che usiamo per fare calcoli complessi, prevedere situazioni in maniera logica, analitica, soppesando le probabilità. La cosa curiosa è che lo usiamo raramente perché comporta un grande dispendio di tempo ed energia. Motivo per cui se si è impegnati in un compito difficile che richiede attenzione, tipo guidare un’automobile lungo una stretta strada di montagna, è meglio non pensare alle condizioni, al contorno dell’equazione di Poisson, pena il rischio di finire fuori strada. Tempo ed energia che i computer hanno invece ampiamente a disposizione, perché il loro orologio va più veloce del nostro.
Per prendere decisioni in fretta e consumare poco prendiamo delle scorciatoie, le cosiddette euristiche. Nei fatti quotidiani, molto più spesso di quanto pensiamo, usiamo queste scorciatoie che si basano su schemi ripetitivi, mutuati dall’esperienza. Per lo più non siamo esseri razionali, ma adattivi. Cadi dalla bicicletta un po’ di volte, poi impari a stare su. Non risolviamo l’equazione del moto tutte le volte per calcolare l’angolo di pendenza massimo possibile compatibile con la conservazione del momento angolare, la velocità di traslazione e la stima dell’attrito; niente di tutto ciò, piuttosto registriamo dalle volte prima che si può piegare fino a lì. Questo modo di interpretare il mondo circostante è un notevole vantaggio evolutivo. L’incredibile interconnessione, a livello della corteccia cerebrale, delle informazioni raccolte dai nostri sensi e dall’esperienza ci permette di risolvere problemi complessi letteralmente in un batter d’occhio. Il portiere conosce la traiettoria della palla che dipende dalla forza con cui è stata calciata, la curva che ha preso, le condizioni ambientali, e si coordina con braccia e gambe per dare la giusta forza ai movimenti e intercettarla (spesso). Raro che un portiere abbia studiato fisica, e comunque ci vorrebbe un supercomputer per calcolare tutto. Infatti, non risolve equazioni differenziali, usa delle euristiche, si basa sulle esperienze precedenti. Chi fosse interessato a questo argomento deve leggere il bellissimo libro “Pensieri lenti e veloci” (Mondadori, 2012) di Daniel Kahneman, premio Nobel per l’economia. 
Da alcuni anni stiamo assistendo a qualcosa di nuovo e di interessante: anche le macchine hanno iniziato a utilizzare autonomamente queste scorciatoie. Però lo fanno a modo loro. Ci sono due ingredienti: i big data e l’intelligenza artificiale. Ovvero una montagna di dati e di sistemi di calcolo adattivi che imparano, cioè modulano i coefficienti dei loro algoritmi in base ai risultati e in maniera ricorsiva. I computer restano sempre degli idioti veloci, ma hanno imparato a trattare una mole di dati inimmaginabile per un essere umano. Trovano degli schemi ripetitivi in questi dati, senza alcun pensiero razionale, come noi facciamo movimenti d’istinto, e arrivano a soluzioni che appaiono come il risultato di un ragionamento. Così sembra che un sito di acquisti ci conosca, e sappia fare un profilo dei nostri gusti proponendoci cose che ci possono interessare, oppure un software cognitivo sa estrarre “informazioni” leggendo un testo. Ma usa il sistema 1 alla massima potenza. Può il metodo scientifico avvalersi di questi mezzi? In alcuni campi probabilmente sì. Dove si possono raccogliere milioni di dati, questi possono essere analizzati da un algoritmo che ne estrae delle correlazioni apparentemente logiche, ma in realtà statistiche.

Tuttavia, oggi appare improbabile che un computer possa inventare un esperimento per mettere in crisi una teoria. Ancora per quanto?