(foto: iStock/Getty Images)

In tempo di pandemia, quasi chiusi in casa per tentare collettivamente di arginare il contagio, la matematica si sta guadagnando uno spazio sempre più grande nel racconto dell’evoluzione epidemica. Tanti numeri – più o meno sensati, come abbiamo già raccontato – ci passano davanti ogni giorno, e non di rado si sentono citare espressioni tipiche dell’analisi matematica applicata all’epidemiologia. E se ancora resta qualche fatica nel capire il significato del concetto di crescita esponenziale, con quell’aumento via via più rapido ed esplosivo che la caratterizza, basta accendere la tv, aprire un giornale o scorrere la bacheca dei social network per veder comparire termini come “attenuazione del picco”, “punto di flesso” o addirittura “modello di crescita logistica”.

Senza stare a ripercorrere i princìpi dell’analisi matematica, tentiamo di mettere qualche punto fermo su quello che si può e non si può fare giocando un po’ con i numeri.

Lo spazio e il tempo

Partiamo dall’inizio, dalla materia prima di cui ogni modello statistico-matematico si nutre: i dati. Avere numeri significativi, conoscendone la distribuzione spaziale e la dinamica temporale, è il punto di partenza della formulazione matematica di trend e curve, proprio perché spazio e tempo sono le due variabili più importanti per una qualunque forma di orientamento, pure in senso epidemiologico.

Abbandonata ormai la possibilità di tracciare delle curve realistiche utilizzando i dati relativi ai contagi (perché sappiamo che esistono molti casi fantasma di Covid-19 non registrati dalle statistiche ufficiali), diversi scienziati indipendenti stanno elaborando i propri modelli a partire dai dati sui ricoveri in terapia intensiva e sui decessi, che peraltro sono gli unici a essere finora arrivati puntuali e completi ogni giorno. In sostanza, quindi, i modelli sfruttano le informazioni disponibili sui casi gravi, perché questi ultimi rappresentano una quota percentuale fissa e di facile riscontro rispetto al totale dei contagi. Più opinabile, invece, è la scelta di raccogliere i dati per provincia, perché se da un lato esiste più omogeneità metodologica su un territorio più ristretto, dall’altra non per tutte le province i dati arrivano con la stessa puntualità. Pure su scala regionale, naturalmente, vale lo stesso.

Di logistiche, gaussiane ed esponenziali

Ma veniamo alle curve matematiche vere e proprie: come qualunque modellizzazione della realtà, si tratta di semplificazioni costruite a partire da ipotesi. Uno dei modelli più utilizzati in epidemiologia, e di fatto applicabile anche al coronavirus, è il cosiddetto modello di regressione logistica, o più semplicemente modello logistico, che parte dall’idea di associare a ogni persona una variabile dicotomica, che può avere solo due valori possibili: sano o malato.

logistica_coronavirus
Alcune curve di distribuzione logistica (grafico: UniTo)

Quello che si ottiene (per chi fosse desideroso di approfondire, questo pdf dell’università di Verona spiega molte cose) è che l’evoluzione nel tempo del contagio prevede una fase di crescita iniziale, il raggiungimento di un picco e poi una fase finale di progressiva decrescita. Spesso, anche per questione di semplicità, si racconta la forma di questa curva di regressione logistica facendo riferimento alla molto più nota curva gaussiana, la famosa campana onnipresente in tutti i testi di statistica. In realtà è una semplificazione più che accettabile, almeno a livello comunicativo: di fatto, la distribuzione logistica è semplicemente una gaussiana con le code più spesse, ossia che si avvicina più lentamente all’asse orizzontale nelle due estremità. Di nuovo, per chi volesse approfondire c’è una tesi di laurea ad hoc dell’università di Torino.

La parte interessante di questo modello – per tornare alla quotidianità dei nostri media – è che la zona di crescita iniziale può essere sostituita con ottima approssimazione da una curva di tipo esponenziale. Quando spesso si sente parlare di modelli esponenziali, quindi, significa che si sta cercando di verificare quale andamento di crescita la curva epidemica stia seguendo in funzione del tempo.

coronavirus_esponenziale
Confronto tra una curva esponenziale (linea tratteggiata) e una distribuzione logistica (linea continua) nella parte iniziale della curva epidemica

Questo andamento è, ovviamente, ciò che si osserva quando l’epidemia è ancora in fase di piena espansione, e solo dopo aver rallentato il ritmo di crescita con un trend meno ripido della forma esponenziale si può iniziare a fare considerazioni su quando arriverà prima il flesso –  cioè il cambiamento nella concavità della curva, da verso l’alto a verso il basso –  e poi il picco epidemico, ossia quando avremo raggiunto il massimo e il tasso netto di riproduzione scenderà sotto il valore 1. Finché siamo in fase esponenziale, viceversa, stiamo percorrendo (purtroppo) solo l’inizio della curva di distribuzione logistica.

gaussiana_coronavirus
La distribuzione gaussiana

Per comodità, sempre nella fase iniziale esponenziale, a volte i dati vengono rappresentati su una scala non lineare ma logaritmica, in cui le curve esponenziali si trasformano (con un artificio matematico) in linee rette, dunque permettono di accorgersi più facilmente delle eventuali deviazioni dal trend. Al momento in cui scriviamo, dopo il bollettino dell’11 marzo, dall’analisi dei dati dei ricoveri in intensiva e dei decessi pare evidente che questa deviazione ancora non c’è stata: lo potete notare dai grafici aggiornati che abbiamo elaborato.

Si tratta però di una situazione estremamente complessa anche dal punto di vista matematico. Se da qualche giorno la curva delle terapie intensive ha cambiato la sua forma, restando esponenziale ma facendosi meno ripida, usando il dato combinato con i decessi non si è ancora notato alcuno scostamento rispetto al trend esponenziale. È dunque plausibile che i casi gravi, che nei primi giorni dell’epidemia avrebbero avuto un posto in terapia intensiva, non abbiano più trovato spazio negli ultimi giorni, spiegando come mai i decessi stiano aumentando più in fretta rispetto ai ricoverati in intensiva.

Un aspetto da chiarire, però, è che questi modelli non hanno alcuna ambizione predittiva di ciò che accadrà, se non sul brevissimo termine, e si limitano a descrivere matematicamente ciò che è successo finora, evidenziando prontamente eventuali cambiamenti nel comportamento epidemico. Infatti, il punto più importante è che queste curve non sono predeterminate come le orbite dei corpi celesti, ma dipendono criticamente dalle precauzioni adottate e dall’efficacia delle misure di contenimento del contagio. In altri termini, più che stare a prevedere quando la curva raggiungerà il picco e invertirà il proprio andamento, converrebbe agire per modificare attivamente l’andamento di quella curva. Ossia, per dirla con una battuta, stando a casa.

Alcune domande a cui nessuno ha risposta

Qualcuna ha proprio poco senso, altre sarebbero interessanti ma al momento non esistono i dati di cui avremmo bisogno. Insomma, ecco qualche domanda che per adesso non vale la pena di fare.

Che effetto stanno avendo le misure adottate?

Non si può sapere. La scala temporale su cui si può valutare l’effetto di una nuova misura di contenimento è dell’ordine di grandezza del periodo di incubazione. Se è vero che l’incubazione media non è di 14 giorni (che è il massimo) ma di 4-7 giorni, dobbiamo aspettare come minimo quella quantità di tempo, o forse anche il doppio, prima di poterne osservare un eventuale effetto incoraggiante. Il premier Giuseppe Conte, per stare sul sicuro, nelle sue conferenze stampa serali ha parlato apertamente di “due settimane”. La previsione più facile di tutte, relativa ai prossimi giorni, è che i numeri dell’epidemia continueranno a crescere: resta però da capire se e quando si inizierà ad abbandonare la fase esponenziale.

Quindi quando avremo il picco?

Se il trend continuerà come ora, mai: l’andamento esponenziale ha infatti la caratteristica di crescere all’infinito. Ovviamente prima o poi un picco si raggiungerà (fosse anche nella tragica situazione in cui si esauriscono le persone da contagiare), ma al momento è impossibile fare previsioni attendibili proprio perché siamo ancora in attesa di quel cambio di comportamento che vorremmo indurre con le misure di contenimento. Poi ci si può sbizzarrire nel fare modelli che hanno come picco la fine di marzo, la metà di aprile o la fine di aprile, si può includere oppure no l’ipotetico effetto di perdita di efficacia del virus con l’arrivo della bella stagione, si possono fare confronti con la Cina o con altre epidemie. Ma al momento nessuna previsione ha un grado di attendibilità sufficiente da farci affidare ai risultati che propone. Se non nella versione così grossolana da essere inutile del “fra qualche settimana o qualche mese”.

Quanto erano già malate le persone morte col coronavirus?

Va detto: finora ciò che sappiamo sulle persone non sopravvissute all’infezione da coronavirus Sars-Cov-2 è poco. Abbiamo una suddivisione precisa in fasce d’età e un sommario conteggio delle patologie pregresse, ma non sappiamo né la gravità di queste patologie (l’ipertensione, per esempio, può avere livelli molti diversi) né quanto la Covid-19 sia stata determinante per l’exitus. In modo cautelativo si sta continuando a usare l’espressione “morti con” e non “morti per” il coronavirus, ma si fa sempre più pressante la richiesta di cominciare ad avere statistiche e informazioni affidabili su questo punto, visto che ormai i decessi sfiorano il migliaio e la comunicazione ufficiale è sempre stata estremamente vaga, anche di fronte alle domande dirette dei giornalisti.

Perché alcune domande che hanno tenuto banco per giorni sono state ora dimenticate?

In realtà in questo caso la vera domanda è perché sui mass media siano prevalse per oltre una settimana alcune questioni sostanzialmente inutili. Due esempi. Il primo è l’enorme tema della doppia verifica dei tamponi, prima da parte dei laboratori regionali e poi dell’Istituto superiore di sanità: oggi, che siamo a oltre 10mila casi positivi, i confermati sono meno della metà (per via del ritardo accumulato nell’elaborazione) ma allo stesso tempo sono il 98% di quelli per cui l’analisi è stata conclusa. Insomma, al di là dell’importanza formale di questo double check è parso evidente che, a livello operativo, conviene usare i dati regionali senza attendere il riscontro definitivo. L’altro esempio è il confronto con gli altri paesi: come si era detto fin dal principio, l’Italia è semplicemente in anticipo di 7-10 giorni nella curva epidemica rispetto a molti altri stati, dunque le elucubrazioni e le strambe teorie su dati falsati e altri complotti sono finite presto archiviate.

Quanto è peggio rispetto all’influenza stagionale?

Premesso che la domanda, ricorrente, ha di per sé poco senso, è decisamente presto per proporre valutazioni quantitative. Lo si potrebbe fare per la letalità (che però potrebbe dipendere anche dal livello di saturazione dell’offerta ospedaliera), così come per il numero di ricoveri in terapia intensiva. Tuttavia, proprio perché siamo ancora abbondantemente nella prima metà della curva epidemica, è inadeguato proporre valori numerici. L’unica cosa che sappiamo è che già ora ha avuto un impatto sul sistema sanitario senza precedenti.

The post Come funzionano i modelli matematici sul coronavirus (e le domande cui non possono rispondere) appeared first on Wired.



Leggi l’articolo su wired.it