CONTROVIRUS | Difficili previsioni con i coronadati

<span class='cat'>CONTROVIRUS |</span> Difficili previsioni con i coronadati

Condividi

di Antonietta Mira, professore di Statistica, Università della Svizzera italiana e Università dell’Insubria

Statistici ed epidemiologi si confrontano ogni giorno con la richiesta di fare previsioni sull’evoluzione della pandemia. Ma per fare previsioni servono dei buoni dati e dei buoni modelli. Se anche abbiamo dei buoni modelli ma i dati a disposizione non sono affidabili le previsioni che ne ricaviamo non saranno, purtroppo, attendibili. Abbiamo un mantra fra gli statistici: garbage-in, garbage-out: se, in un modello, entrano dati-spazzatura non possono che uscirne previsioni-spazzatura.

I dati sul Coronavirus riportati dalle fonti ufficiali soffrono di diverse forme di distorsione legate a come sono raccolti e ai tempi stessi di raccolta, che hanno spesso ritardi non uniformi per le varie regioni e per le varie categorie. 

È di pochi giorni fa la notizia che Wuhan ha corretto i dati dei decessi aggiungendo 1.290 casi: è una correzione enorme, del 50%, che è stata fatta quando, finita la fase emergenziale, le autorità hanno iniziato a fare delle verifiche incrociate e a includere i decessi avvenuti nelle abitazioni, gli errori fatti dagli ospedali nel riportare i decessi, e li hanno incrociato con i dati dei crematori, delle prigioni, delle case per anziani.

In Ticino mi risulta che i decessi per COVID-19 in case di riposo nel Canton Grigioni riferiti ad anziani residenti in Ticino, siano attribuiti al Ticino. Una prassi che in tempi di coronavirus fornisce una immagine distorta della diffusione geografica della pandemia. Per non parlare dei tempi di racconta. In Ticino, ma lo stesso vale per la Lombardia, i dati che vengono comunicati ogni mattina alle 8 fotografano, per alcune variabili, la situazione in essere circa 24 ore prima. Per altre, la situazione riportata è quella di alcuni giorni precedenti, fino a 3 o 4. Questa asincronia che varia da Paese a Paese, e nello stesso Paese, è diversa a seconda della fase in cui ci si trova, crea problemi di distorsione della fotografia che riceviamo. E questo a sua volta genera difficoltà a livello di previsione. Tutto ciò è comprensibile: in una fase emergenziale in un ospedale ci si preoccupa di salvare vite umane e non tanto di riportare alle autorità competenti quante persone sono decedute.

Poi c’è il problema di che cosa si conta, ovvero le questioni definitorie. Come mi spiega mio padre che è medico, tutti moriamo per arresto cardiaco ma non per questo nelle statistiche ufficiali l’arresto cardiaco è considerata la prima e l’unica causa di morte, ovvero con il 100% dei decessi riportati a questa causa. Ecco, una distinzione simile ma più sfumata andrebbe fatta fra decesso per coronavirus o con coronavirus. Se la causa primaria di morte è l’infezione da COVID-19 e non ci sono altre co-morbidità, ovvero altre patologie concomitanti, allora si tratta di un decesso per COVID. Nei pazienti anziani però spesso il decesso avviene perché intervengono varie cause concomitanti. In questi casi il decesso è con COVID. E allora è chiaro che qui entrano degli elementi di discrezionalità nel riportare, o addirittura nel verificare, se un decesso va annoverato o meno nelle statistiche ufficiali. Per esempio, i tamponi post-mortem in Germania non vengono fatti. In Italia non venivano fatti durante l’emergenza, solo recentemente hanno iniziato a farne. Se si fanno tamponi post-mortem il numero dei decessi attribuiti a COVID-19 aumenta.

Anche la questione del numero dei tamponi è rilevante: più tamponi si fanno, più casi positivi emergono. E il numero di tamponi fatti varia da Paese a Paese a seconda della disponibilità dei tamponi ma anche di politiche e protocolli adottati e, all’interno di uno stesso Paese, varia da momento a momento. Per esempio, in Italia per dichiarare un caso guarito, il protocollo dell’ISS richiede che vengano fatti 2 tamponi con esito negativo. È chiaro che di questo bisogna tenere conto quanto si valuta se i tamponi fatti sono tanti o pochi rispetto alla popolazione, da un lato, e rispetto ai nuovi casi emersi dall’altro. In Svizzera invece l’Ufficio federale della Sanità Pubblica considera un paziente guarito, nel caso avesse sintomi lievi e quindi probabilmente a casa in quarantena, dopo almeno 10 giorni dall’insorgere dei sintomi più 48 ore trascorse senza sintomi e non è richiesto un tampone negativo di verifica. Le 48 ore diventano 2 settimana se i sintomi erano più seri. Ma la cosa sta cambiando, perché da ieri tutte le persone con sintomi influenzali dovranno fare un tampone. Come si è detto, il numero dei tamponi eseguiti dipende anche dal numero di tamponi disponibili e dalla capacità di processarli in tempo utile. Durante la fase emergenziale mancavano i tamponi, e i laboratori per analizzarli davano risposte in tempi lunghi, anche di alcuni giorni. Oggi in Ticino mi dicono per esempio che il laboratorio dell’Ente Ospedaliero Cantonale è in grado di processarli nel giro di circa 8 ore. Ma stanno per arrivare metodi automatizzati per processare tamponi in pochi minuti, e nel contempo sono già disponibili esami del sangue che comportano una lettura rapida ed economica degli anticorpi presenti in chi ha contratto il COVID-19 e lo ha superato.

Ma la domanda a cui tutti vorrebbero una risposta è se i dati ci possono aiutare a capire a che punto siamo dell’epidemia.

Con Anthony Ebert, uno studente australiano post-doc dell’USI che collabora a un progetto finanziato dal SNF portato avanti da me insieme a un collega della Harvard School of Public Health, abbiamo costruito grafici che possono aiutare a capire dove ci troviamo lungo il difficile cammino dell’evoluzione della pandemia. I grafici, che chiamiamo ”spaghetti plot”, sono una descrizione dello status quo e non si avventurano in previsioni perché con i dati disponibili è molto difficile farne.

Vediamo prima uno di questi spaghetti plot, quello per la Mondo: ogni spaghetto rappresenta un Paese. Quando clicco play parte una sorta di film dove gli attori sono i vari Paesi.

Come sono costruiti gli spaghetti plot? I dati che alimentano i grafici sono presi da fonti ufficiali: Ufficio Federale della Sanità Pubblica, Protezione Civile Italiana, Organizzazione Mondiale della Sanità. Sull’asse delle ascisse, quello orizzontale, riportiamo, giorno per giorno, il totale dei casi positivi confermati fino a quel giorno. Confermati significa che è stato fatto un tampone e l’esisto positivo del tampone è stato confermato dalle autorità della sanità pubblica di quel paese. Sull’asse delle ordinate, quello verticale, abbiamo invece la somma dei nuovi casi positivi nei sette giorni precedenti. Il tutto è rappresentato su scala doppiamente logaritmica. Significa che sugli assi invece di avere 1, 2, 3 etc. abbiamo 1, 10, 100, 1000. Questo cambiamento di scale è utile perché altrimenti la crescita, che inizialmente è esponenziale, sarebbe troppo rapida per essere visualizzata bene. Inoltre, una crescita esponenziale appare come una retta se la rappresentiamo in un grafico su scala logaritmica; e gli scostamenti da un andamento lineare sono di più facile lettura.

Quando in un Paese l’epidemia si va spegnendo, nel nostro grafico vedremo la linea corrispondente piegare verso il basso. Significa che il numero dei nuovi positivi dell’ultima settimana rallenta la sua crescita e questo vuol dire che stiamo uscendo dalla fase critica. Quando il numero dei nuovi positivi si ferma la curva inizia a scendere verso il basso verticalmente. Questo fino ad ora è successo in modo marcato e determinato per la Cina e per il Sud Corea.

La Cina è il primo Paese che compare sul grafico quando cliccate su play. In effetti in Cina abbiamo il primo caso identificato il 7 gennaio. Una prima flessione avviene attorno al 10 febbraio, poi una flessione decisa è evidente il 19 dello stesso mese.

Con un doppio click sul nome del “Paese” che compare nella legenda sulla destra, potete isolare uno o più Paesi di interesse. Se passate il mouse sullo “spaghetto” potete visualizzare il giorno e le coordinate di quel punto: come detto, abbiamo:

  • X = casi totali positivi a quella data dall’inizio della pandemia
  • Y = casi totali positivi per la settimana precedente

Dopo lo “spaghetto” della Cina parte il Sud Corea con il primo caso identificato ufficialmente il 22 gennaio. La Corea del Sud mostra una prima flessione attorno al 7 marzo e un calo deciso nei primi giorni di aprile. Le misure di contenimento dell’epidemia che sono state attuate in Cina sono difficili da mettere in pratica nei paesi occidentali. Il Sud Corea invece ha messo in atto delle politiche di tracciamento dei casi con tecnologie digitali e “tamponamenti” massicci. La app Corona Science ticinese e quella Immuni italiana vanno in questa direzione, ma il loro utilizzo non sarà reso obbligatorio.

Oltre al grafico per il mondo abbiamo un grafico per la Svizzera, uno per l’Italia e uno per l’Europa.

Al 18 aprile emerge chiaramente per esempio che in America siamo ancora in una fase di crescita esponenziale: i punti, giorno dopo giorno, si trovano praticamente allineati lungo una retta. Mentre quasi tutti i cantoni e tutte le regioni italiane hanno iniziato la loro discesa verso il basso. Ci auguriamo succeda presto anche per i vari cantoni, per la Svizzera e per il mondo intero.

Aspettiamo che questo trend si consolidi e alimentiamolo con i nostri comportamenti virtuosi per ripartire con la serenità e la sicurezza che tutti aspettiamo.

In attesa di un vaccino contro il COVID-19, che ci permetterà di vivere senza ansia, sto preparando, insieme al filosofo ed epistemologo italiano Armando Massarenti un vaccino mentale, un libro dal titolo La pandemia da coronadati. Ecco il vaccino che ci spiegherà come sopravvivere al diluvio di informazioni spesso contrastanti e sempre angoscianti, nella speranza che una volta vaccinati, i lettori saranno in grado di vincere le altre sfide del digitale grazie agli anticorpi acquisiti durante la lettura.