(foto: Getty Images)

241 sequenze del genoma di Sars-Cov-2 ricavate da pazienti cinesi durante le prime fasi della pandemia sono state cancellate dal database sul quale erano state registrate. A scoprirlo, e a recuperarne 13 dai backup di Google Cloud, è stato Jesse Bloom, che studia l’evoluzione dei virus al Fred Hutchinson Cancer Research Center di Seattle, che descrive la sua indagine in un articolo disponibile su bioRxiv, in attesa della revisione di altri scienziati. Quanto rivelato, comunque, non sembra supportare davvero nessuna ipotesi complottista, ma le sequenze ritrovate potrebbero essere d’aiuto nel ricostruire la storia del coronavirus.

L’indagine

A Bloom quello sconclusionato rapporto dell’Organizzazione della sanità (Oms) sulle origini del coronavirus proprio non bastava. Pertanto si è messo a ripercorrere i passi della commissione alla ricerca delle prime sequenze del genoma di Sars-Cov-2.

Si è così imbattuto in uno studio cinese che riportava mutazioni riscontrate in sequenze genomiche ricavate da campioni biologici prelevati da pazienti con Covid-19 in Cina all’inizio della pandemia. Le sequenze, non riportate integralmente nel lavoro, erano registrate sul database Sequence Read Archive (Sra), supervisionato da una divisione del National Institute of Health (Nih) statunitense.

Cercando di risalire alle sequenze complete direttamente dal database, però, Bloom si è accorto che non c’erano più: erano state eliminate. Grazie a ulteriori indagini, però, Bloom è riuscito a recuperarne 13, ancora conservate nel backup in cloud.

Il mistero delle sequenze eliminate

Perché quelle sequenze sono state rimosse dal database?
Contattati direttamente via e-mail, gli autori dello studio cinese non hanno ancora risposto, ma un portavoce dell’Nih ha riferito che l’eliminazione è stata richiesta dagli autori (che detengono la proprietà dei dati) perché le stesse sequenze erano in corso di aggiornamento e sarebbero poi state caricate su un altro database.

Bloom, però, riferisce di non essere ancora riuscito a trovarle altrove, e considera i fatti un po’ sospetti. Che sia stato un insabbiamento? Non tutti nella comunità scientifica sembrano propendere per quest’ipotesi: in fin dei conti, fa notare il virologo dell’università dello Utah Stephen Goldstein su Science Magazine, l’articolo cinese è ancora disponibile e lo è stato per un anno prima che arrivasse la richiesta di eliminazione delle sequenze dal database. Forse, poiché pubblicato su una rivista minore, è solo sfuggito ai radar degli scienziati.

Cosa ci dicono le sequenze ritrovate

La scoperta di Bloom non aggiunge molto a quello che già si sapeva, o si sospettava, sull’origine del coronavirus, e cioè che è molto probabile che Sars-Cov-2 (o un suo parente molto prossimo) stava già circolando in Cina prima di dicembre 2019 e che il wet market di Wuhan o non è stato il luogo dello spillover o non è stato l’unico (tant’è che alcuni dei primi casi di Covid-19 non avevano collegamenti). Le sequenze ritrovate da Bloom, infatti, non contengono tre mutazioni tipiche della versione di Sars-Cov-2 trovata nel wet market ma hanno somiglianze con il genoma del coronavirus di pipistrello individuato nel 2013. Forse, dunque, si tratta di sequenze appartenenti a un anello intermedio nell’evoluzione del coronavirus che potrebbero aiutare gli esperti a scoprire la sua vera storia.

Mettendo da parte l’ipotesi di insabbiamento, l’analisi di Bloom, per quanto debba ancora essere vagliata dagli altri esperti, sembra interessante dal punto di vista metodologico e indica una direzione da seguire. C’è da scandagliare l’Internet: che si apra la caccia alle sequenze perdute.

The post Il mistero delle sequenze del coronavirus cancellate dai database all’inizio della pandemia appeared first on Wired.



Leggi l’articolo su wired.it