Covid-19 : en France, le grand gâchis des données issues du séquençage – Le Monde

Un laborantin travaille au séquençage du génome du virus SARS-CoV-2, à l’Institut Pasteur, à Paris, le 21 janvier 2021.

Le 11 janvier, la ministre de l’enseignement supérieur, de la recherche et de l’innovation, Frédérique Vidal, pavoise sur Twitter : « Depuis un an, l’activité [de séquençage française] bat des records, avec 317 521 séquences produites au total » Notre pays, parti en retard dans cette technique permettant de lire une à une les « lettres » des génomes et seule capable d’identifier les variants, s’est rattrapé depuis la fin 2020, devenant le quatrième « séquenceur » en Europe, derrière le Royaume-Uni, l’Allemagne et le Danemark.

Mais la seconde partie du tweet de la ministre s’avère trompeuse et escamote des ratés du dispositif français : «  et versées dans les banques de données ouvertes aux scientifiques ». La réalité est, en effet, moins glorieuse. Le 19 janvier, l’une des bases de données ENA (European Nucleotide Archive) recensait… 1 681 séquences du SARS-CoV-2 d’origine française. L’autre base, EpiCov, hébergée par l’organisation Gisaid, plus de deux fois plus fournie, avec plus de 7,2 millions de séquences du monde entier, en avait 187 000 venant de France.

Où sont donc passées plus de 40 % des séquences françaises, non « versées » dans les banques de données ? Les réponses sont un mélange de soucis techniques, de désorganisation et de batailles entre bases de données. Elles révèlent aussi une faible motivation à utiliser ces connaissances.

Lire aussi Covid-19 : pourquoi on est dans le flou pour mesurer la progression d’Omicron

« On est à la limite d’un scandale sanitaire ! Ces données ne sont pas accessibles. Or plus les gens pourront y avoir accès, plus nous pourrons produire des résultats », déclare, agacé, un spécialiste, qui tient à rester anonyme pour préserver ses chances d’accéder à cette ressource. Parmi ces « résultats », il pourrait y avoir l’identification de nouveaux variants, l’anticipation de leur évolution par la mesure des fréquences des mutations, mais aussi la mesure des taux de reproduction (à partir des séquences et non des données épidémiologiques), la datation de l’entrée des variants, l’effet des combinaisons de mutations, la reconstruction de chaînes de contamination…

Qualité variable et désorganisation

Pour comprendre le problème, replantons le décor. En France, le séquençage est réalisé par plusieurs acteurs. Quatre centres font le gros du travail, deux centres nationaux de référence (ou CNR, Pasteur à Paris et les Hospices civils de Lyon), l’AP-HP-Henri-Mondor et l’IHU Méditerranée infection. En janvier 2021, un consortium est constitué, Emergen, sous la houlette de Santé publique France (SPF) et de l’ANRS-maladies infectieuses émergentes, notamment pour constituer une base de données nationale de séquences, Emergen-DB, dans laquelle SPF puise pour publier chaque semaine des bilans. Le consortium a aussi autorisé des CHU à séquencer, puis, en juin 2021, des laboratoires d’analyses privés (soit une bonne cinquantaine de « sources » de séquençage supplémentaires).

Il vous reste 62.71% de cet article à lire. La suite est réservée aux abonnés.

Source

Share your thoughts