| | News

Un doctorant bernois propose un outil open source pour suivre les chiffres du coronavirus en Suisse

Alors que la colère monte contre le manque de transparence des chiffres de l'épidémie de coronavirus en Suisse, un jeune chercheur a programmé un agrégateur en quelques heures. Tout est gratuit: des données au code en passant par cet article tant ces données sont importantes pour bien réagir face à l'épidémie et mieux la comprendre.

L’Office fédéral de la santé publique (OFSP) rencontre des difficultés à chiffrer avec précision la pandémie de coronavirus en Suisse. Neuf collaborateurs de l’OFSP assurent la collecte des données et sont submergés par la tâche à accomplir comme le soulignait Republik (en allemand), le 20 mars, et comme Heidi.news l’a déjà écrit également. Conscient de l’enjeu autour des données chiffrées, Daniel Probst, doctorant en chimie et sciences moléculaires à l’Université de Berne, a automatisé l’agrégation des données publiques fournies par les cantons et leur mise en forme, soit le graphe interactif ci-dessus (faites-le défiler de haut en bas) à consulter aussi sur: www.corona-data.ch

Pourquoi c’est généreux. Daniel Probst a passé une partie du week-end dernier (14-15 mars) a configurer la base de son agrégateur. Ses résultats et le code informatique qui les génère sont disponibles gratuitement pour aider la population à visualiser l’épidémie dans le pays. Une limite à ce travail: il ne donne à voir que les cas testés positivement dans le pays et les chiffres publiés par les cantons.

La méthodologie. Le jeune chercheur a utilisé un programme Python pour télécharger les données actualisées des 26 sites internet cantonaux. Son programme se connecte toutes les heures pour actualiser les données cantonales. Daniel Probst nous explique:

«J’ai fait la configuration de base le week-end dernier en deux ou trois heures. Depuis, j’investis environ 45 minutes par jour pour ajouter des fonctions supplémentaires. Et comme tous les sites cantonaux ne permettent pas l’actualisation automatique, je le fais manuellement, deux à trois fois par jour.»

Ce que montrent les graphes. Ils permettent de voir (et de calculer pour les spécialistes en biologie computationnelle) le nombre de cas et de décès confirmés par les cantons, ainsi que la prévalence pour 10’000 habitants (L’OFSP le fait pour 100’000 habitants).

Cinq graphiques supplémentaires permettent de voir l’évolution dans le temps en Suisse et aussi en comparaison internationale.

La fiabilité. Les données ainsi agrégées sont fiables puisqu’elles proviennent de sources officielles publiques. Leur limite est néanmoins la même que pour les données partielles fournies par l’OFSP: les dépistages menés en Suisse ne couvrent pas l’entier de la population et les données récoltées par les médecins de ville (secteur ambulatoire) sont transmises à l’OFSP de manière différente. Daniel Probst:

«Je ne dirais pas que mes données sont plus fiables que celles de l’OFSP, mais elles sont plus actuelles, car elles proviennent directement des cantons et sont mises à jour toutes les heures.

Je n'ai eu aucun contact avec l'OFSP, ils doivent avoir assez à faire en ce moment. Les représentants de l'OFSP ont l'air de plus en plus fatigués lors des conférences de presse. Je ne les envie pas. Je pense néanmoins qu'ils font du bon travail, sauf en ce qui concerne la transparence des chiffres.»

Ses motivations. Ce travail n’a rien à voir avec son doctorat. Daniel Probst:

«Je m'intéresse beaucoup aux données et aux chiffres, ainsi qu'à leur visualisation. Professionnellement, en tant que scientifique, et ici aussi, c'est la curiosité qui me pousse. C'est gratuit, parce que cela ne me coûte rien, sauf une à deux heures par jour et que je peux, à ma manière, contribuer aux efforts d'une grande partie de la population (dans le monde entier). Mais ma contribution est bien sûr faible comparée à celle du personnel infirmier, des médecins, des vendeurs dans les magasins d’alimentaire, des chauffeurs de camion et de bien d'autres qui font un excellent travail.»

Open source. Toutes les données, vérifiables puisqu’elles sont publiques, et son code sont accessibles sur Github en open source (gratuitement).

Bio express. Daniel Probst est doctorant à l'Université de Berne, avec le Professeur Jean-Louis Reymond. Après un apprentissage d’informaticien, il a fait une licence en informatique à la HES de Bienne, puis un master en bioinformatique et en biologie computationnelle à l'Université de Berne.

newsletter_point-du-jour

Recevez chaque matin un résumé de l'actualité envoyé d'une ville différente du monde.

Lire aussi