Une étude de Stanford a-t-elle vraiment montré l'inefficacité du confinement?

Exceptionnellement, nous avons décidé de mettre cet article à disposition gratuitement de tous nos lecteurs, tant ces informations sont utiles pour comprendre l'épidémie en cours. L'information a néanmoins un coût, n'hésitez pas à nous soutenir en vous abonnant.

Des chaises stockées près d'un restaurant fermé, en Grèce | PETROS GIANNAKOURIS/AP/KEYSTONE

Votre question. Plusieurs lecteurs nous ont interpellés sur la publication, début janvier 2021, d’une étude épidémiologique dans la revue European Journal of Clinical Investigation, signée par plusieurs chercheurs de l’Université Stanford. Selon celle-ci, les interventions non-pharmaceutiques (INP), autrement dit les restrictions sociales mises en place pour faire face à l’épidémie, n’auraient eu que peu d’effet. Quel crédit peut-on lui accorder?

Mettre le suivi de l’actualité sur pause pour prendre le temps de répondre aux questions que nous posent nos lectrices et nos lecteurs: telle est notre ambition, cette semaine, sur Heidi.news. Mais toujours avec la même intention, celle d’aller au fond des choses, avec expertise et précision.

La réponse de Sarah Sermondadaz, journaliste sciences pour Heidi.news. Merci pour cette question, d’autant plus importante que cette publication est aujourd’hui brandie comme preuve de l’inefficacité du confinement par les personnes opposées aux restrictions sanitaires. Mais dans les faits, plusieurs points posent problème dans l’argumentaire scientifique de cette étude.

Ce que dit l’étude. Avant de développer ce qui prête le flanc à la critique, voici le raisonnement:

  • L’étude s’intéresse à l’augmentation du nombre de cas confirmés de Covid-19 pendant la première vague du printemps 2020 dans dix pays: le Royaume-Uni, France, Allemagne, Iran, Italie, Pays-Bas, Espagne, Corée du Sud, Suède, et enfin les Etats-Unis.

  • Les chiffres ont été évalués en fonction des INP — les fameuses mesures sanitaires — mises en place par les gouvernements.

  • Les auteurs ont divisé ces pays en deux groupes: huit pays aux mesures jugées particulièrement contraignantes, et enfin deux pays aux mesures jugées moins lourdes, qui font ici offfice de groupe contrôle. Il s’agit de la Suède et de la Corée du Sud, «deux pays qui n’ont pas rendu le confinement à domicile et la fermeture des commerces obligatoires», écrivent-ils. Comme on le verra plus loin, les choses sont en fait un peu plus complexes.

  • Les chercheurs ont ensuite utilisé un modèle statistique pour calculer l’efficacité des INP dans les différents pays pour réduire le nombre de nouveaux cas de Covid-19.

  • Ils reconnaissent d’abord que ces mesures ont permis de significativement réduire le nombre de nouveaux cas confirmés dans neuf pays sur dix.

  • Toutefois, ils entendent ensuite «soustraire» les effets observés dans les pays les moins restrictifs — Suède et Corée du Sud — des résultats dans les pays les plus restrictifs, afin d’isoler l’effet des seules mesures jugées les plus restrictives. De cette opération, ils concluent que les mesures plus restrictives n’ont pas été significativement plus efficaces que les mesures moins restrictives. Et c’est précisément ce point qui pose problème.

Ce que dit le reste de la littérature scientifique. Cette conclusion a de quoi surprendre, car elle est contredite par d’autres études épidémiologiques publiées ces derniers mois. On peut par exemple citer deux études de novembre, qui ont quantifié l’impact des mesures sanitaires sur le nombre de reproduction effectif (Re) au printemps 2020, un indicateur important pour suivre l’épidémie. Ce dernier peut être interprété comme le nombre moyen de personnes contaminées par chaque malade.

  • La première a été publiée dans Nature Human Behaviour Heidi.news y consacrait un article il y a quelques semaines. L’équipe concluait, à partir de quatre méthodes numériques différentes, que les mesures les plus efficaces étaient notamment l’annulation des petits rassemblements sociaux et la fermeture des établissements scolaires.

  • La seconde, publiée dans la revue Science, estimait que les mesures les plus efficaces sont l’interdiction des rassemblements, la fermeture des écoles et des universités, et la fermeture des commerces non-essentiels.

Ces deux études se basent sur un échantillon beaucoup plus étendu que celle de Stanford.

  • La première a passé au crible plus de 6000 mesures implémentées par 79 Etats ou régions, et a ensuite validé les résultats obtenus sur un jeu de données plus large, comportant plus de 42’000 mesures adoptées par 226 pays.

  • Le périmètre de la seconde a intégré 41 pays et 206 combinaisons de mesures.

Ces deux études rétrospectives, qui ont aussi porté sur la période du printemps 2020, n'ont par ailleurs pas été citées dans la nouvelle étude.

Les critiques de l’étude de Stanford. Sur le site PubPeer — qui permet aux scientifiques de commenter la littérature — les chercheurs Lonni Besançon de l’Université de Monash (Australie) et Gideon Meyerowitz-Katz, de l’Université de Wollongong (Australie également), ont publié un long commentaire critique. Voici leurs principaux arguments:

  • 1. La taille de l’échantillon. «Elle est de seulement dix pays, ce qui est faible comparé à d’autres études déjà publiées (…) Les auteurs devraient les prendre en considération, d’autant plus qu’ils aboutissent à des résultats contradictoires», écrivent-ils. Selon eux, il est surprenant que les auteurs n’aient pas inclus davantage de régions, étant donné que ces données sont souvent librement accessibles en ligne. D’autant que l’étude de Stanford survient près d’un an après les premières mesures.

  • 2. La composition du groupe contrôle. «La Suède et la Corée du Sud, même si elles n’ont pas institué de confinement obligatoire, ont malgré tout implémenté des mesures strictes». Parmi celles-ci: une interdiction des rassemblements publics en Suède, réévaluée à plusieurs reprises, la recommandation du télétravail dès mars, ou encore la fermeture des lycées et des universités. La référence à la Corée du Sud, poursuivent-ils, est encore plus déroutante. En effet, même sans confinement, il s’agit d’un des pays où l’enseignement à distance dans les écoles a été instauré le plus longtemps, de mars à fin septembre. Ils rappellent aussi que la Corée du Sud a mis en place l’un des suivis numériques des quarantaines les plus stricts au monde.

  • 3. Corrélations, causes et conséquences. Enfin, le problème est aussi de savoir si la baisse ou l’augmentation du nombre de cas confirmés est bien la conséquence de la mise en place des mesures sanitaires… ou si au contraire, c’est à cause de cette augmentation que les mesures plus restrictives ont été implémentées. «Il y a un problème de langage quand les auteurs parlent d’”effets” des mesures sanitaires», estime Gideon Meyerowitz-Katz. «On ne peut pas forcément dire qu’il y a un lien causal.» Dans les colonnes de Libération, le doctorant en épidémiologie ajoutait: «les auteurs ne prennent pas en compte un délai de latence pour mesurer l'effet des interventions, par exemple, en regardant une, deux ou trois semaines après leur instauration.»

L’avis d’un épidémiologiste de la task force scientifique. Lonni Besançon et Gideon Meyerowitz-Katz ne sont pas les seuls à questionner la méthodologie de ces travaux. Lonni Besançon prépare d’ailleurs une réponse à l’éditeur aux côtés de l’épidémiologiste Antoine Flahault, directeur de l'institut de santé globale de l'Université de Genève et membre de la task-force suisse Covid-19. Contacté par Heidi.news, Antoine Flahault s’explique:

«L’article de Stanford ne permet pas du tout de répondre à la question de savoir si les confinements sont efficaces, mais voudrait répondre à la question de savoir si le caractère strict est associé à une plus grande efficacité. Par ailleurs, l’article ne retient dans la catégorie des moins stricts que la Corée du Sud et la Suède et pas les pays comme la Suisse, l’Allemagne ou les autres pays nordiques qui ont mis en œuvre des semi-confinements. Enfin, il y a un contexte culturel très fort dans le caractère souple ou strict de la mise en œuvre des mesures sanitaires que les auteurs n’ont pas pris en compte.»

L’épidémiologiste rappelle qu’il existe au moins trois modalités de confinements, et non pas seulement deux comme l’envisagent les auteurs. Elles dépendent aussi des mentalités de chaque pays, très différentes même au sein de l’Europe:

  • le confinement strict, comme en France, en Nouvelle-Zélande ou en Espagne,

  • le semi-confinement, comme en Suisse ou en Allemagne,

  • mais aussi l’auto-confinement, pratiqué en Suède, au Japon, ou à un certain degré en Corée du Sud. Il ajoute:

«Les données de mobilité de la population, les informations sur l’affluence dans les commerces, bars et restaurants, ou sur l’utilisation des transports publics montrent qu’en Suède ou en Corée du Sud, les gens ont quasiment autant respecté les recommandations que dans les pays à confinements plus stricts. Cela a été fait soit de façon participative, soit parce qu’ils y ont été contraints par des applications de surveillance, comme en Corée.»

Il complète:

«Une comparaison manichéenne entre pays qui seraient classés très ou peu restrictifs est donc peu pertinente. Cette question mise à part, cette étude reste bancale (huit pays très restrictifs contre deux moins restrictifs), et la taille de l’échantillon pose question. Dix cas ne suffiraient pas pour publier une étude clinique portant sur l’efficacité d’un médicament ou d’un vaccin, alors pourquoi cela suffirait-il pour évaluer l’efficacité du confinement?»

La défense des auteurs. Contactés par Libération, les auteurs de Stanford ont répondu par la voix du premier auteur, Eran Bendavid. Celui-ci explique qu’il faut considérer cette publication comme un «élément supplémentaire apporté à la conversation scientifique». Il explique avoir voulu prolonger la méthodologie développée par l’équipe de Solomon Hsiang, à l’origine d’une étude publiée en juin 2020 dans Nature.

Solomon Hsiang et des membres de son équipe, également contactés et cités par Libération, estiment pour leur part que l’analyse de l’équipe de Stanford ne reflète pas les hypothèses de leur publication initiale. La métaphore du chercheur est éloquente:

«C'est un peu comme si l'on regardait deux enfants, dont l'un est autorisé à manger une barre de chocolat alors que l'autre ne l'est pas, puis qu'on comparait leurs résultats à un test de maths deux mois plus tard. Il en va de même pour la Corée du Sud et l’Espagne.»

La controverse. Savoir qui signe un article scientifique est important. Et c’est ici que les choses se compliquent, car plusieurs des co-auteurs de Stanford sont connus pour avoir contesté très tôt l’intérêt du confinement.

  • Jay Bhattacharya, professeur de médecine à l’Université de Stanford, est aussi cosignataire de la déclaration de Great Barrington, texte rédigé par le think tank libertarien American Institute for Economic Research. Ce texte controversé remettait au goût du jour la stratégie du laisser-circuler le virus et ne protéger que les personnes vulnérables afin de construire naturellement une immunité de groupe suffisante. Une stratégie qui a pu avoir les faveurs des politiques — on pense à Boris Johnson en février 2020— avant les premiers confinements, mais qui semble aujourd’hui de plus en plus difficile à défendre au vu de son coût humain et de l’émergence de variants qui risquent d’échapper au vaccin. En octobre 2020, quatorze organismes de santé publique nord-américains avaient alerté sur ce texte, arguant qu’il s’agit d’une déclaration politique qui ne tient pas compte des connaissances actuelles.

  • John Ioannidis, chercheur de Stanford à la solide réputation avant la pandémie, s’est lui aussi trouvé au centre de la polémique en 2020. En mars, celui-ci estimait que la pandémie ne ferait que 10’000 morts aux Etats-Unis. Au 1er février 2021, le bilan du pays s’élève à 441’000 décès. Il a été critiqué par plusieurs de ses pairs, comme l’expliquait Heidi.news. Certains de ses travaux scientifiques, comme cette méta-analyse sur le taux de mortalité de Covid-19, ont également été questionnés . La façon dont ont été recrutés les participants d’une précédente étude signée par Jay Bhattacharya et John Ioannidis a aussi interpellé jusqu’à Buzzfeed. Le même Buzzfeed, en mai 2020, évoquait un «conflit d’intérêts» préoccupant sur l’une de ses études, qui aurait été en partie financée par le fondateur d’une compagnie aérienne, notoirement opposé aux restrictions sanitaires, sans que cela soit explicitement précisé. A posteriori, les administrateurs de l’école de médecine de Stanford rapportaient en décembre 2020 au Washington Post ne pas avoir mis au jour de preuve concrète que le financeur ait pu influencer le design de l’étude, admettant que cela était de nature à suggérer un conflit d’intérêt aux yeux du public. Ils ont malgré tout critiqué les auteurs pour avoir utilisé une publicité Facebook pour recruter les volontaires de leur étude.

  • Par ailleurs, jusqu’en 2020, John Ioannidis était également rédacteur en chef de l'European Journal of Clinical Investigation, où ont été publiés ces travaux.

Se pose ainsi la question de savoir si ces chercheurs n’ont pas été aveuglés par certains présupposés d’ordre idéologique.