Heidi Gender Tracker

Qu’est-ce que c'est?

Ce projet, développé avec l’aide de l’EPFL, utilise un algorithme d’intelligence artificielle basé sur le «deep learning» pour suivre la proportion d’hommes et de femmes cités dans nos articles. Il a bénéficié du soutien de la Google Digital News Initiative en 2019.

Pourquoi ce projet?

En 2015, la proportion de femmes citées dans les médias oscillait encore entre 20 et 30%, y compris en Suisse. La pandémie a eu des effets contrastés, augmentant la représentation des femmes citées à titre de témoins ou de porte-paroles, selon le projet mondial de suivi des médias (GMMP). La proportion d’expertes citées dans le cadre de Covid-19 n’était toutefois que de 21%. Or, pour prendre la mesure du problème et agir, encore faut-il disposer d’indicateurs chiffrés à l’échelle d’une rédaction.

Lire aussi: Heidi Gender Tracker: Pourquoi suivre la parité dans nos articles?

Nos résultats
intermédiaires

L’algorithme ne fournit pas encore des résultats fiables dans 100% des cas (son efficacité est évaluée à environ 90%), et nous continuons de l’améliorer au fil du temps.

Les deux premiers Flux historiques de Heidi.news, les Flux Sciences et Santé, ont respectivement cité, en moyenne, 26,6% (Santé) et 30% de femmes (Sciences) depuis janvier 2020.

Ces proportions sont plus élevées dans les Flux Culture et Education, qui ont cité en moyenne 40% (Culture) et 50% (Education) de femmes depuis septembre 2020. Les autres Flux seront intégrés ultérieurement à l’analyse.

Les étapes du calendrier

  • Printemps 2020 - phase participative.
    Nous avons demandé à nos lecteurs de nous aider à entraîner l’algorithme à se repérer dans la langue française, à travers une page dédiée où chacun pouvait aider l’IA à apprendre à identifier qui parle dans une phrase.
  • Automne 2020 - prototypage.
    Le laboratoire LSIR de l’EPFL a mis en ligne une première version expérimentale de l’API. Le code est open source, et accessible sur GitHub. Celle-ci évolue au fur et à mesure afin de minimiser le taux d’erreur.
  • Eté 2021 - diffusion.
    Nous préparons deux outils: tout d’abord, une page qui permettra d’analyser la parité dans n’importe quel article de presse, ainsi qu’un dashboard qui permettra de suivre en temps réel les chiffres de la rédaction, à l’interne et à l’externe. Développé en open source, il pourra être réutilisé par n’importe quel média francophone qui le souhaite.

Crédits

Développement algorithme: LSIR, EPFL
Coordination Heidi.news: Sarah Sermondadaz (depuis 2020), Jean Abbiateci (2019)
Développements complémentaires: Lukas Stöcklin

Nos partenaires