Vous voulez contribuer au projet Heidi Gender Tracker? Mode d'emploi

Le 14 juin 2020, Heidi.news a dévoilé la première phase de son projet GenderTracker, accessible en un clic. L’enjeu: développer un algorithme qui permettra, à terme, de compter, dans chaque article, ou dans chaque rubrique, combien d'hommes et combien de femmes sont cité(e)s. Mais avant d’en arriver là (si tout se passe bien, cet automne), nous avons besoin de vous! Explications.

Notre outil GenderTracker, développé par l’EPFL, se base sur ce qu’on appelle le machine learning. Autrement dit, il a besoin de finir d’apprendre par l’exemple ce qu’est une citation, pour certains textes présentant des ambiguïtés. Cette étape d’entraînement est réalisée à partir d’extraits provenant de Heidi.news et d’autres médias francophones ayant accepté de nous aider: le Parisien, Nice Matin, Rue89Strabourg, et enfin La Nouvelle République. Cette première phase publique du projet va durer le temps que l’algorithme soit suffisamment bien entraîné pour analyser seul les textes produits par la rédaction.

Le mode d’emploi. Il s’agit à ce stade d’un prototype, dont l’ergonomie, certes perfectible, sera améliorée au cours des prochaines semaines. Dans l’intervalle, pour faciliter la navigation, vous pouvez suivre le tutoriel ci-dessous. Tout au long de l’expérience, vous pouvez changer de citation à l’aide du bouton “passer”, affiché en bas après l’extrait. Et si vous vous êtes trompés en sélectionnant les mots du texte, pas de panique! Il suffit de cliquer à nouveau pour les désélectionner.

  • Connectez-vous, sur ordinateur, tablette ou mobile, à l’adresse https://gendertracker.heidi.news/

  • La page vous présente l’étape 1 sur 4, et vous demande de cliquer sur le premier mot de la citation, directement dans le texte présenté. S’il n’y a aucune dans l’extrait, il convient de cliquer sur le bouton “Aucune citation”, en bas après le texte, afin d’obtenir un autre échantillon de texte à analyser. Vous répétez ainsi l’étape 1 jusqu’à ce que le logiciel vous présente un texte contenant une citation. Si le début ou la fin de la citation n’apparaissent pas clairement, cliquez sur les boutons “haut” ou “bas”.

etape1_nocitation2.jpg
Etape 1 sur 4, lorsque le texte ne contient aucune citation

  • La page vous présente l’étape 2 sur 4 dès que vous avez cliqué sur le premier mot d’une citation, et vous demande de cliquer sur le dernier mot de la citation. Selon l’extrait, il est possible que vous deviez cliquer sur la flèche “bas” pour afficher la fin de la citation.

etape2_noauthor.jpg
Etape 2 sur 4, sur un texte qui ne contient pas d'auteur explicite

  • La page vous présente l’étape 3 sur 4, et vous demande de cliquer sur les prénom et nom de l’auteur de la citation. S’ils ne sont pas visibles sur l’extrait, il faudra cliquer sur les boutons “haut” ou “bas” pour les retrouver. Lorsque vous le voyez à l’écran, cliquez sur le bouton “Auteur”.

etape3_noauthor.jpg
Etape 3 sur 4, sur un texte qui ne contient pas d'auteur explicite

  • La page vous présente l’étape 4 sur 4. Ici, après avoir cliqué sur le bouton “haut”, on voit apparaître le nom de l’auteur de la citation. Après avoir cliqué sur le bouton “Auteur”, il convient de sélectionner dans le texte le prénom et le nom de l’auteur. Puis finalement, de cliquer sur le bouton “Soumettre” tout en bas de l’extrait.

etape4_author.jpg

  • Voilà, c’est terminé! Vous êtes de retour à l’étape 1, avec un nouvel extrait, vous pouvez répéter le processus autant de fois que vous le souhaitez, ou fermer la page à la fin de l’étape 4 si vous ne voulez pas continuer.

Le contexte. Soutenu par le Google Digital News Innovation Fund, ce projet œuvrera pour une plus grande égalité de la représentativité dans les médias. Le code source ainsi que le modèle obtenu seront disponibles en open source pour d’autres médias ou institutions souhaitant passer leurs textes à la moulinette! Pour plus d’informations, vous pouvez cliquer, sur la page du GenderTracker, sur la mention FAQ sur le bandeau en haut à droite de l’outil.