Dall·E, ChatGPT… S'adresser aux IA génératives sera-t-il bientôt un métier?
Et si l’art de bien parler à ces programmes qui inventent des textes et des images devenait une expertise à part entière? Et pour cause: c’est là que peut s’exprimer une forme nouvelle de créativité.
Cet article a été publié dans notre newsletter du soir, Le Point fort. N'hésitez pas à vous inscrire, c'est gratuit.
Savoir quoi murmurer à l’oreille des intelligences artificielles génératives – capables de générer du texte comme ChatGPT ou des images avec Dall·E, MidJourney, ou Stable Diffusion – sera-t-il bientôt une compétence distinctive sur un CV? La hype autour de ces modèles entraînés par deep learning ne se dément pas. Et déjà, émerge une forme d’économie parallèle: des passionnés échangent leurs meilleures «recettes» d’instructions écrites pour générer les images les plus étonnantes, alors que certains vont jusqu’à les monétiser sur des marketplaces dédiées.
Pourquoi ce n’est pas trivial. Quoi de plus intuitif que le langage humain pour communiquer avec ces programmes intelligents? Chacun a pu se prêter à l’exercice, sur Dall·E ou ChatGPT, au cours des dernières semaines. Mais il n’est pas toujours aisé d’obtenir des résultats tout à fait convaincants sans en passer par divers «trucs et astuces» dans la façon de s’adresser à la machine. Encore faut-il savoir les connaître et savoir les utiliser à bon escient…
Le «prompt engineering» – soit l’ingénierie des instructions demandées à ces IA – va-t-il devenir un vrai métier? La bonne nouvelle: il semblerait que la créativité humaine ait encore de beaux jours devant elle.
Lire aussi: «L'IA de ChatGPT est impressionnante, mais elle fait des erreurs grossières»
Allo, monsieur l’ordinateur. Louis Bouchard, doctorant en IA à Polytechnique Montréal, anime la chaîne YouTube What’s AI. Dans une vidéo récente, il revient sur le «prompting», cet art subtil consistant à «traduire» le langage humain en instructions compréhensibles par les modèles informatiques.
«Jusqu’à peu, ce domaine n’existait pas, c’était d’ailleurs un “meme” un peu ironique entre développeurs, explique-t-il à Heidi.news. Mais les choses ont changé avec les IA génératives.»
Avec d’autres passionnés, Louis Bouchard a mis en place le site pédagogique LearnPrompting.org, qui met à disposition un guide gratuit pour apprendre à bien parler aux IA génératives. «A terme, nous voulons avoir une page dédiée d’informations pour chaque modèle — ChatGPT, MidJourney… Nous avons déjà 34’000 personnes sur notre communauté Discord, dont des personnes d’OpenAI.»
Lire aussi: Ce qu'il faut savoir sur OpenAI, l'intrigante ONG devenue entreprise lucrative
ChatGPT, une ergonomie bluffante. Pour lui, c’est ChatGPT qui marque la percée la plus significative dans la simplicité du «prompting», pour une raison qui tient d’abord à la façon dont le modèle a été entraîné: «directement sur des textes écrits par l’humain, optimisé pour la conversation humaine, là où StableDiffusion ou DALL-E, ont été entraînés sur des images simplement étiquetées selon toutes sortes de mots-clés, pas toujours de façon très optimale.»
«Avant ChatGPT, toutes les IA génératives étaient un peu compliquées à utiliser. C’est un peu comme d’apprendre à ses parents à bien formuler ses requêtes Google, si on veut.»
A l’école des modèles
Pour illustrer ce que l’on entend par «entraînement» des modèles, il faut en revenir aux définitions. Par machine learning, on désigne des algorithmes auto-apprenants, qui «généralisent» les règles qu’ils doivent appliquer grâce à un grand nombre d’exemples. Par exemple, pour apprendre à reconnaître un chat sur une photo à partir de beaucoup de photographies étiquetées “chat” ou “pas un chat”. On parle de deep learning lorsque ces modèles se basent de surcroît sur des réseaux de neurones artificiels – ce qui est souvent le cas pour les modèles permettant le traitement du langage naturel ou la génération d’images.