Le génome humain séquencé en entier – ah bon, ce n’était pas déjà le cas?
Pour la première fois, le génome humain a été séquencé dans son ensemble, dans le cadre du Human Genome Project. Ces résultats ont été publiés dans la revue Science le 31 mars 2022. Mais que restait-il à trouver dans ce génome que l’on nous annonçait séquencé dès les années 2000, avec fanfares et trompettes?
Des terres étranges et méconnues, à base de bras courts et de séquences répétées. Nous en avons discuté avec Stylianos Antonarakis, professeur en médecine génétique et directeur de l'Institut de génétique et génomique (iGE3) de l’Université de Genève, qui a participé à ces travaux.
Heidi.news – Je suis peut-être naïf, mais croyais qu’on avait déjà séquencé le génome humain…
Stylianos Antonarakis – Oui, il y a eu une grande fête à la Maison Blanche il y a une vingtaine d’années, avec Bill Clinton et Tony Blair, pour célébrer le séquençage complet du génome humain. (Rires.) Mais tous les généticiens savent qu’il restait des zones d’ombre, dans plusieurs chromosomes (1, 9, 16, Y) et surtout dans les bras courts des cinq chromosomes dits «acrocentriques» (voir ci-dessous). Ces bras courts sont restés une terre inconnue parce qu’il y a beaucoup de séquences d’ADN répétitives, très difficiles à séquencer. Cela nous a pris vingt ans pour trouver le moyen de décoder cette partie atypique du génome.
Pourquoi ces portions répétitives du génome sont-elles si difficiles à séquencer?
Il y a vingt ans, la technologie de séquençage ne permettrait pas d’avoir de longues séquences: on arrivait à faire de courtes lectures («shorts reads») d’environ 150 nucléotides. Pour reconstituer la séquence totale, il faut trouver les chevauchements de tous ces fragments les uns après les autres. Mais s’il y a des portions du génome répétées plus longues que cela, on n’arrive pas à savoir d’où viennent les fragments.
Avec une technologie qui permet des lectures longues («long reads»), de 30'000 ou 100'000 nucléotides, on y arrive. C’est très difficile à faire, seules deux sociétés y sont parvenues: Oxford Nanopore, au Royaume-Uni, et Pacific Biosciences, aux Etats-Unis. Chacune a son avantage: PacBio permet de lire 20'000 nucléotides avec très peu d’erreurs, tandis qu’Oxford permet de lire jusqu’à 1 million de nucléotides, mais avec beaucoup d’erreurs. Donc on a combiné les deux.
Ce projet s’est fait sous l’égide du consortium Telomere-to-Telomere – le télomère étant l’extrémité d’un chromosome. Qui est à la manœuvre?
Ce sont les NIH américains, plus précisément le Human Genome Research, qui sont moteurs, avec l’Université de Santa Cruz et celle de Washington à Seattle. C’est un projet à 40 millions de dollars et qui a pris quatre ans, qui s’est terminé il y a un an – et il a fallu un an pour obtenir la publication dans Science.
Moi, je travaille sur le chromosome 21, qui est un des chromosomes acrocentriques, et à l’origine du syndrome de Down (ou trisomie 21). Il y a dix ans, j’ai réussi à séquencer un petit bout du bras court du chromosome 21 et je suis devenu expert des chromosomes acrocentriques, donc le NIH m’a demandé de faire partie du projet, ce qui était une grande joie. J’ai fait ça à distance pendant le Covid, par téléphone…
A quoi servent ces chromosomes «acrocentriques» avec des bras courts?
C’est un pur hasard de l’évolution! Chez la souris, tous les chromosomes sont acrocentriques, chez nous les humains, il n’y en a que cinq. Là où ça devient intéressant, c’est que ces régions contiennent des gènes d’ARN non-codant, notamment ceux qui composent le ribosome, l’usine de fabrication des protéines. On pense qu’ils jouent un rôle important dans l’expression des gènes et le vieillissement. On y trouve aussi de l’ADN satellite, constitué de répétitions de courtes séquences, dont on ne connaît pas le rôle: peut-être que ce sont des fossiles de l’évolution, peut- être qu’ils sont utiles, on ne sait pas trop.
Que représente la terra incognita que vos collègues et vous avez défrichée, sur l’ensemble du génome humain?
On ne connaissait pas la taille exacte de ce continent inconnu avant cela, mais les estimations donnaient entre 5 et 15%. Nous avons établi que cela représentait 8% du génome humain, lequel est constitué de 3,1 milliards de nucléotides. Et on sait maintenant que la longueur du génome est un peu différente entre les humains: chez certains il est un peu plus long, et chez d’autres un peu plus court. Il y a une variabilité selon les individus.
C’est-à-dire que vous et moi n’avons pas le même nombre de gènes?
La différence n’est pas en nombre de gènes, mais en nombre de copies du même gène, répétées sur les bras courts des chromosomes. La taille du bras court de mon chromosome 13 est différent du vôtre. Par exemple je peux avoir 400 copies répétées d’un gène de ribosome, vous 350 et une autre personne, 500. On ne sait pas si ça a une importance biologique, on ne connaît pas la taille «normale». Et c’est une question importante pour les généticiens, car on soupçonne que cela joue un rôle dans certaines maladies, notamment neurodégénératives. Maintenant, on a une séquence de référence pour étudier cela.
Vous avez séquencé l’intégralité du génome humain… à l’exception du chromosome «masculin» Y. Pour quelle raison?
On pourrait penser que c’est parce qu’on a séquencé le génome d’une femme, mais non! L’échantillon qu’on a séquencé provient d’une grossesse môlaire, qui ne produit pas d’embryon mais un tissu chaotique, récupéré après une fausse-couche précoce. Ce qui se passe, c’est qu’un ovule sans noyau est fécondé par un spermatozoïde et seul le génome du père est présent. C’est très anormal, bien sûr.
Mais cela facilite la lecture du génome, puisque chaque chromosome n’est présent qu’en un seul exemplaire, au lieu d’un par parent. En l’occurrence, notre échantillon représente l’apport du génome paternel, avec juste son chromosome X. A vrai dire, on a séquencé un chromosome Y il y a six mois, mais ce n’est pas encore publié.
Ce nouveau génome «super-complet», baptisé T2T-CHM13, est-il représentatif de l’ensemble des génomes humains?
Disons qu’il est représentatif du génome d’un individu européen. Mais la variabilité est un sujet important. On a le projet de séquencer environ 30 génomes supplémentaires, des grandes bio-ethnies de la terre, pour avoir tous les grands groupes de population. Cela se fera sous l’égide du Human Genome Diversity Project, piloté aux Etats-Unis.
Est-ce que d’ici quelques années, on va apprendre qu’il restait encore une partie du génome non séquencée?
L’annonce d’il y a vingt ans était un peu de la publicité politique et scientifique, mais pour le futur, on ne sait pas. La partie de l’humanité la plus ancienne, c’est le berceau africain, et il est possible qu’on découvre une portion de génome qui a ensuite disparu au cours de l’évolution. Ce serait sans doute moins intéressant dans une perspective médicale, mais ça le serait à coup sûr pour les sciences de l’évolution.
Cet article est réservé aux abonnés.
Déjà abonné(e) ? Se connecter