Figure 4 : Le génome d’A. carolinensis contient un chromosome X nouvellement découvert.
a, b, Le chromosome X, un microchromosome, est présent en une copie chez les mâles d’A. carolinensis (a) et en deux copies chez les femelles (b). Le BAC 206M13 (bibliothèque BAC CHORI-318) est hybridé au bras p du chromosome X par FISH dans les étalements en métaphase des mâles et des femelles. Le BAC 206M13 et dix autres BAC ont montré ce schéma spécifique au sexe dans des cellules provenant de cinq individus mâles et de cinq individus femelles. Grossissement original, ×1 000.
Diapositive PowerPoint
Les 5,1 Mb de séquence attribués au chromosome X contiennent 62 gènes codant pour des protéines (tableau supplémentaire 10) ; les termes de l’ontologie génétique (GO) associés à ces gènes ne montrent aucun enrichissement significatif. Il est très probable qu’il existe davantage de séquences du chromosome X qui sont actuellement étiquetées comme des échafaudages non ancrés dans l’assemblage AnoCar 2.0. L’identification du gène de détermination du sexe d’A. carolinensis nécessitera une biologie fonctionnelle considérable, mais nous notons que le gène de détermination du sexe du poulet DMRT1 est situé sur le chromosome 2 d’A. carolinensis et que SOX3 (le paralogue du chromosome X du gène de détermination du sexe des mammifères thériens SRY) est situé sur un échafaudage non ancré d’A. carolinensis ; ces gènes sont donc peu susceptibles d’être le gène de détermination du sexe d’A. carolinensis.
Les dix individus d’A. carolinensis (originaires de Caroline du Sud et du Tennessee) utilisés pour la cartographie par FISH présentaient de grandes inversions péricentromériques dans un ou plusieurs des chromosomes 1-4, sans corrélation entre les différentes inversions chromosomiques ou avec le sexe du lézard (voir la note supplémentaire, le tableau supplémentaire 11 et la figure supplémentaire. 6).
Un total de 17 472 gènes codant pour des protéines et 2 924 gènes ARN ont été prédits à partir de l’assemblage du génome d’A. carolinensis (Ensembl release 56, septembre 2009). Nous avons construit une phylogénie pour tous les A. carolinensis et leurs homologues chez huit autres espèces de vertébrés (homme, souris, chien, opossum, ornithorynque, poulet, diamant mandarin et poisson-globe), ce qui nous a permis d’identifier un ensemble conservateur de 3 994 orthologues univoques, c’est-à-dire des gènes qui n’ont été dupliqués ou supprimés chez aucun de ces vertébrés depuis leur dernier ancêtre commun. Ces phylogénies génétiques ont également été utilisées pour identifier les gènes qui sont apparus par duplication dans la lignée des lézards après la scission avec la lignée aviaire et, séparément, ceux qui ont été perdus dans la lignée des mammifères après la scission mammifères-reptiles (Fig. 1, Note supplémentaire, Fig. supplémentaire 7 et Tableau supplémentaire 12). 7 et tableau supplémentaire 12).
Nous avons trouvé 11 gènes d’opsine d’A. carolinensis qui n’ont pas d’orthologues chez les mammifères (mais ont des orthologues chez les invertébrés, les poissons et les grenouilles), et semblent donc avoir été perdus au cours de l’évolution des mammifères (tableau supplémentaire 13). Le vaste répertoire d’opsines peut contribuer à l’excellente vision des couleurs des anoles – y compris la capacité de voir dans la gamme ultraviolette – et peut également contribuer à leur hyperdiversité en permettant l’évolution d’une coloration diverse et spécifique à l’espèce du fanon, qui joue un rôle important dans la sélection sexuelle et la reconnaissance des espèces11. De même, les gènes du récepteur olfactif et de la β-kératine sont fortement dupliqués chez A. carolinensis (note supplémentaire et figure supplémentaire 9).
De nombreux reptiles, dont les anoles vertes, diffèrent des mammifères placentaires en étant ovipares (en pondant des œufs). La viviparité chez les mammifères placentaires est un état dérivé, reflété par leur perte de certains gènes liés aux œufs. Nous avons utilisé la spectrométrie de masse pour identifier les protéines présentes dans l’œuf immature d’A. carolinensis, car la plupart des protéines de l’œuf sont produites dans le corps de la mère et ensuite transportées dans l’œuf immature. Nous avons constaté que, contrairement aux mammifères, les reptiles présentent des duplications génétiques spécifiques à chaque lignée, notamment dans les vitellogénines (VTG), l’apovitellénine-1, l’ovomucine-α et trois homologues de l’ovocalyxine-36, une protéine matricielle de la coquille d’œuf de poulet.
Nos résultats montrent une évolution rapide des gènes des protéines de l’œuf chez les amniotes. Plus précisément, nous avons trouvé des protéines de 276 gènes d’A. carolinensis dans les œufs immatures d’A. carolinensis (tableaux supplémentaires 14 et 15), dont seulement 50 ont été confirmés comme étant présents dans les œufs de poulet par spectrométrie de masse22,23. Ces gènes comprennent les VTG, un lysozyme, des paralogues de la protéine 1 de la couche externe de la membrane vitelline (VMO1), des inhibiteurs de protéase, la natterine et la nothepsine. En alignant les gènes qui sont des orthologues un à un chez A. carolinensis et le poulet, nous avons constaté que les protéines de l’œuf évoluent significativement plus rapidement que les protéines non-œuf (valeurs moyennes dN/dS (rapport du taux de substitutions non-synonymes sur le taux de substitutions synonymes) de 0,186 et 0,135, respectivement ; P = 1.2 × 10-5), ce qui reflète une sélection purificatrice réduite et/ou des épisodes plus fréquents d’évolution adaptative.
En utilisant de multiples séquences génomiques de vertébrés, nous avons identifié trois paralogues de VMO1 (que nous nommons α, β et γ) que nous déduisons avoir été présents dans le dernier ancêtre commun de tous les reptiles et mammifères. Alors qu’au moins un des VMO1-α, VMO1-β et VMO1-γ a été perdu dans tous les autres génomes d’amniotes, le génome d’A. carolinensis contient des représentants de ces trois paralogues. De plus, la famille VMO1-α spécifique à A. carolinensis s’est développée pour atteindre 13 membres et a connu une sélection positive de substitutions d’acides aminés au sein d’une cavité chargée négativement, se liant probablement au substrat ; des changements qui, vraisemblablement, modifient son activité transférase de type lysozyme (note supplémentaire, figure supplémentaire 8 et tableaux supplémentaires 16 et 17).
Le répertoire de répétitions étendu et actif d’A. carolinensis nous a permis de découvrir l’origine de plusieurs éléments conservés de mammifères. Grâce au processus d’exaptation (un changement majeur de la fonction d’une séquence au cours de l’évolution), certains éléments mobiles qui étaient actifs chez l’ancêtre amniote sont devenus conservés, et vraisemblablement fonctionnels, chez les mammifères, tout en restant des éléments mobiles actifs chez A. carolinensis. L’origine de ces séquences conservées chez les mammifères dans les éléments mobiles n’était pas reconnaissable sans comparaison avec une séquence génomique distante et riche en répétitions24. Nous avons identifié 96 éléments exaptés de ce type (voir le tableau supplémentaire 18) dans le génome humain remontant à des éléments mobiles présents chez l’ancêtre amniote qui sont encore présents chez A. carolinensis, en particulier les familles CR1, L2 et gitane.
Bien que la plupart des éléments exaptés soient non codants et remplissent probablement une fonction de régulation, nous avons également identifié un exon codant une protéine qui a été exapté d’une LIGNE de type L2, constituant maintenant l’exon 2 dans une région N-terminale spécifique aux mammifères de la protéine MIER1 (mesoderm induction early response 1). Cet exon est hautement conservé chez 29 mammifères et représente donc probablement une innovation mammalienne depuis l’ancêtre des amniotes.
Les termes OG associés au site de début de transcription le plus proche de chaque élément exapté dans le génome humain montrent un enrichissement pour les gènes du neurodéveloppement (voir Méthodes), avec « liaison des récepteurs de l’éphrine », « développement du système nerveux » et « transmission synaptique » fortement enrichis (toutes les valeurs P < 5 × 10-3). Ces enrichissements sont cohérents avec les changements adaptatifs dans le développement neurologique survenus lors de l’émergence des mammifères.
Les lézards anolis sont un cas d’école de radiation adaptative, s’étant diversifiés indépendamment sur chaque île des Grandes Antilles et dans l’ensemble des Néotropiques, produisant une grande variété d’espèces écologiquement et morphologiquement différenciées, avec jusqu’à 15 trouvées dans une seule localité11. Bien que les anoles soient largement utilisées comme système modèle pour les études phylogénétiques comparatives, il a été difficile de déterminer les relations évolutives entre les principaux clades d’anoles en raison des radiations évolutives rapides associées à l’accès à de nouvelles dimensions d’opportunité écologique. Résoudre avec succès les événements de branchement relativement courts associés à une telle radiation nécessite une richesse de données provenant de loci évoluant à un rythme approprié.
Nous avons utilisé la séquence du génome d’A. carolinensis pour développer un nouvel ensemble de données phylogénomiques composé de 20 kb de données de séquence échantillonnées à travers les génomes de 93 espèces d’anoles (tableaux supplémentaires 19 et 20). Les analyses de cet ensemble de données permettent de déduire une phylogénie bien étayée qui renforce et clarifie l’histoire adaptative et biogéographique des anoles (Fig. 5, détails dans la Fig. 10 supplémentaire). Premièrement, notre analyse phylogénomique réaffirme les études moléculaires et morphologiques antérieures indiquant que des spécialistes de l’habitat des anoles similaires ont évolué indépendamment sur chacune des quatre grandes îles des Grandes Antilles. Deuxièmement, nos analyses suggèrent un scénario biogéographique complexe impliquant un nombre limité d’événements de dispersion entre les îles et une diversification in situ importante au sein des îles. Les plus proches parents d’Anolis se trouvent sur le continent et la phylogénie confirme l’existence de deux colonisations, l’une dans le sud des Petites Antilles et la seconde produisant les diverses radiations adaptatives dans le reste des Caraïbes. Au sein de ce dernier clade, les anoles se sont initialement diversifiées principalement sur les deux plus grandes îles des Grandes Antilles (bien que Porto Rico semble également avoir été impliqué) avant de subir ensuite des radiations secondaires sur toutes les îles et de revenir finalement sur le continent, où cette rétro-colonisation a produit une radiation évolutive étendue. La phylogénie indique également que très peu d’événements de dispersion inter-îles ont eu lieu au cours de l’évolution des Grandes Antilles. Au contraire, les faunes des Grandes Antilles, réputées pour la mesure dans laquelle les mêmes écomorphes se retrouvent sur chaque île, sont principalement le résultat d’une évolution convergente25.
Figure 5 : Une phylogénie de 93 espèces d’Anolis clarifie l’histoire biogéographique des anoles.
Les écomorphes d’Anolis dérivent d’une évolution convergente et non d’une migration inter-îles fréquente. En utilisant des paires d’amorces conservées distribuées à travers le génome d’A. carolinensis, nous obtenons des séquences de 46 loci génomiquement diversifiés évoluant à une gamme de taux d’évolution et représentant à la fois des régions codant pour les protéines et des régions non codantes. Les analyses de maximum de vraisemblance de ce nouvel ensemble de données de 20 kb de nucléotides alignés infèrent presque toutes les relations précédemment établies entre les anoles, tout en résolvant partiellement les relations basales qui ont gêné les études précédentes. Les cercles ouverts indiquent des valeurs bootstrap (bs) <70 ; cercles grisés, 70< bs <95 ; cercles remplis, bs >95.
Diapositive PowerPoint
La séquence du génome d’A. carolinensis permet de mieux comprendre l’évolution des amniotes. Remplir cet important nœud reptilien avec un génome séquencé a révélé des états dérivés dans chaque branche amniote majeure et a permis d’éclairer l’ancêtre amniote. Cependant, l’arbre des génomes reptiliens séquencés est encore extrêmement clairsemé, et le séquençage d’autres reptiles non-aviens serait nécessaire pour comprendre pleinement à quel point A. carolinensis et les génomes d’oiseaux séquencés sont typiques de l’ensemble du clade reptilien.
En plus de l’utilité de la séquence du génome d’A. carolinensis en tant que représentant des reptiles non-aviens, les espèces d’Anolis constituent une ressource unique pour l’étude de la radiation adaptative et de l’évolution convergente. Avec leurs invasions et leurs radiations ultérieures sur les îles des Caraïbes, les anoles fournissent un analogue terrestre à l’épinoche et aux poissons cichlidés, qui ont subi une évolution adaptative dans des environnements aquatiques distincts. Tout comme la recherche génomique sur les épinoches a approfondi l’étude de la spéciation écologique aquatique, une enquête phylogénétique génomique à grande échelle sur les anoles des Caraïbes serait l’occasion d’étudier en détail l’évolution adaptative chez un animal terrestre26 ; en particulier parce que les génomes des anoles contiennent un grand nombre d’éléments mobiles actifs qui, selon nos spéculations, pourraient former des substrats pour l’exaptation de nouveaux éléments régulateurs.