Linia amniotów podzieliła się na linie przodków ssaków i gadów ∼320 milionów lat temu. Obecnie żyjącymi członkami tych linii są ssaki, obejmujące ∼ 4 500 gatunków, oraz gady, zawierające ∼ 17 000 gatunków. W obrębie gadów ∼ 280 mln lat temu wyodrębniły się dwa główne klady: lepidozaury, do którego należą jaszczurki (w tym węże) i tuatary, oraz archozaury, do którego należą krokodyle i ptaki (pozycja żółwi pozostaje niejasna)6. Dla uproszczenia, będziemy się tu odnosić do lepidozaurów jako jaszczurek (ryc. 1).
Badanie głównych wydarzeń genomowych, które towarzyszyły przejściu do w pełni lądowego cyklu życia, zostało wsparte przez sekwencjonowanie kilku ssaków (K.L.-.T. et al., manuskrypt złożony) i trzech genomów ptaków2,3,4. Genom jaszczurki A. carolinensis wypełnia zatem ważną lukę w badaniach nad amniotami, rozdzielając długą gałąź między ssakami a ptakami i umożliwiając bardziej solidną analizę ewolucyjną genomów amniotów.
Na przykład prawie wszystkie genomy gadów zawierają mikrochromosomy, ale zostały one zbadane na poziomie sekwencji tylko u ptaków2,7, co rodzi pytanie, czy osobliwe cechy sekwencji ptasich mikrochromosomów są uniwersalne dla mikrochromosomów gadów8. Innym przykładem są badania nad ewolucją chromosomów płciowych. Prawie wszystkie ssaki łożyskowe i marsupialne mają homologiczne chromosomy płci (XY)9 , a wszystkie ptaki mają chromosomy płci ZW. Jednakże jaszczurki wykazują genetyczną lub zależną od temperatury determinację płci10. Scharakteryzowanie chromosomów płciowych jaszczurek pozwoliłoby na zbadanie wcześniej nieznanych chromosomów płciowych i porównanie niezależnych systemów chromosomów płciowych u blisko spokrewnionych gatunków.
Jaszczurki Annis obejmują zróżnicowany klad ∼400 opisanych gatunków rozmieszczonych w całym Neotropiku. Jaszczurki te rozprzestrzeniły się, często zbieżnie, w różnych niszach ekologicznych z towarzyszącymi im adaptacjami morfologicznymi, stanowiąc jeden z najlepszych przykładów radiacji adaptacyjnej. W szczególności, szczegółowo udokumentowano ich różnicowanie się w wielu powielanych niszach na różnych wyspach karaibskich poprzez konkurencję międzygatunkową i dobór naturalny11. A. carolinensis jest jedynym anolem występującym w USA i można go znaleźć od Florydy i Teksasu po Karolinę Północną. Wybraliśmy ten gatunek do sekwencjonowania genomu, ponieważ jest on szeroko stosowany jako model gada do ekologii eksperymentalnej, zachowania, fizjologii, endokrynologii, epizootii i, coraz częściej, genomiki.
Genom anola zielonego został zsekwencjonowany i złożony (AnoCar 2.0) przy użyciu DNA pochodzącego od samicy jaszczurki A. carolinensis (tabele uzupełniające 1-4). Fluorescencyjna hybrydyzacja in situ (FISH) klonów 405 sztucznych chromosomów bakteryjnych (BAC) (pochodzących od samca) pozwoliła na zakotwiczenie rusztowań montażowych do chromosomów (Tabela uzupełniająca 5 i Rys. uzupełniający 1). Genom A. carolinensis ma kariotyp n = 18 chromosomów, składający się z sześciu par dużych makrochromosomów i 12 par małych mikrochromosomów12. Szkic sekwencji genomu ma rozmiar 1,78 Gb (patrz Tabela 3 w Suplemencie dla statystyk zespołu) i reprezentuje pośrednią pozycję między zespołami genomów ptaków (0,9-1,3 Gb) i ssaków (2,0-3,6 Gb).
Odkryliśmy, że niewiele chromosomalnych rearanżacji nastąpiło w ciągu 280 milionów lat od momentu rozejścia się anola i kurczaka, jak sugerowały wcześniejsze porównania z wykorzystaniem Xenopus i kurczaka13. Istnieje 259 bloków syntenicznych (zdefiniowanych jako kolejne kotwice synteniczne, które są zgodne w kolejności, orientacji i odstępach, w rozdzielczości 1 Mb) między jaszczurką a kurczakiem (Tabela uzupełniająca 6 i Rys. uzupełniający 2). Co ciekawe, 19 z 22 zakotwiczonych chromosomów kurczaka jest syntenicznych z pojedynczym chromosomem A. carolinensis na całej długości (ryc. 2a); dla porównania, tylko 6 (z 23) chromosomów człowieka jest syntenicznych z pojedynczym chromosomem oposa na całej długości, mimo że gatunki te rozdzieliły się zaledwie 148 milionów lat temu14. Segmentalne duplikacje podążają za trendami zaobserwowanymi w innych genomach płazów (Supplementary Note, Supplementary Table 7 i Supplementary Fig. 3).
Approximately 30% of the A. carolinensis genom składa się z elementów ruchomych, które obejmują znacznie szerszą różnorodność aktywnych rodzin powtórzeń niż jest to obserwowane w przypadku genomów ptaków2 lub ssaków15. Najbardziej aktywnymi klasami są długie elementy przeplatane (LINE) (27%) i krótkie elementy przeplatane (SINE) (16%)16 (Tabela 8). Większość powtórzeń LINE należy do pięciu grup (L1, L2, CR1, RTE i R4) i na podstawie ich podobieństwa sekwencji (dywergencja waha się w granicach 0,00-0,76%; ref. 17) wydaje się, że są to niedawne insercje. Kontrastuje to z obserwacjami genomów ssaków, w których przez dziesiątki milionów lat dominowała tylko jedna rodzina LINEs-L1. Transpozony DNA obejmują co najmniej 68 rodzin należących do pięciu superrodzin: hAT, Chapaev, Maverick, Tc/Mariner i Helitron18. Podobnie jak w przypadku retrotranspozonów, większość rodzin transpozonów DNA wydaje się być stosunkowo młoda, w przeciwieństwie do bardzo niewielu ostatnio aktywnych transpozonów DNA występujących w genomach innych płazów (tabela uzupełniająca 9). Ogólnie rzecz biorąc, elementy ruchome A. carolinensis charakteryzują się znacznie wyższą zawartością GC (43,5%, P < 10-20) niż średnia dla całego genomu wynosząca 40,3%. Oprócz elementów ruchomych, A. carolinensis wykazuje wysoką gęstość (3,5%) tandemowych powtórzeń, z rozkładem długości i częstotliwości podobnym do rozkładu ludzkiego mikrosatelitarnego DNA15. Obecnie wiemy, że genomy płazów dzielą się na co najmniej trzy typy: genomy ssaków są wzbogacone o elementy L1 i charakteryzują się wysokim stopniem akumulacji elementów mobilnych, genomy ptaków są ubogie w powtórzenia z bardzo małą aktywnością elementów mobilnych, natomiast genom jaszczurek zawiera niezwykle szeroką różnorodność rodzin aktywnych elementów mobilnych, ale charakteryzuje się niskim stopniem akumulacji, co przypomina profil elementów mobilnych u ryb teleosteanowych19.
Większość genomów gadów zawiera mikrochromosomy, ale ich liczba różni się w zależności od gatunku; genom A. carolinensis zawiera 12 par mikrochromosomów12, podczas gdy genom kurczaka zawiera 28 par. Mikrochromosomy ptaków mają bardzo charakterystyczne właściwości w porównaniu z makrochromosomami ptaków, takie jak wyższa zawartość GC i niższa zawartość powtórzeń2, podczas gdy mikrochromosomy jaszczurek nie wykazują tych cech (Rys. 2b). Co znamienne, wszystkie sekwencje zakotwiczone do mikrochromosomów A. carolinensis pokrywają się również z mikrochromosomami w genomie kurczaka, a wszystkie oprócz jednego mikrochromosomu A. carolinensis są synteniczne tylko z jednym odpowiadającym mu mikrochromosomem kurczaka (Ryc. 2a). Mikrochromosomy konserwowane między A. carolinensis i kurczakiem mogły więc powstać u przodka gadów, podczas gdy pozostałe mikrochromosomy kurczaka mogły pochodzić z linii ptasiej. Alternatywnie, pozostałe mikrochromosomy kurczaka mogły być obecne u przodka gadów, ale połączyły się w makrochromosomy w linii jaszczurek.
Genom A. carolinensis ma zaskakująco małe regionalne zróżnicowanie zawartości GC, znacznie mniejsze niż poprzednio obserwowane u ptaków i ssaków; jest to jedyny znany genom owodniowy, którego skład nukleotydów jest tak jednorodny jak genomu żaby5 (ryc. 4 i 5). Rysunek 3 ilustruje, jak lokalna zawartość GC jest ewolucyjnie konserwowana między ludzkim chromosomem 14 i chromosomem 5 kurczaka, ale w znacznie mniejszym stopniu z chromosomem 1 A. carolinensis. Ponieważ wszystkie sekwencjonowane genomy płazów innych niż A. carolinensis zawierają te homologiczne, zróżnicowane poziomy zawartości GC („izochory”)20, heterogeniczność GC u płazów prawdopodobnie uległa erozji w kierunku homogeniczności w linii tej jaszczurki. Zaproponowano, że izochory o wysokiej zawartości GC są konsekwencją wyższych wskaźników konwersji genów GC-biased w regionach o wyższej rekombinacji2. Większa jednorodność GC w genomie anola może więc odzwierciedlać bardziej równomierne tempo rekombinacji, lub też znacznie zmniejszoną tendencję do GC podczas rozwiązywania problemów konwersji genów w linii A. carolinensis (dyskusja na ten temat, patrz ref. 5).
Zarówno zależna od temperatury determinacja płci, jak i genetyczna determinacja płci XY zostały stwierdzone u Iguania10. W obrębie rodzaju Anolis, istnieją gatunki z heteromorficznymi chromosomami XY (w tym te z wieloma chromosomami X i Y), oraz inne z całkowicie homomorficznymi chromosomami12. Wiadomo, że A. carolinensis ma genetyczną determinację płci21, ale forma jego chromosomów płciowych (ZW lub XY) była dotychczas nieznana ze względu na brak ewidentnie heteromorficznych chromosomów.
Dokładne badanie komórek samców i samic przy użyciu FISH pozwoliło nam zidentyfikować mikrochromosom oznaczony wcześniej jako 'b’ jako chromosom X A. carolinensis; jest on obecny w dwóch kopiach u samic i jednej u samców. Chromosom ten jest synteniczny z mikrochromosomem 15 kurczaka. Jedenaście BACs przypisanych do dwóch rusztowań, 154 (3.3 Mb) i chrUn0090 (1.8 Mb), hybrydyzuje poprzez FISH do ramion p dwóch chromosomów X u samic i hybrydyzuje do ramienia p pojedynczego chromosomu X u samców (Fig. 4 i Supplementary Fig. 1). A. carolinensis wykazuje zatem wzór reprezentatywny dla męskiego heterogametycznego systemu genotypowej determinacji płci. Nie zidentyfikowaliśmy chromosomu Y, ale stawiamy hipotezę, że A. carolinensis posiada zarówno chromosom X, jak i Y, ponieważ zarówno męskie, jak i żeńskie komórki zawierają taką samą liczbę chromosomów.