Linie amniot se rozdělila na předky savců a plazů před ∼320 miliony let. Dnes jsou přeživšími příslušníky těchto linií savci, kteří zahrnují ∼4 500 druhů, a plazi, kteří obsahují ∼17 000 druhů. V rámci plazů se před ∼280 miliony let rozdělily dva hlavní rody: lepidosauři, kam patří ještěři (včetně hadů) a tuatara, a archosauři, kam patří krokodýli a ptáci (pozice želv zůstává nejasná)6 . Pro zjednodušení zde budeme lepidosaury označovat jako ještěry (obr. 1).
Studium hlavních genomických událostí, které doprovázely přechod k plně suchozemskému životnímu cyklu, bylo podpořeno sekvenováním několika savců (K.L.-.T. et al., předložený rukopis) a tří ptačích genomů2,3,4 . Genom ještěra A. carolinensis tak vyplňuje důležitou mezeru v pokrytí amniot, rozděluje dlouhou větev mezi savci a ptáky a umožňuje robustnější evoluční analýzu genomů amniot.
Například téměř všechny genomy plazů obsahují mikrochromozomy, které však byly na sekvenční úrovni studovány pouze u ptáků2,7, což vyvolává otázku, zda jsou zvláštní sekvenční rysy ptačích mikrochromozomů univerzální pro všechny mikrochromozomy plazů8. Dalším příkladem je studium evoluce pohlavních chromozomů. Téměř všichni placentální a vačnatí savci mají společné homologní pohlavní chromozomy (XY)9 a všichni ptáci mají společné pohlavní chromozomy ZW. Ještěři však vykazují buď genetické, nebo teplotně závislé určení pohlaví10. Charakterizace pohlavních chromozomů ještěrů by umožnila studium dosud neznámých pohlavních chromozomů a srovnání nezávislých systémů pohlavních chromozomů u blízce příbuzných druhů.
Ještěři rodu Anolis tvoří rozmanitý klad ∼400 popsaných druhů rozšířených po celém území Neotropika. Tito ještěři se radiovali, často konvergentně, do různých ekologických nik s doprovodnými morfologickými adaptacemi, což představuje jeden z nejlepších příkladů adaptivní radiace. Zejména jejich diverzifikace do mnoha replikačních nik na různých karibských ostrovech prostřednictvím mezidruhové konkurence a přírodního výběru byla podrobně zdokumentována11. A. carolinensis je jediným mravenečníkem původním v USA a vyskytuje se od Floridy a Texasu až po Severní Karolínu. Tento druh jsme si vybrali pro sekvenování genomu, protože je široce využíván jako model plazů pro experimentální ekologii, chování, fyziologii, endokrinologii, epizootologii a stále častěji i genomiku.
Genom anoly zeleného byl sekvenován a sestaven (AnoCar 2.0) s použitím DNA ze samice ještěra A. carolinensis (doplňkové tabulky 1-4). Fluorescenční in situ hybridizace (FISH) 405 klonů bakteriálního umělého chromozomu (BAC) (ze samce) umožnila ukotvení montážních skeletů na chromozomy (Doplňková tabulka 5 a Doplňkový obr. 1). Bylo zjištěno, že genom A. carolinensis má karyotyp n = 18 chromozomů, který se skládá ze šesti párů velkých makrochromozomů a 12 párů malých mikrochromozomů12. Návrh sekvence genomu má velikost 1,78 Gb (statistiky sestavení viz doplňková tabulka 3) a představuje mezistupeň mezi sestavením genomu ptáků (0,9-1,3 Gb) a savců (2,0-3,6 Gb).
Zjistili jsme, že během 280 milionů let od rozdělení anolů a kuřat došlo jen k několika chromozomálním přestavbám, jak naznačovala předchozí srovnání s použitím Xenopus a kuřat13. Mezi ještěrem a kuřetem je 259 syntenických bloků (definovaných jako po sobě jdoucí syntenické kotvy, které jsou konzistentní co do pořadí, orientace a rozestupu, při rozlišení 1 Mb) (Doplňková tabulka 6 a Doplňkový obr. 2). Zajímavé je, že 19 z 22 zakotvených kuřecích chromozomů je každý syntenický s jediným chromozomem A. carolinensis v celé své délce (obr. 2a); naproti tomu pouze 6 (z 23) lidských chromozomů je syntenických s jediným chromozomem vačice v celé své délce, přestože se tyto druhy rozdělily teprve před 148 miliony let14. Segmentální duplikace sledují trendy pozorované u jiných genomů amniot (Doplňková poznámka, Doplňková tabulka 7 a Doplňkový obr. 3).
Přibližně 30 % genomu A. carolinensis genomu je tvořeno mobilními elementy, které zahrnují mnohem širší škálu rodin aktivních repetic, než je tomu u genomů ptáků2 nebo savců15. Nejaktivnějšími třídami jsou dlouhé prokládané (LINE) elementy (27 %) a krátké prokládané (SINE) elementy (16 %)16 (doplňková tabulka 8). Většina repetic LINE patří do pěti skupin (L1, L2, CR1, RTE a R4) a na základě sekvenční podobnosti se zdá, že jde o nedávné inzerce (divergence se pohybuje v rozmezí 0,00-0,76 %; pozn. 17). To kontrastuje s pozorováním savčích genomů, kde po desítky milionů let převládala pouze jediná rodina LINEs-L1. DNA transpozony zahrnují nejméně 68 rodin patřících do pěti nadrodin: hAT, Chapaev, Maverick, Tc/Mariner a Helitron18. Stejně jako u retrotranspozonů se zdá, že většina rodin DNA transpozonů je relativně mladá, na rozdíl od extrémně malého počtu nedávno aktivních DNA transpozonů nalezených v genomech jiných amniot (doplňková tabulka 9). Celkově se mobilní elementy A. carolinensis vyznačují výrazně vyšším obsahem GC (43,5 %, P < 10-20), než je celogenomový průměr 40,3 %. Kromě mobilních elementů vykazuje A. carolinensis vysokou hustotu (3,5 %) tandemových repetic s podobnou distribucí délky a frekvence jako u lidské mikrosatelitní DNA15. Nyní víme, že genomy amniot se vyskytují nejméně ve třech typech: genomy savců jsou obohaceny o L1 elementy a mají vysoký stupeň akumulace mobilních elementů, genomy ptáků jsou chudé na repetice s velmi malou aktivitou mobilních elementů, zatímco genom ještěrů obsahuje extrémně širokou diverzitu aktivních rodin mobilních elementů, ale má nízkou míru akumulace, což připomíná profil mobilních elementů teleosteálních ryb19.
Genomy většiny plazů obsahují mikrochromozomy, ale jejich počet se u jednotlivých druhů liší; genom A. carolinensis obsahuje 12 párů mikrochromozomů12, zatímco genom kuřete 28 párů. Ptačí mikrochromozomy mají ve srovnání s ptačími makrochromozomy velmi výrazné vlastnosti, jako je vyšší obsah GC a nižší obsah repetic2 , zatímco mikrochromozomy ještěrů tyto vlastnosti nevykazují (obr. 2b). Pozoruhodné je, že všechny sekvence ukotvené na mikrochromosomech u A. carolinensis se také shodují s mikrochromosomy v kuřecím genomu a všechny mikrochromosomy A. carolinensis kromě jednoho jsou syntenické pouze s jedním odpovídajícím kuřecím mikrochromosomem (obr. 2a). Mikrochromozomy konzervované mezi A. carolinensis a kuřetem tedy mohly vzniknout v plazím předkovi, zatímco zbývající kuřecí mikrochromozomy mohly být odvozeny v ptačí linii. Alternativně mohly být zbývající kuřecí mikrochromozomy přítomny v plazím předkovi, ale v ještěří linii se spojily do makrochromozomů.
Genom A. carolinensis má překvapivě malou regionální variabilitu obsahu GC, podstatně menší, než bylo dříve pozorováno u ptáků a savců; je to jediný známý amniový genom, jehož nukleotidové složení je stejně homogenní jako genom žáby5 (doplňkové obr. 4 a 5). Obrázek 3 ukazuje, jak je lokální obsah GC evolučně konzervován mezi lidským chromozomem 14 a kuřecím chromozomem 5, ale v mnohem menší míře s chromozomem 1 A. carolinensis. Vzhledem k tomu, že všechny sekvenované genomy amniotů kromě A. carolinensis obsahují tyto homologické rozdílné úrovně obsahu GC („izochory“)20 , je pravděpodobné, že v linii tohoto ještěra došlo k erozi ancestrální heterogenity GC amniotů směrem k homogenitě. Bylo navrženo, že izochory s vysokým obsahem GC jsou důsledkem vyšší míry konverze GC genů v oblastech s vyšší rekombinací2. Větší homogenita GC v genomu anolů tak může odrážet rovnoměrnější míru rekombinace, nebo jinak podstatně menší vychýlení směrem ke GC při řešení událostí genové konverze v linii A. carolinensis (diskuse viz ref. 5).
U Iguania10 bylo zjištěno jak teplotně závislé určení pohlaví, tak genetické určení pohlaví XY. V rámci rodu Anolis existují druhy s heteromorfními chromozomy XY (včetně těch s vícenásobnými chromozomy X a Y) a jiné se zcela homomorfními chromozomy12. U druhu A. carolinensis je známa genetická determinace pohlaví21 , ale forma jeho pohlavních chromozomů (ZW nebo XY) byla dosud neznámá vzhledem k nedostatku zjevně heteromorfních chromozomů.
Důkladné vyšetření samčích a samičích buněk pomocí FISH nám umožnilo identifikovat mikrochromozom dříve označený jako „b“ jako chromozom X druhu A. carolinensis; u samic je přítomen ve dvou kopiích a u samců v jedné. Tento chromozom je syntenický s kuřecím mikrochromozomem 15. Jedenáct BAC přiřazených ke dvěma scaffoldům, 154 (3,3 Mb) a chrUn0090 (1,8 Mb), hybridizuje pomocí FISH s rameny p obou chromozomů X u samic a hybridizuje s ramenem p jediného chromozomu X u samců (obr. 4 a doplňkový obr. 1). A. carolinensis tak vykazuje vzor reprezentující samčí heterogametický systém genotypové determinace pohlaví. Chromozom Y jsme neidentifikovali, ale předpokládáme, že A. carolinensis má jak chromozom X, tak chromozom Y, protože samčí i samičí buňky obsahují stejný počet chromozomů.
5,1 Mb sekvence přiřazené chromozomu X obsahuje 62 genů kódujících proteiny (doplňková tabulka 10); termíny GO (Gene Ontology) spojené s těmito geny nevykazují žádné významné obohacení. Je velmi pravděpodobné, že existuje více sekvencí chromozomu X, které jsou v současné době v sestavě AnoCar 2.0 označeny jako nezakotvené lešení. Identifikace genu pro determinaci pohlaví A. carolinensis bude vyžadovat značnou funkční biologii, ale poznamenáváme, že gen pro determinaci pohlaví kuřat DMRT1 se nachází na chromozomu 2 A. carolinensis a že SOX3 (paralog chromozomu X genu SRY pro determinaci pohlaví teriálních savců) se nachází na nezakotveném lešení A. carolinensis; tyto geny tedy pravděpodobně nejsou genem pro determinaci pohlaví A. carolinensis.
Všech deset genů A. carolinensis se nachází na chromozomu 2 A. carolinensis. carolinensis (pocházejících z Jižní Karolíny a Tennessee) použitých pro mapování metodou FISH vykazovalo velké pericentromerické inverze v jednom nebo více chromozomech 1-4, bez korelace mezi různými chromozomálními inverzemi nebo s pohlavím ještěra (viz Doplňková poznámka, Doplňková tabulka 11 a Doplňkový obr. 11). 6).
Ze sestavy genomu A. carolinensis (Ensembl release 56, září 2009) bylo předpovězeno celkem 17 472 genů kódujících proteiny a 2 924 genů RNA. Sestavili jsme fylogenezi pro všechny druhy A. carolinensis a jejich homologů u osmi dalších druhů obratlovců (člověk, myš, pes, vačice, ptakopysk, kuře, zebřička a pufferfish), což nám umožnilo identifikovat konzervativní soubor 3 994 ortologů one-to-one, tj. genů, které nebyly u žádného z těchto obratlovců duplikovány nebo odstraněny od jejich posledního společného předka. Tyto fylogeneze genů byly také použity k identifikaci genů, které vznikly duplikací v linii ještěrů po rozdělení s linií ptáků, a zvlášť těch, které byly ztraceny v linii savců po rozdělení savců a plazů (obr. 1, doplňková poznámka, doplňkový obr. 2). 7 a Doplňková tabulka 12).
Nalezli jsme 11 opsinových genů A. carolinensis, které nemají žádné savčí ortology (ale mají ortology u bezobratlých, ryb a žab), a tudíž se zdá, že byly ztraceny během savčí evoluce (Doplňková tabulka 13). Velký repertoár opsinů může přispívat k vynikajícímu barevnému vidění anoles – včetně schopnosti vidět v ultrafialovém pásmu – a také může přispívat k jejich hyperdiverzitě tím, že umožňuje evoluci rozmanitého, druhově specifického zbarvení rosniček, které má důležitou roli při pohlavním výběru a rozpoznávání druhů11. Podobně jsou u A. carolinensis vysoce duplikovány geny pro čichový receptor a β-keratin (Doplňková poznámka a Doplňkový obr. 9).
Mnoho plazů, včetně anola zeleného, se od placentálních savců liší tím, že jsou vejcorodí (kladou vejce). Viviparita u placentálních savců je odvozený stav, což se odráží v jejich ztrátě některých genů souvisejících s vejci. K identifikaci proteinů přítomných v nezralém vejci A. carolinensis jsme použili hmotnostní spektrometrii, protože většina vaječných proteinů je produkována v těle matky a poté transportována do nezralého vejce. Zjistili jsme, že na rozdíl od savců dochází u plazů k liniově specifickým genovým duplikacím, mimo jiné u vitellogeninů (VTG), apovitelleninu-1, ovomucinu-α a tří homologů ovocalyxinu-36, matrixového proteinu slepičích vaječných skořápek.
Naše výsledky ukazují rychlou evoluci genů pro vaječné proteiny mezi amnioty. Konkrétně jsme v nezralých vejcích A. carolinensis nalezli proteiny 276 genů (doplňkové tabulky 14 a 15), z nichž pouze 50 bylo potvrzeno hmotnostní spektrometrií22,23 v kuřecích vejcích. Mezi tyto geny patří VTG, lysozym, paralogy proteinu vnější vrstvy vitelinové membrány 1 (VMO1), inhibitory proteáz, natterin a nothepsin. Srovnáním genů, které jsou ortologem jedna ku jedné u A. carolinensis a kuřete, jsme zjistili, že vaječné proteiny se vyvíjejí významně rychleji než nevaječné proteiny (průměrné hodnoty dN/dS (poměr rychlosti nesynonymních substitucí k rychlosti synonymních substitucí) 0,186, resp. 0,135; P = 1.).2 × 10-5), což odráží sníženou purifikační selekci a/nebo častější epizody adaptivní evoluce.
Pomocí sekvencí genomu několika obratlovců jsme identifikovali tři paralogy VMO1 (které jsme pojmenovali α, β a γ), u nichž usuzujeme, že byly přítomny u posledního společného předka všech plazů a savců. Zatímco ve všech ostatních genomech amniot došlo ke ztrátě alespoň jednoho z paralogů VMO1-α, VMO1-β a VMO1-γ, genom A. carolinensis obsahuje zástupce všech tří paralogů. Rodina VMO1-α specifická pro A. carolinensis se navíc rozrostla na 13 členů a prošla pozitivní selekcí aminokyselinových substitucí v negativně nabité, pravděpodobně substrát vázající dutině; změny, které pravděpodobně modifikují její lysozymovou transferázovou aktivitu (Doplňková poznámka, Doplňkový obr. 8 a Doplňkové tabulky 16 a 17).
Rozsáhlý a aktivní repertoár repetic A. carolinensis nám umožnil odhalit původ několika savčích konzervovaných prvků. Prostřednictvím procesu exaptace (významné změny funkce sekvence během evoluce) se některé mobilní elementy, které byly aktivní u předka amniotů, staly konzervovanými a pravděpodobně funkčními u savců, zatímco u A. carolinensis zůstaly aktivními mobilními elementy. Původ těchto konzervovaných sekvencí mobilních elementů savců nebyl rozpoznatelný bez srovnání se vzdálenou a na opakování bohatou sekvencí genomu24. V lidském genomu jsme identifikovali 96 takových exaptovaných elementů (viz doplňková tabulka 18), které mají původ v mobilních elementech přítomných u předka amniot, které jsou stále přítomny v A. carolinensis, zejména v rodinách CR1, L2 a gypsy.
Ačkoli většina exaptovaných elementů je nekódující a pravděpodobně plní regulační funkci, identifikovali jsme také exon kódující protein, který byl exaptován z L2-like LINE a nyní tvoří exon 2 v N-terminální oblasti proteinu MIER1 (mesoderm induction early response 1) specifického pro savce. Tento exon je vysoce konzervovaný napříč 29 savci, a proto pravděpodobně představuje inovaci savců od dob předka amniotů.
TermínyGO spojené s místem začátku transkripce, které je nejblíže každému exaptovanému elementu v lidském genomu, vykazují obohacení o neurodevelopmentální geny (viz Metody), přičemž „vazba efrinových receptorů“, „vývoj nervového systému“ a „synaptický přenos“ jsou silně obohaceny (všechny hodnoty P < 5 × 10-3). Tato obohacení odpovídají adaptivním změnám ve vývoji nervové soustavy, k nimž došlo během vzniku savců.
Ještěři rodu Anolis jsou učebnicovým příkladem adaptivní radiace, neboť se diverzifikovali nezávisle na každém ostrově Velkých Antil a v celém neotropickém pásmu a vytvořili širokou škálu ekologicky a morfologicky diferencovaných druhů, přičemž na jedné lokalitě se jich vyskytuje až 1511. Ačkoli jsou anolisové hojně využíváni jako modelový systém pro fylogenetické srovnávací studie, bylo obtížné určit evoluční vztahy mezi hlavními klany anolisů kvůli rychlé evoluční radiaci spojené s přístupem k novým dimenzím ekologických příležitostí. Úspěšné vyřešení relativně krátkých větvících událostí spojených s takovou radiací vyžaduje množství dat z lokusů vyvíjejících se vhodnou rychlostí.
Použili jsme sekvenci genomu A. carolinensis k vytvoření nového souboru fylogenomických dat sestávajícího z 20 kb sekvenčních dat vybraných napříč genomy 93 druhů anoles (doplňkové tabulky 19 a 20). Analýzy tohoto souboru dat vedou k dobře podporované fylogenezi, která posiluje a objasňuje adaptivní a biogeografickou historii jepic (obr. 5, podrobnosti na doplňkovém obr. 10). Za prvé, naše fylogenomická analýza potvrzuje předchozí molekulární a morfologické studie, které naznačují, že podobní specialisté na stanoviště anolů se vyvinuli nezávisle na každém ze čtyř velkých ostrovů Velkých Antil. Za druhé, naše analýzy naznačují komplexní biogeografický scénář zahrnující omezený počet disperzí mezi ostrovy a rozsáhlou diverzifikaci in situ v rámci ostrovů. Nejbližší příbuzní anolisů se vyskytují na pevnině a fylogeneze potvrzuje existenci dvou kolonizací, jedné do jižní části Malých Antil a druhé, která vedla k rozmanitým adaptivním radiacím ve zbytku Karibiku. V rámci této druhé skupiny se anolisové zpočátku diverzifikovali především na dvou větších ostrovech Velkých Antil (ačkoli se zdá, že se to týkalo i Portorika), než následně prošli sekundární radiací na všech ostrovech a nakonec se vrátili na pevninu, kde tato zpětná kolonizace vytvořila rozsáhlou evoluční radiaci. Fylogeneze také naznačuje, že v evoluci Velkých Antil došlo k velmi malému počtu disperzí mezi ostrovy. Fauna Velkých Antil, proslulá tím, že se na každém ostrově vyskytují stejné ekomorfní druhy, je spíše výsledkem konvergentní evoluce25.
Sekvence genomu A. carolinensis umožňuje hlubší pochopení evoluce amniot. Zaplnění tohoto důležitého plazího uzlu sekvenovaným genomem odhalilo odvozené stavy v každé hlavní větvi amniotů a pomohlo osvětlit předky amniotů. Strom sekvenovaných genomů plazů je však stále velmi řídký a k plnému pochopení toho, nakolik jsou genomy A. carolinensis a sekvenované genomy ptáků typické pro celý klad plazů, by bylo nutné sekvenování dalších neavijských plazů.
Kromě užitečnosti sekvence genomu A. carolinensis jako zástupce neavijských plazů představují druhy rodu Anolis jedinečný zdroj pro studium adaptivní radiace a konvergentní evoluce. Svými invazemi a následnou radiací na karibských ostrovech představují anolisové suchozemskou obdobu leskoploutvých a cichlidních ryb, které prošly adaptivní evolucí v oddělených vodních prostředích. Stejně jako genomický výzkum u sticklebacků prohloubil studium vodní ekologické speciace, rozsáhlý genomický fylogenetický průzkum karibských anoles by byl příležitostí pro detailní studium adaptivní evoluce u suchozemského živočicha26; zejména proto, že genomy anolů obsahují velké množství aktivních mobilních elementů, o kterých předpokládáme, že by mohly tvořit substrát pro exaptaci nových regulačních elementů.