a, Pochissimi riarrangiamenti si sono verificati nei 280 milioni di anni da quando A. carolinensis e pollo si sono differenziati. I microcromosomi di A. carolinensis sono esclusivamente sintenici ai microcromosomi del pollo. Le barre colorate orizzontali rappresentano i sei macrocromosomi di A. carolinensis (1-6) e i sei (di 12) microcromosomi di A. carolinensis che hanno una sequenza ancorata a loro che è sintenica al genoma del pollo (7, 8, 9, X, LGg, LGh). Ai cromosomi che potevano essere ordinati in base alle dimensioni è stato assegnato un numero; ai microcromosomi più piccoli che non potevano essere distinti in base alle dimensioni è stata assegnata una lettera minuscola. Ogni colore corrisponde a un diverso cromosoma di pollo come indicato nella chiave. Ogni parte di un cromosoma di A. carolinensis che è sintenica a un microcromosoma di pollo è indicata con ‘m’. b, I microcromosomi di pollo hanno sia un contenuto di GC più alto che un contenuto di ripetizioni più basso rispetto ai macrocromosomi di pollo, mentre i cromosomi di A. carolinensis non variano in GC o contenuto di ripetizioni in base alle dimensioni del cromosoma. I cerchi grandi indicano la percentuale di GC di ogni cromosoma nei genomi di pollo e lucertola con più di 100 kb di sequenza ancorata ad esso. I cerchi piccoli indicano la percentuale del genoma costituito da sequenze ripetitive di ciascun cromosoma nei genomi del pollo (cerchi blu) e della lucertola (cerchi rossi).
Diapositiva PowerPoint
Circa il 30% del genoma di A. carolinensis è composto da elementi mobili, che comprendono una varietà molto più ampia di famiglie di ripetizioni attive rispetto ai genomi degli uccelli2 o dei mammiferi15 . Le classi più attive sono gli elementi lunghi interspersi (LINE) (27%) e gli elementi brevi interspersi (SINE) (16%)16 (Tabella 8 supplementare). La maggior parte delle ripetizioni LINE appartengono a cinque gruppi (L1, L2, CR1, RTE e R4) e sembrano essere inserzioni recenti in base alla loro somiglianza di sequenza (divergenza varia da 0,00-0,76%; rif. 17). Questo contrasta con le osservazioni dei genomi dei mammiferi, dove solo una singola famiglia di linee-L1 ha predominato per decine di milioni di anni. I trasposoni del DNA comprendono almeno 68 famiglie appartenenti a cinque superfamiglie: hAT, Chapaev, Maverick, Tc/Mariner e Helitron18. Come per i retrotrasposoni, la maggior parte delle famiglie di trasposoni del DNA sembrano essere relativamente giovani in contrasto con i pochissimi trasposoni del DNA recentemente attivi trovati in altri genomi amnioti (Tabella 9 supplementare). Nel complesso, gli elementi mobili di A. carolinensis presentano un contenuto di GC significativamente più elevato (43,5%, P < 10-20) rispetto alla media del genoma del 40,3%. Oltre agli elementi mobili, A. carolinensis presenta un’alta densità (3,5%) di ripetizioni tandem, con distribuzioni di lunghezza e frequenza simili a quelle del DNA microsatellite umano15. Ora sappiamo che i genomi amnioti sono di almeno tre tipi: i genomi dei mammiferi sono arricchiti di elementi L1 e hanno un alto grado di accumulo di elementi mobili, i genomi degli uccelli sono poveri di ripetizioni con pochissima attività di elementi mobili, mentre il genoma delle lucertole contiene una diversità estremamente ampia di famiglie di elementi mobili attivi ma ha un basso tasso di accumulo, che ricorda il profilo degli elementi mobili dei pesci teleostei19.
La maggior parte dei genomi dei rettili contiene microcromosomi, ma il numero varia tra le specie; il genoma di A. carolinensis contiene 12 coppie di microcromosomi12, mentre il genoma del pollo ne contiene 28 coppie. I microcromosomi degli uccelli hanno proprietà molto distintive rispetto ai macrocromosomi degli uccelli, come un più alto contenuto di GC e di ripetizioni inferiori2, mentre i microcromosomi delle lucertole non presentano queste caratteristiche (Fig. 2b). Notevolmente, tutta la sequenza ancorata ai microcromosomi in A. carolinensis si allinea anche ai microcromosomi nel genoma del pollo, e tutti i microcromosomi di A. carolinensis tranne uno sono sintenici ad un solo microcromosoma corrispondente del pollo (Fig. 2a). I microcromosomi conservati tra A. carolinensis e il pollo potrebbero quindi essere sorti nell’antenato del rettile, mentre i restanti microcromosomi del pollo potrebbero essere derivati nella stirpe degli uccelli. In alternativa, i microcromosomi di pollo rimanenti potrebbero essere stati presenti nell’antenato dei rettili ma fusi per formare macrocromosomi nella discendenza delle lucertole.
Il genoma di A. carolinensis ha una variazione regionale del contenuto di GC sorprendentemente piccola, sostanzialmente inferiore a quella precedentemente osservata per gli uccelli e i mammiferi; è l’unico genoma amniotico conosciuto la cui composizione nucleotidica è omogenea come il genoma della rana5 (Figure 4 e 5 supplementari). La figura 3 illustra come il contenuto locale di GC sia evolutivamente conservato tra il cromosoma 14 umano e il cromosoma 5 del pollo, ma in misura molto minore con il cromosoma 1 di A. carolinensis. Poiché tutti i genomi amnioti sequenziati diversi da A. carolinensis contengono questi livelli variabili omologhi di contenuto di GC (‘isocore’)20, è probabile che l’eterogeneità GC amniota ancestrale si sia erosa verso l’omogeneità nella stirpe di questa lucertola. È stato proposto che gli isocori ad alto contenuto di GC siano una conseguenza di tassi più alti di conversione genica GC-biased in regioni di maggiore ricombinazione2. La maggiore omogeneità di GC nel genoma dell’anolo può quindi riflettere tassi di ricombinazione più uniformi, o un bias sostanzialmente ridotto verso GC durante la risoluzione degli eventi di conversione genica nella stirpe di A. carolinensis (per una discussione, vedi rif. 5).
Figura 3: Il genoma di A. carolinensis manca di isocore.
Il genoma di A. carolinensis mostra solo variazioni molto locali nel contenuto di GC, a differenza dei genomi umano e del pollo, che mostrano anche tendenze più ampie nella variazione di GC, a volte chiamate isocore. Sono mostrate le regioni sinteniche del cromosoma umano 14, del cromosoma del pollo 5 e del cromosoma 1 di A. carolinensis. Le regioni umane e del pollo sono invertite e riordinate per allinearsi con la regione di A. carolinensis. Le linee blu rappresentano la percentuale di GC in finestre di 20 kb. La linea viola indica la media del genoma. Le linee verdi rappresentano esempi di ancore sinteniche tra i tre genomi.
Diapositiva PowerPoint
In Iguania10 sono state trovate sia la determinazione del sesso dipendente dalla temperatura che la determinazione del sesso genetico XY. All’interno del genere Anolis, ci sono specie con cromosomi XY eteromorfi (compresi quelli con più cromosomi X e Y), e altri con cromosomi interamente omomorfi12. A. carolinensis è nota per avere una determinazione genetica del sesso21, ma la forma dei suoi cromosomi sessuali (ZW o XY) è stata finora sconosciuta a causa della mancanza di cromosomi ovviamente eteromorfi.
L’esame approfondito di cellule maschili e femminili utilizzando FISH ci ha permesso di identificare il microcromosoma precedentemente designato come ‘b’ come il cromosoma X di A. carolinensis; è presente in due copie nelle femmine e una nei maschi. Questo cromosoma è sintenico al microcromosoma 15 del pollo. Undici BAC assegnati a due scaffold, 154 (3,3 Mb) e chrUn0090 (1,8 Mb), si ibridano tramite FISH ai bracci p dei due cromosomi X nelle femmine, e si ibridano al braccio p del singolo cromosoma X nei maschi (Fig. 4 e Fig. 1 supplementare). A. carolinensis mostra quindi un modello rappresentativo di un sistema eterogametico maschile di determinazione genotipica del sesso. Non abbiamo identificato il cromosoma Y, ma ipotizziamo che A. carolinensis possieda entrambi i cromosomi X e Y, poiché sia le cellule maschili che quelle femminili contengono lo stesso numero di cromosomi.
Figura 4: Il genoma di A. carolinensis contiene un cromosoma X appena scoperto.
a, b, Il cromosoma X, un microcromosoma, si trova in una copia nel maschio A. carolinensis (a) e in due copie nelle femmine (b). Il BAC 206M13 (libreria BAC CHORI-318) viene ibridato al braccio p del cromosoma X usando il FISH sia nei maschi che nelle femmine in metafase. 206M13 e altri dieci BAC hanno mostrato questo modello sesso-specifico in cellule derivate da cinque individui maschi e cinque femmine. Ingrandimento originale, ×1,000.
Diapositiva PowerPoint
I 5,1 Mb di sequenza assegnati al cromosoma X contengono 62 geni codificanti proteine (Tabella 10 supplementare); i termini di Gene Ontology (GO) associati a questi geni non mostrano arricchimenti significativi. È molto probabile che ci sia più sequenza del cromosoma X che è attualmente etichettato come scaffold non ancorato nel montaggio AnoCar 2.0. L’identificazione del gene della determinazione del sesso di A. carolinensis richiederà una considerevole biologia funzionale, ma notiamo che il gene della determinazione del sesso del pollo DMRT1 si trova sul cromosoma 2 di A. carolinensis e che SOX3 (il paralogo del cromosoma X del gene della determinazione del sesso dei mammiferi teriani SRY) si trova su uno scaffold non ancorato di A. carolinensis; questi geni sono quindi improbabili per essere il gene della determinazione del sesso di A. carolinensis.
Tutti e dieci A. carolinensis (originari della Carolina del Sud e del Tennessee) utilizzati per la mappatura FISH hanno mostrato grandi inversioni pericentromeriche in uno o più dei cromosomi 1-4, senza alcuna correlazione tra le diverse inversioni cromosomiche o con il sesso della lucertola (vedi Nota supplementare, Tabella 11 supplementare e Fig. 6).
Un totale di 17.472 geni codificanti proteine e 2.924 geni RNA sono stati previsti dall’assemblaggio del genoma di A. carolinensis (Ensembl release 56, settembre 2009). Abbiamo costruito una filogenesi per tutti gli A. carolinensis e i loro omologhi in altre otto specie di vertebrati (uomo, topo, cane, opossum, ornitorinco, pollo, fringuello zebrato e pesce palla), permettendoci di identificare un insieme conservativo di 3.994 ortologhi one-to-one, cioè i geni che non sono stati duplicati o cancellati in nessuno di questi vertebrati dal loro ultimo antenato comune. Queste filogenie di geni sono state utilizzate anche per identificare i geni che sono sorti per duplicazione nella stirpe delle lucertole dopo la scissione con la stirpe aviaria e, separatamente, quelli che sono stati persi nella stirpe dei mammiferi dopo la scissione mammifero-reptile (Fig. 1, Nota supplementare, Fig. 7 e Tabella supplementare 12).
Abbiamo trovato 11 geni dell’opsina di A. carolinensis che non hanno ortologhi mammiferi (ma hanno ortologhi in invertebrati, pesci e rane), e quindi sembrano essere stati persi durante l’evoluzione dei mammiferi (Tabella supplementare 13). L’ampio repertorio di opsine può contribuire all’eccellente visione a colori di anoli – compresa la capacità di vedere nella gamma ultravioletta – e può anche contribuire alla loro iperdiversità, consentendo l’evoluzione di diverse, specie-specifiche colorazione della giogaia, che ha un ruolo importante nella selezione sessuale e riconoscimento delle specie11. Allo stesso modo, i geni del recettore olfattivo e della β-cheratina sono altamente duplicati in A. carolinensis (Nota supplementare e Fig. 9 supplementare).
Molti rettili, compresi gli anoli verdi, differiscono dai mammiferi placentari per essere ovipari (deporre le uova). Vivipari nei mammiferi placentari è uno stato derivato, che si riflette nella loro perdita di alcuni geni legati alle uova. Abbiamo usato la spettrometria di massa per identificare le proteine presenti nell’uovo immaturo A. carolinensis, poiché la maggior parte delle proteine dell’uovo sono prodotte nel corpo della madre e poi trasportate nell’uovo immaturo. Abbiamo scoperto che, in contrasto con i mammiferi, i rettili hanno duplicazioni di geni specifici del lignaggio, tra cui vitellogenine (VTGs), apovitellenina-1, ovomucina-α e tre omologhi di ovocalyxin-36, una proteina della matrice del guscio d’uovo di pollo.
I nostri risultati mostrano una rapida evoluzione dei geni delle proteine delle uova tra gli amnioti. In particolare, abbiamo trovato proteine di 276 geni di A. carolinensis in uova immature di A. carolinensis (tabelle supplementari 14 e 15), di cui solo 50 sono stati confermati come presenti nelle uova di pollo tramite spettrometria di massa22,23. Questi geni includono VTGs, un lisozima, paraloghi della proteina 1 dello strato esterno della membrana vitellina (VMO1), inibitori delle proteasi, natterina e nothepsin. Allineando i geni che sono ortologhi uno-a-uno in A. carolinensis e pollo, abbiamo trovato che le proteine dell’uovo evolvono significativamente più rapidamente di proteine non-uovo (valori medi dN/dS (rapporto tra il tasso di sostituzioni non-sinonime e il tasso di sostituzioni sinonime) di 0.186 e 0.135, rispettivamente; P = 1.2 × 10-5), che riflette una ridotta selezione purificante e/o episodi più frequenti di evoluzione adattativa.
Utilizzando sequenze multiple del genoma dei vertebrati, abbiamo identificato tre paraloghi di VMO1 (che chiamiamo α, β e γ) che deduciamo essere stati presenti nell’ultimo antenato comune di tutti i rettili e mammiferi. Mentre almeno uno di VMO1-α, VMO1-β e VMO1-γ è stato perso in tutti gli altri genomi amnioti, il genoma di A. carolinensis contiene rappresentanti di tutti e tre i paraloghi. Inoltre, la famiglia VMO1-α specifica di A. carolinensis è cresciuta fino a 13 membri e ha subito una selezione positiva di sostituzioni di aminoacidi all’interno di una cavità negativamente carica, probabilmente legata al substrato; cambiamenti che, presumibilmente, modificano la sua attività transferasica simile a quella di un lisozima (Nota supplementare, Fig. 8 supplementare e Tabelle 16 e 17 supplementari).
Il repertorio di ripetizioni esteso e attivo di A. carolinensis ci ha permesso di scoprire l’origine di diversi elementi conservati dei mammiferi. Attraverso il processo di exaptation (un cambiamento importante nella funzione di una sequenza durante l’evoluzione), certi elementi mobili che erano attivi nell’antenato amniota sono diventati conservati, e presumibilmente funzionali, nei mammiferi, mentre rimangono elementi mobili attivi in A. carolinensis. L’origine di queste sequenze conservate nei mammiferi negli elementi mobili non era riconoscibile senza confronto con una sequenza genomica distante e ricca di ripetizioni24. Abbiamo identificato 96 tali elementi exapted (vedi tabella supplementare 18) nel genoma umano che risalgono a elementi mobili presenti nell’antenato amniote che sono ancora presenti in A. carolinensis, in particolare le famiglie CR1, L2 e gypsy.
Anche se la maggior parte degli elementi esaptati sono non codificanti e probabilmente hanno una funzione regolatoria, abbiamo anche identificato un esone codificante una proteina che è stato esaptato da una linea L2-like, che ora costituisce l’esone 2 in una regione N-terminale specifica per i mammiferi della proteina MIER1 (mesoderm induction early response 1). Questo esone è altamente conservato attraverso 29 mammiferi e quindi probabilmente rappresenta un’innovazione mammifera dal momento che l’antenato amniota.
I terminiGO associati con il sito di inizio della trascrizione più vicino a ciascun elemento esapted nel genoma umano mostrano arricchimento per i geni del neurosviluppo (vedi Metodi), con “legame recettore ephrin”, “sviluppo del sistema nervoso” e “trasmissione sinaptica” essere fortemente arricchito (tutti i valori P < 5 × 10-3). Questi arricchimenti sono coerenti con i cambiamenti adattativi nel neurosviluppo che si verificano durante l’emergere dei mammiferi.
Le lucertole Anolis sono un caso da manuale di radiazione adattativa, avendo diversificato indipendentemente su ogni isola delle Grandi Antille e in tutto il Neotropico, producendo una grande varietà di specie ecologicamente e morfologicamente differenziate, con ben 15 trovate in una singola località11. Sebbene gli anoli siano ampiamente utilizzati come sistema modello per studi comparativi filogenetici, è stato difficile determinare le relazioni evolutive tra i principali cladi di anoli a causa delle rapide radiazioni evolutive associate all’accesso a nuove dimensioni di opportunità ecologiche. Risolvere con successo gli eventi di ramificazione relativamente brevi associati a tale radiazione richiede una ricchezza di dati da loci che si evolvono ad un tasso appropriato.
Abbiamo usato la sequenza del genoma di A. carolinensis per sviluppare un nuovo set di dati filogenomici composto da 20 kb di dati di sequenza campionati attraverso i genomi di 93 specie di anoli (Tabelle supplementari 19 e 20). L’analisi di questo set di dati ha portato ad una filogenesi ben supportata che rafforza e chiarisce la storia adattativa e biogeografica degli anoli (Fig. 5, dettagli in Fig. 10 supplementare). In primo luogo, la nostra analisi filogenomica riafferma i precedenti studi molecolari e morfologici che indicano che gli specialisti di habitat di anole simili si sono evoluti indipendentemente su ciascuna delle quattro grandi isole delle Grandi Antille. In secondo luogo, le nostre analisi suggeriscono uno scenario biogeografico complesso che coinvolge un numero limitato di eventi di dispersione tra le isole e un’ampia diversificazione in situ all’interno delle isole. I parenti più prossimi di Anolis si trovano sulla terraferma e la filogenesi conferma l’esistenza di due colonizzazioni, una nelle Piccole Antille meridionali e la seconda che ha prodotto le diverse radiazioni adattative nel resto dei Caraibi. All’interno di quest’ultimo clade, gli anoli si sono inizialmente diversificati principalmente sulle due maggiori isole delle Grandi Antille (sebbene anche Puerto Rico sembra essere stato coinvolto) prima di subire successivamente delle radiazioni secondarie su tutte le isole e infine ritornare sulla terraferma, dove questa ricolonizzazione ha prodotto un’ampia radiazione evolutiva. La filogenesi indica anche che nell’evoluzione delle Grandi Antille si sono verificati pochissimi eventi di dispersione tra le isole. Piuttosto, le faune delle Grandi Antille, famose per la misura in cui gli stessi ecomorfi si trovano su ogni isola, sono principalmente il risultato di un’evoluzione convergente25.
Figura 5: Una filogenesi di 93 specie di Anolis chiarisce la storia biogeografica delle anole.
Gli ecomorfi di Anolis derivano da un’evoluzione convergente e non da frequenti migrazioni tra isole. Usando coppie di primer conservati distribuiti attraverso il genoma di A. carolinensis, otteniamo sequenze da 46 loci genomicamente diversi che si evolvono ad una gamma di tassi evolutivi e che rappresentano sia regioni codificanti che non codificanti. Le analisi di massima verosimiglianza di questo nuovo set di dati di 20 kb di nucleotidi allineati deducono quasi tutte le relazioni precedentemente stabilite dell’anolo mentre risolvono anche parzialmente le relazioni basali che hanno afflitto gli studi precedenti. I cerchi aperti indicano valori di bootstrap (bs) <70; cerchi grigi, 70< bs <95; cerchi pieni, bs >95.
Diapositiva PowerPoint
La sequenza del genoma di A. carolinensis permette una comprensione più profonda dell’evoluzione degli amnioti. Riempire questo importante nodo rettiliano con un genoma sequenziato ha rivelato stati derivati in ogni ramo amniotico principale e ha contribuito a illuminare l’antenato amniotico. Tuttavia, l’albero dei genomi di rettili sequenziati è ancora estremamente scarso, e il sequenziamento di ulteriori rettili non aviari sarebbe necessario per comprendere appieno quanto siano tipici A. carolinensis e i genomi di uccelli sequenziati dell’intero clade dei rettili.
In aggiunta all’utilità della sequenza del genoma di A. carolinensis come rappresentante dei rettili non aviari, le specie Anolis sono una risorsa unica per lo studio della radiazione adattativa e dell’evoluzione convergente. Con le loro invasioni e le successive radiazioni sulle isole caraibiche, gli anoli forniscono un analogo terrestre allo spinarello e ai pesci ciclidi, che hanno subito un’evoluzione adattativa in ambienti acquatici separati. Proprio come la ricerca genomica negli spinarelli ha approfondito lo studio della speciazione ecologica acquatica, un’indagine filogenetica genomica su larga scala degli anoli caraibici sarebbe un’opportunità per lo studio dettagliato dell’evoluzione adattativa in un animale terrestre26 ; in particolare perché i genomi degli anoli contengono un gran numero di elementi mobili attivi che ipotizziamo possano formare substrati per l’esaptazione di nuovi elementi regolatori.