Colectarea probelor și secvențierea genomului integral
Un total de 105 cămile Bactriane domestice din Asia, 19 cămile bactriene sălbatice din regiunea Gobi-Altai din MG, precum și 4 dromaderi din IRAN au fost colectate pentru acest studiu (Fig. supl. 1 și tabelul suplimentar 1). Cămilele Bactriane domestice au fost alese pentru a acoperi cât mai multe regiuni geografice majore posibil, inclusiv 55 din Inner MG (IMG), Xinjiang (XJ) și Qinghai din China, 28 din MG, 6 din KAZA, 10 din Rusia (RUS) și 6 din IRAN. Deoarece s-a format o varietate de rase locale ca urmare a utilizării pe scară largă a cămilelor Bactriane domestice în China și MG, au fost alese opt rase reprezentative diferite din aceste regiuni. Celelalte cămile Bactriane domestice din Asia Centrală trăiau în jurul Mării Caspice.
După extragerea ADN-ului, genomurile individuale au fost secvențiate cu o acoperire medie de 13× (Fig. suplimentară 2 și Tabelul suplimentar 2). Lecturile de secvență au fost aliniate la ansamblul nostru anterior al genomului cămilei bactriene29 pentru apelarea variantelor. După o filtrare riguroasă (Fig. suplimentară 3), am identificat în total 13,83 milioane de polimorfisme cu un singur nucleotid (SNP) și 1,41 milioane de indeli mici. În special, raportul dintre tranziție și transversiune al SNP-urilor brute (2,29) a fost mai mic decât cel raportat la dromader (2,31-2,34)31 , dar a crescut la 2,44 după procedurile de filtrare, sugerând o îmbunătățire a calității SNP-urilor identificate. Adnotarea funcțională a variantelor a indicat că aproximativ 63,10% dintre acestea erau intergenice, 33,62% erau intronice și 0,94% erau exonice (tabelul suplimentar 3). Au fost identificate 13,73 milioane, 6,39 milioane și 10,55 milioane de variante la cămilele bactriene domestice, la cămilele bactriene sălbatice și, respectiv, la dromaderi. Deși dromadele au fost mai divergente față de ambele specii de cămile bactriene din punct de vedere filogenetic, cămilele bactriene domestice au avut în comun mai multe variante cu dromadele (66,73%) decât cu cămila bactriană sălbatică (39,31%) (Fig. suplimentară 4), datorită reducerii enorme a variantelor genetice observate la cămila bactriană sălbatică existentă și a fluxului de gene între dromaderi și cămilele bactriene domestice. În rândul cămilelor bactriene domestice, au fost identificate 12,68 milioane și 11,61 milioane de variante în populațiile din Asia de Est și, respectiv, din Asia Centrală (Fig. Suplimentară 4). Deși cămilele domestice eșantionate din Asia de Est au fost mai multe decât cele din Asia Centrală, numărul de variante private pentru fiecare populație nu a arătat nicio distorsiune semnificativă între cele două zone (valoare P = 0,77, test t cu două cozi; tabelul suplimentar 4).
Diversitate și diferențiere genetică
Pentru o comparație mai detaliată a diversității genetice între diferitele populații, am eliminat mai întâi 14 indivizi care prezentau o relație genetică strânsă cu ceilalți (tabelul suplimentar 5). Diversitatea nucleotidelor pe perechi π (Fig. 1a) a dromaderilor (1,54 × 10-3) a fost semnificativ mai mare decât cea a cămilelor bactriene din toate regiunile geografice (0,88 × 10-3-1,11 × 10-3; Tabelul suplimentar 6), ceea ce a fost în contrast cu estimările anterioare privind heterozigozitatea bazate pe genomurile individuale10. Un motiv important ar putea fi practica de hibridare între dromaderi și cămilele bactriene din Asia Centrală30. Dintre cămilele bactriene, populația sălbatică a prezentat cel mai mic π (0,88 × 10-3) în comparație cu toate populațiile domestice (Fig. 1a și Tabelul suplimentar 6). Deși acest rezultat a încălcat multe cazuri în care animalele sălbatice au, de obicei, o diversitate genetică mai mare decât omologii lor domestici, cum ar fi câinii24, porcii27 și iepurii32, acest lucru s-ar întâmpla în cazul animalelor sălbatice pe cale de dispariție cu o populație extrem de mică, cum ar fi caii33. În plus, populațiile domestice care trăiesc în Asia Centrală au prezentat, în general, o diversitate mai mare (1,03 × 10-3-1,11 × 10-3) decât cele care trăiesc în Asia de Est (0,95 × 10-3-1,02 × 10-3; Fig. 1a). Tendința a fost, de asemenea, confirmată și de θ de Watterson (Fig. Suplimentară 5). Din nou, hibridizarea cu dromadele din Asia Centrală ar putea explica diversitatea mai mare din această regiune.
Apoi am măsurat distanța genetică pe perechi între populațiile de cămile prin Fst-ul lui Weir (Fig. 1b). Rezultatul a fost în bună concordanță cu filogenia cunoscută, care a indicat că dromadele au avut cea mai mare Fst cu cămilele bactriene (0,54-0,64), iar cămilele bactriene sălbatice au avut a doua cea mai mare Fst cu cele domestice (0,27-0,31). Diferențierea dintre cămilele bactriene domestice a fost mult mai mică, în concordanță cu originea lor unică recentă. Este interesant faptul că, dintre cămilele Bactriane domestice, cele din IRAN au prezentat cea mai mare divergență cu toate celelalte (0,05-0,06). Pentru a valida diferențierea populației, am construit un arbore de îmbinare a vecinilor (NJ) pentru toți indivizii pe baza matricei de identitate pe perechi (IBS) (Fig. suplimentară 6). Arborele NJ a susținut, de asemenea, o cladă monofilitică a tuturor cămilelor bactriene domestice, în cadrul căreia IRAN a format cea mai profundă ramură.
O potențială problemă cu estimările genomice ale populației a fost prejudecata de referință, în care utilizarea unui singur genom de referință ar duce la o eficiență scăzută în apelarea variantelor pentru indivizii care diferă foarte mult de acesta34. Pentru a investiga această părtinire, am comparat numărul lipsă de variante între cele trei specii, luând adâncimea de secvențiere ca o covariantă (tabelul suplimentar 7). Analiza de varianță (ANOVA) a arătat că, deși cămilele bactriene domestice nu au avut nicio diferență semnificativă față de cele sălbatice (valoare P = 0,50), acestea au avut într-adevăr un număr mai mic de variante lipsă decât dromadele (valoare P = 4,38 × 10-3). Pentru a evalua impactul prejudecății asupra estimărilor noastre, am recalculat diversitatea genetică și Fst doar cu SNP sinonime (Fig. suplimentară 7), deoarece secvențele codificatoare erau mai susceptibile de a fi invariabile între specii. Ca urmare, estimările bazate pe SNP sinonime au fost în bună concordanță cu întregul genom pentru toate speciile, sugerând că prejudecata de referință a avut doar efecte minore asupra estimărilor noastre genomice ale populației.
Structura populației cu amestec
Pentru a dezvălui structura generală a populației cu potențial amestec, am curățat SNP-urile prin eliminarea celor cu dezechilibru de legătură ridicat și potențiale efecte funcționale. Analiza de scalare multidimensională (MDS) bazată pe subansamblul pruned a reprodus un rezultat similar cu cel al setului complet (Fig. 2a și Fig. suplimentară 8). Așa cum era de așteptat, dromadele și cămilele bactriene sălbatice au putut fi separate prin prima și, respectiv, a doua coordonată. Atunci când cea de-a treia coordonată a fost încorporată în MDS, IRAN a fost separată de toate celelalte cămile Bactriane domestice (Fig. 2a).
Pentru a estima diferite proporții ancestrale, am efectuat analiza structurii populației cu Admixture35 presupunând K populații ancestrale (Fig. 2b). Procedura de validare încrucișată a susținut că K = 3 a fost optimă (Fig. Suplimentară 9), arătând o divizare clară între dromaderi, cămilele bactriene sălbatice și cămilele bactriene domestice. S-a observat o introgresie evidentă a cămilelor bactriene domestice în dromaderul iranian, cel puțin la un dromader. În consecință, ascendența dromaderiei a fost predominantă în populațiile de cămile bactriene din Asia Centrală, inclusiv în IRAN, KAZA și RUS, cu o proporție estimată la 1-10%. Mai mult, am observat strămoși ai cămilelor bactriene domestice la mai mulți indivizi sălbatici, cu o proporție de 7-15%. Acest lucru ar putea proveni din polimorfisme ancestrale, dar ar putea fi cauzat, de asemenea, de hibridarea introgresivă, care a fost observată în cazul ADNmt36 și al cromozomilor Y15 și care a fost propusă pentru a amenința distinctivitatea genetică a speciei sălbatice. În mod surprinzător, cămilele sălbatice nu au contribuit aproape deloc la ascendența populațiilor domestice, nici măcar la populațiile mongole, care au habitate apropiate cu cămilele sălbatice. Deși majoritatea cămilelor bactriene domestice nu s-au diferențiat atunci când K a crescut, IRAN a fost prima populație care s-a separat cu o ascendență unică (K = 5; Fig. 2b).
Ca o altă metodă de examinare a structurii populației cu amestec, am dedus arborele populațional pentru cămile folosind TreeMix37 (Fig. 2c). Atunci când nu a fost adăugată nicio urmă de migrație, topologia arborelui a indicat din nou că IRAN a fost prima populație separată dintre toate cămilele bactriene domestice (Fig. Suplimentară 10). Creșterea pistelor de migrație (m = 1-3) ar putea îmbunătăți foarte mult ajustarea modelului (Fig. suplimentară 11), care a identificat fluxuri genetice de la dromaderi la cămilele Bactriane domestice în Asia Centrală, inclusiv KAZA, RUS și IRAN, cu ponderi de migrație cuprinse între 4 % și 9 % (tabelul suplimentar 8). Merită menționat faptul că, deși pista de migrație a indicat capătul ramurii dromaderului către IRAN, aceasta a indicat mijlocul ramurii dromaderului către KAZA și RUS (Fig. 2c). Acest lucru ar putea implica o populație fantomă înrudită cu dromaderul iranian care a contribuit la strămoșii din KAZA și RUS. Pista de migrație suplimentară (m = 4) ar putea continua să îmbunătățească ajustarea modelului, care a indicat migrarea dromaderului către o rasă XJ (Fig. 2c). Deși TreeMix nu a detectat niciun semnal puternic de migrație între cămila bactriană sălbatică și cea domestică, reziduurile au arătat un amestec moderat între rasa sălbatică și cea din Asia de Est (Fig. suplimentară 11). Am utilizat apoi testul mai puțin parametrizat cu trei și patru populații (F3/F4)38 pentru a evalua semnificația statistică a acestor evenimente de amestec. Din nou, testul F3 a susținut puternic amestecul dintre dromader și cămila bactriană în KAZA, RUS și IRAN (tabelul suplimentar 9). Testul F4, mai sensibil, a confirmat o amploare semnificativ mai mare a amestecului dintre dromaderi și cămilele bactriene din Asia Centrală în comparație cu cele din Asia de Est (tabelul suplimentar 10). Dintre acestea din urmă, o măsură mai mare a amestecului cu dromadele a fost detectată la XJ decât la MG/IMG.
Dovada originii din Asia Centrală prin eliminarea introgresiunii
Asia de Est și Asia Centrală au fost cele două regiuni alternative de domesticire a cămilelor Bactriane pe baza dovezilor arheologice1,12,17, dar cea mai probabilă a rămas nerezolvată. Deși am observat cea mai mare diferențiere genetică între populația iraniană și toate celelalte populații domestice, existența amestecului între dromader și cămila bactriană în Asia Centrală ar slăbi sprijinul pentru inferența originii. Pentru a reduce acest efect, am încercat să eliminăm segmentele introgresate ale dromaderilor din genomul cămilelor bactriene prin utilizarea testului „BABA/ABBA „39. Am grupat populațiile din Asia Centrală și de Est și am comparat partajarea alelelor dintre cele două grupuri cu dromaderienii (Fig. 3a). Deoarece ascendența cămilelor bactriane la un dromader, precum și ascendența cămilelor domestice la trei cămile sălbatice (Fig. 2b), ar fi fost factori de confuzie, am eliminat cei patru indivizi din analiză. Am utilizat statistica fd, o versiune robustă a lui Patterson’s D, pentru a localiza segmentele introgresate40 și am aplicat un nivel de semnificație strict de Z-score = 2 prin utilizarea procedurii Jackknife (Fig. suplimentară 12). Într-un total de 21 153 de segmente de 100 kb care nu se suprapun pe tot genomul, au existat mult mai multe segmente cu semnale putative de introgresie în populațiile din Asia Centrală (11 711, Z-score > 2) decât în populațiile din Asia de Est (3891, Z-score < -2), așa cum era de așteptat. Am efectuat apoi analiza Admixture pe baza segmentelor rămase și am confirmat că introgresia dromaderiei a fost efectiv redusă (Fig. Suplimentară 13). Recalcularea Fst pe perechi după eliminarea introgresiei a indicat în continuare că IRAN a fost cea mai diferențiată (0,04-0,06) dintre toate populațiile domestice (Fig. 3b). Pentru a obține mai multe informații despre filogenia populației, am reconstruit arborele NJ pe baza Fst pe perechi și am efectuat testul bootstrap (Fig. 3b). Acesta a confirmat că IRAN a fost prima care s-a separat dintre toate populațiile bactriane domestice, urmată de KAZA și RUS. Analiza Bayesiană binară Markov Chain Monte Carlo (MCMC) bazată pe filogenie a susținut puternic Asia Centrală ca fiind zona ancestrală a cămilelor Bactriane domestice (probabilitate = 99,78%) și o rută de dispersie ulterioară din Asia Centrală în Asia de Est (Fig. Suplimentară 14).
Ca o dovadă independentă, am reconstruit, de asemenea, arborele de maximă verosimilitate al ADNmt de lungime completă pe baza celor 128 de eșantioane pe care le-am secvențiat în acest studiu, precum și a 39 de eșantioane suplimentare disponibile din Genbank (Fig. 3c și Tabelul suplimentar 11). Introgresia ADNmt a putut fi ușor identificată și exclusă din arbore. De exemplu, două ADNmt recent secvențiate din KAZA și RUS au fost grupate cu dromadele. În cadrul cladei cămilelor bactriane domestice, deși majoritatea cămilelor din diferite regiuni geografice au fost amestecate, două ADNmt din IRAN au format cele mai bazale ramuri ale populațiilor domestice (Fig. 3c). Analiza MCMC binară bayesiană binară a susținut din nou originea din Asia Centrală a cămilelor Bactriane domestice (probabilitate = 76,43%).
Istoria demografică a cămilelor Bactriane
Am efectuat mai multe analize de modelare parametrică pentru a deduce dinamica demografică a cămilelor în istorie. În concordanță cu studiul anterior10, traiectoriile pe termen lung ale cămilelor bactriene bazate pe modelul coalescent secvențial markovian pe perechi (PSMC)41 au dezvăluit o scădere enormă a dimensiunii efective a populației de cămile ancestrale mai devreme de un milion de ani în urmă (Fig. Suplimentară 15). Deși traiectoriile pe termen lung ale cămilelor bactriene sălbatice și domestice au fost, în general, similare, este evident că acestea au deviat una față de cealaltă încă de acum 0,4 milioane de ani, excluzându-le pe primele ca progenitoare directe ale celor din urmă, așa cum au arătat analizele anterioare ale ADNmt9,14.
Pentru a explora mai în detaliu timpul de divergență dintre populațiile de cămile, am folosit eșantionatorul filogenetic coalescent generalizat (G-PhoCS)42. Având în vedere filogenia populațiilor de cămile, G-PhoCS ar putea estima dimensiunea populației la scară de mutație și timpul de divergență al populației pe baza lociilor neutri nelegate din genomurile individuale din fiecare populație. Pentru a reduce complexitatea modelului, am inclus doar dromadele, cămilele bactriene sălbatice și trei populații reprezentative (IRAN, KAZA și MG) de cămile bactriene domestice (figura suplimentară 16 și tabelul suplimentar 12). Conform Fig. 3b, IRAN și KAZA au fost primele două populații din Asia Centrală care s-au separat, iar separarea MG ar putea indica dispersia din Asia Centrală în Asia de Est. Vârsta a fost calibrată presupunând cămila bactriană și divergența dromaderului de 5,73 milioane de ani, conform bazei de date Timetree43. Atunci când nu a fost încorporată nicio bandă de migrație, a putut fi obținută cu ușurință convergența tuturor estimărilor parametrilor (Fig. suplimentară 17 și Tabelul suplimentar 13). Similar cu rezultatele PSMC, dimensiunea efectivă a populației a fost, în general, redusă de la populațiile ancestrale la cele moderne (Fig. 4). Timpul de divergență dintre cămila bactriană sălbatică și cea domestică a fost estimat la 0,43 milioane de ani în urmă (interval de încredere de 95% : 0,13-0,73 Mya; Fig. 4), care a fost ușor mai târziu decât cel bazat pe ADNmt (0,714 sau 1,1 Mya9). Dintre populațiile domestice, IRAN a fost separată de celelalte cu aproximativ 4,45 mii de ani în urmă (95% IC: 0,07-17,6 Kya), iar apoi populațiile din Asia Centrală și de Est au fost separate cu aproximativ 2,40 mii de ani în urmă (95% IC: 0,01-7,84 Kya; Fig. 4).
Pentru a permite fluxul de gene, am încercat, de asemenea, să introducem benzi de migrație de la dromader la populațiile de cămile Bactrian (Fig. suplimentară 16 și Tabelul suplimentar 12). Estimările au putut converge doar atunci când au fost introduse o bandă de migrație de la dromaderi iranieni către IRAN și o bandă de migrație de la o populație fantomă către KAZA (Fig. suplimentară 18 și tabelul suplimentar 13). Deși timpul de divergență dintre cămilele bactriene sălbatice și domestice nu a fost modificat cu modelul de migrație (0,46 Mya, IC 95%: 0,24-0,71 Mya), primul timp de divergență al populațiilor domestice (0,19 Mya, IC 95%: 0,08-0,31 Mya) a devenit nerealist, deoarece era cu mult peste istoria cunoscută a domesticirii animalelor (11,5 Kya44). În plus, rata totală de migrație a fost estimată doar la 0,27% și 0,16% pentru banda de migrație către IRAN și, respectiv, KAZA, mult mai mică decât cea estimată cu Admixture (1-10%). Un motiv posibil pentru această estimare slabă ar fi o istorie a amestecului mai complexă decât modelul de migrație continuă cu rate constante presupus de G-PhoCS.
.