Recolha de amostras e sequenciamento de camelos Bactrianos domésticos
Um total de 105 camelos Bactrianos domésticos por toda a Ásia, 19 camelos bactrianos selvagens da região de Gobi-Altai em MG, assim como 4 dromedários da IRAN foram reunidos para este estudo (Fig. Complementar. 1 e Tabela Suplementar 1). Os camelos bactrianos domésticos foram escolhidos para cobrir o maior número possível de grandes regiões geográficas, incluindo 55 da MG Interior (IMG), Xinjiang (XJ) e Qinghai da China, 28 da MG, 6 da KAZA, 10 da Rússia (RUS) e 6 da IRAN. Como uma variedade de raças locais foi formada devido à ampla utilização de camelos bactrianos domésticos na China e em MG, oito diferentes raças representativas foram escolhidas das regiões. Os outros camelos bactrianos domésticos da Ásia Central estavam vivendo ao redor do Mar Cáspio.
Após a extração do DNA, os genomas individuais foram sequenciados a uma média de 13× de cobertura (Fig. 2 e Tabela Complementar 2). As leituras seqüenciais foram alinhadas à nossa montagem anterior do genoma do camelo bactriano29 para chamada de variantes. Após uma filtragem rigorosa (Figura 3 Suplementar), identificamos totalmente 13,83 milhões de polimorfismos de nucleotídeos simples (SNPs) e 1,41 milhões de pequenos indels. Notavelmente, a razão de transição para transversalidade dos SNPs brutos (2,29) foi menor que a relatada nos dromedários (2,31-2,34)31, mas foi aumentada para 2,44 após os procedimentos de filtragem, sugerindo uma melhora na qualidade dos SNPs identificados. A anotação funcional das variantes indicou que cerca de 63,10% delas eram intergênicas, 33,62% eram intrônicos e 0,94% eram exônicos (Tabela Suplementar 3). Foram identificados 13,73 milhões, 6,39 milhões e 10,55 milhões de variantes nos camelos bactrianos domésticos, nos camelos bactrianos selvagens e nos dromedários, respectivamente. Embora os dromedários fossem mais divergentes das duas espécies de camelos bactrianos em filogenia, os camelos bactrianos domésticos partilhavam mais variantes com os dromedários (66,73%) do que com o camelo bactriano selvagem (39,31%) (Figura suplementar 4) devido à tremenda redução das variantes genéticas observadas no camelo bactriano selvagem existente e ao fluxo de genes entre os dromedários e os camelos bactrianos domésticos. Entre os camelos bactrianos domésticos, foram identificados 12,68 milhões e 11,61 milhões de variantes nas populações da Ásia Oriental e da Ásia Central, respectivamente (Suplementar Fig. 4). Embora os camelos domésticos amostrados da Ásia Oriental fossem mais do que os da Ásia Central, a contagem da variante privada para cada população não mostrou nenhum viés significativo entre as duas áreas (P-valor = 0,77, teste t de duas caudas; Tabela Suplementar 4).
Diversidade genética e diferenciação
Para uma comparação mais detalhada da diversidade genética entre as diferentes populações, primeiramente removemos 14 indivíduos mostrando estreita relação genética com os demais (Tabela Suplementar 5). A diversidade de nucleotídeos em pares π (Fig. 1a) dos dromedários (1,54 × 10-3) foi significativamente maior que a dos camelos bactrianos de todas as regiões geográficas (0,88 × 10-3-1,11 × 10-3; Tabela Suplementar 6), o que contrastou com estimativas anteriores de heterozigocidade baseadas em genomas individuais10. Uma razão importante poderia ser a prática da hibridização entre os dromedários e os camelos bactrianos na Ásia Central30. Entre os camelos bactrianos, a população selvagem apresentou a menor π (0,88 × 10-3) em comparação com todas as populações domésticas (Fig. 1a e Tabela Suplementar 6). Embora este resultado tenha violado muitos casos de animais silvestres que geralmente têm maior diversidade genética do que seus congêneres domésticos como cães24, porcos27 e coelhos32, isso aconteceria no caso de animais silvestres ameaçados de extinção com uma população extremamente pequena como os cavalos33. Além disso, as populações domésticas que vivem na Ásia Central geralmente mostraram uma maior diversidade (1,03 × 10-3-1,11 × 10-3) do que as que vivem na Ásia Oriental (0,95 × 10-3-1,02 × 10-3; Fig. 1a). A tendência também foi confirmada pela Watterson’s θ (Suplemento Fig. 5). Novamente, a hibridização com dromedários na Ásia Central poderia ser responsável pela maior diversidade na região.
Medimos então a distância genética em pares entre as populações de camelos pelo Fst. de Weir (Fig. 1b). O resultado estava bem de acordo com a filogenia conhecida, que indicava que os dromedários tinham o Fst mais alto com os camelos bactrianos (0,54-0,64) e os camelos bactrianos selvagens tinham o segundo Fst mais alto com os domésticos (0,27-0,31). A diferenciação entre os camelos bactrianos domésticos foi muito menor, de acordo com a sua recente origem única. Curiosamente, entre os camelos bactrianos domésticos, os da IRAN apresentaram a maior divergência com todos os outros (0,05-0,06). Para validar a diferenciação populacional, construímos uma árvore de união de vizinhos (NJ) para todos os indivíduos com base na sua matriz de identidade por estado (IBS) (Figura Complementar 6). A árvore NJ também suportava um clade monofilético de todos os camelos bactrianos domésticos, dentro do qual a IRAN formava o ramo mais profundo.
Uma questão potencial com as estimativas genômicas da população foi o viés de referência, onde a utilização de um único genoma de referência levaria a uma baixa eficiência na chamada de variantes para indivíduos que diferiam muito dela34. Para investigar o viés, comparamos a contagem ausente de variantes entre as três espécies, tomando a profundidade do sequenciamento como covariada (Tabela Complementar 7). A análise de variância (ANOVA) mostrou que embora os camelos bactrianos domésticos não tivessem diferença significativa com os selvagens (valor P = 0,50), eles realmente tinham menor contagem em falta do que os dromedários (valor P = 4,38 × 10-3). Para avaliar o impacto do viés em nossas estimativas, recalculamos a diversidade genética e Fst com apenas SNPs sinônimos (Fig. 7 Suplementar), pois as seqüências de codificação eram mais prováveis de serem invariantes entre as espécies. Como resultado, as estimativas baseadas nos SNPs sinônimos estavam em boa concordância com todo o genoma para todas as espécies, sugerindo que o viés de referência teve apenas efeitos menores em nossas estimativas genômicas populacionais.
Estrutura populacional com mistura
Para revelar a estrutura populacional geral com mistura potencial, podamos os SNPs removendo aqueles com alto grau de desequilíbrio de ligação e potenciais efeitos funcionais. A análise de escala multidimensional (MDS) baseada no subconjunto podado reproduziu o resultado semelhante ao conjunto completo (Fig. 2a e Suplementar Fig. 8). Como esperado, os dromedários e os camelos bactrianos selvagens poderiam ser separados pela primeira e segunda coordenadas, respectivamente. Quando a terceira coordenada foi incorporada ao MDS, IRAN foi separada de todos os outros camelos bactrianos domésticos (Fig. 2a).
Para estimar diferentes proporções ancestrais, realizamos análise da estrutura da população com Admixture35 assumindo populações ancestrais K (Fig. 2b). O procedimento de validação cruzada suportou que K = 3 foi ótimo (Fig. 9 suplementar), mostrando uma clara divisão entre os dromedários, camelos bactrianos selvagens, e camelos bactrianos domésticos. A introgressão evidente dos camelos bactrianos domésticos nos dromedários iranianos foi observada, pelo menos em um dromedário. Assim, a ancestralidade dos dromedários foi predominante nas populações de camelos bactrianos da Ásia Central, incluindo IRAN, KAZA e RUS, com uma proporção estimada em 1-10%. Além disso, observamos a ancestralidade dos camelos bactrianos domésticos em vários indivíduos selvagens, com uma proporção de 7-15%. Isto pode surgir de polimorfismos ancestrais, mas também pode ser causado pela hibridação introgressiva, que foi observada com mtDNAs36 e cromossomas Y15, e foi proposta para ameaçar a distintividade genética das espécies selvagens. Surpreendentemente, os camelos selvagens não contribuíram quase nada para a ancestralidade das populações domésticas, mesmo para as populações mongóis, que partilham habitats próximos com os camelos selvagens. Embora a maioria dos camelos bactrianos domésticos não tivessem diferenciação quando K cresceu, IRAN foi a primeira população a separar-se com uma ancestralidade única (K = 5; Fig. 2b).
Como outro método para examinar a estrutura da população com mistura, inferimos a árvore populacional para os camelos usando TreeMix37 (Fig. 2c). Quando não foi adicionado nenhum rastro de migração, a topologia da árvore indicou novamente que IRAN foi a primeira população separada entre todos os camelos bactrianos domésticos (Suplemento Fig. 10). O aumento dos rastros de migração (m = 1-3) poderia melhorar muito o ajuste do modelo (Suplemento Fig. 11), que identificou fluxos gênicos de dromedários para camelos bactrianos domésticos na Ásia Central, incluindo KAZA, RUS e IRAN com pesos de migração variando de 4% a 9% (Suplemento Tabela 8). Vale mencionar que embora a trilha migratória apontasse no final do ramo dromedário para o IRAN, apontava no meio do ramo dromedário para KAZA e RUS (Fig. 2c). Isto poderia implicar uma população fantasma relacionada com o dromedário iraniano que contribuiu para a ascendência da KAZA e dos RUS. Uma faixa de migração adicional (m = 4) poderia continuar a melhorar a adequação do modelo, o que indicou a migração do dromedário para uma raça XJ (Fig. 2c). Embora a TreeMix não tenha detectado nenhum sinal forte de migração entre os camelos bactrianos selvagens e domésticos, os resíduos mostraram uma mistura moderada entre as raças selvagens e do leste asiático (Suplemento Fig. 11). Em seguida, utilizamos o teste menos parametrizado de três e quatro populações (F3/F4)38 para avaliar a significância estatística desses eventos de mistura. Novamente, o teste F3 apoiou fortemente a mistura de dromedários e camelos bactrianos em KAZA, RUS e IRAN (Tabela Suplementar 9). O teste F4 mais sensível confirmou uma extensão significativamente maior de mistura entre os dromedários e os camelos bactrianos na Ásia Central em comparação com os da Ásia Oriental (Tabela Suplementar 10). Entre estes últimos, uma maior extensão de mistura com dromedários foi detectada em XJ do que em MG/IMG.
Evidência para a origem da Ásia Central pela remoção da introgressão
Ásia Central e Oriental foram as duas regiões alternativas de domesticação para os camelos bactrianos com base em evidências arqueológicas1,12,17, mas a mais provável permaneceu sem solução. Embora tenhamos observado a maior diferenciação genética entre a população iraniana e todas as outras domésticas, a existência de mistura entre dromedários e camelos bactrianos na Ásia Central enfraqueceria o suporte para a inferência da origem. Para reduzir este efeito, tentamos remover os segmentos introgressos de dromedários dos genomas dos camelos bactrianos usando o teste “BABA/ABBA “39. Agrupamos as populações da Ásia Oriental e Central e comparamos a partilha de alelos entre os dois grupos com os dromedários (Fig. 3a). Como a ancestralidade dos camelos bactrianos em um dromedário, assim como a ancestralidade dos camelos domésticos em três selvagens (Fig. 2b), seriam fatores de confusão, removemos os quatro indivíduos na análise. Utilizamos o fd estatístico, uma versão robusta do D de Patterson, para localizar segmentos introgrados40 e aplicamos um nível de significância rigoroso de Z-score = 2, utilizando o procedimento de Jackknife (Fig. 12 Suplementar). Em um total de 21.153 segmentos não sobrepostos de 100 kb em todo o genoma, havia muito mais segmentos com sinais putativos de introgressão nas populações da Ásia Central (11.711, Z-score > 2) do que nas populações da Ásia Oriental (3891, Z-score < -2) como esperado. Realizamos então a análise Admixture com base nos segmentos restantes e confirmamos que a introgressão dos dromedários foi efetivamente reduzida (Suplemento Fig. 13). O recálculo do Fst pareado após a remoção da introgressão ainda indicou que o IRAN foi o mais diferenciado (0,04-0,06) entre todas as populações domésticas (Fig. 3b). Para obter mais informações sobre a filogenia da população, reconstruímos a árvore NJ com base na Fst pareada e realizamos o teste de bootstrap (Fig. 3b). Confirmou-se que a IRAN foi a primeira a separar-se entre todas as populações Bactrianas domésticas, seguida pela KAZA e RUS. A análise da cadeia binária Bayesiana de Markov Monte Carlo (MCMC) baseada na filogenia suportou fortemente a Ásia Central como a área ancestral dos camelos bactrianos domésticos (probabilidade = 99,78%) e uma rota de dispersão subsequente da Ásia Central para a Ásia Oriental (Suplemento Fig. 14).
p>Como uma evidência independente, também reconstruímos a árvore de máxima verosimilhança de mtDNAs de comprimento total com base nas 128 amostras sequenciadas neste estudo, bem como 39 amostras adicionais disponíveis no Genbank (Fig. 3c e Tabela Complementar 11). A introdução de mtDNAs poderia ser facilmente identificada e excluída da árvore. Por exemplo, duas mtDNAs recentemente sequenciadas do KAZA e RUS foram agrupadas com dromedários. Dentro do clade dos camelos bactrianos domésticos, embora a maioria dos camelos de diferentes regiões geográficas fossem mistos, dois mtDNAs do IRAN formaram os ramos mais basais das populações domésticas (Fig. 3c). A análise Bayesiana do MCMC binário suportou novamente a origem centro-asiática dos camelos bactrianos domésticos (probabilidade = 76,43%).
História demográfica dos camelos bactrianos
Fizemos várias análises de modelagem paramétrica para inferir a dinâmica demográfica dos camelos na história. Em consonância com estudos anteriores10 , as trajetórias de longo prazo dos camelos bactrianos baseadas no modelo sequencialmente Markoviano coalescente (PSMC)41 revelaram uma tremenda diminuição no tamanho efetivo da população dos camelos ancestrais antes de um milhão de anos atrás (Figura Suplementar 15). Embora as trajetórias de longo prazo dos camelos bactrianos selvagens e domésticos fossem geralmente similares, era óbvio que eles divergiam entre si já há 0,4 milhões de anos, excluindo os primeiros como progenitores diretos dos segundos como análises mtDNA anteriores9,14,
Para explorar o tempo de divergência entre as populações de camelos com mais detalhes, utilizamos o amostrador filogenético coalescente generalizado (G-PhoCS)42. Dada a filogenia das populações de camelos, o G-PhoCS poderia estimar o tamanho da população em escala de mutação e o tempo de divergência populacional com base nos loci neutros não ligados em genomas individuais de cada população. Para reduzir a complexidade do modelo, incluímos apenas dromedários, camelos bactrianos selvagens e três populações representativas (IRAN, KAZA, e MG) de camelos bactrianos domésticos (Fig. 16 e Tabela Suplementar 12). De acordo com a Fig. 3b, IRAN e KAZA foram as duas primeiras populações da Ásia Central a se separarem e a divisão de MG poderia indicar a dispersão da Ásia Central para o Leste Asiático. A idade foi calibrada assumindo a divergência entre o camelo bactriano e o dromedário de 5,73 milhões de anos de acordo com a base de dados Timetree43. Quando nenhuma faixa de migração foi incorporada, a convergência de todas as estimativas dos parâmetros pôde ser facilmente alcançada (Figura Complementar 17 e Tabela Complementar 13). Similarmente aos resultados do PSMC, o tamanho efetivo da população foi geralmente reduzido de populações ancestrais para populações modernas (Fig. 4). O tempo de divergência entre os camelos bactrianos selvagens e domésticos foi estimado em 0,43 milhões de anos atrás (intervalo de confiança de 95%: 0,13-0,73 Mya; Fig. 4), que foi ligeiramente posterior ao baseado em mtDNAs (0,714 ou 1,1 Mya9). Entre as populações nacionais, a IRAN foi separada de outras há cerca de 4,45 mil anos (IC 95%: 0,07-17,6 Kya) e depois as populações da Ásia Central e Oriental foram separadas há cerca de 2,40 mil anos (IC 95%: 0,01-7,84 Kya; Fig. 4).
Para permitir o fluxo gênico, também tentamos introduzir faixas de migração dos dromedários para as populações de camelos bactrianos (Fig. 16 e Tabela Suplementar 12). As estimativas só puderam convergir quando foram introduzidas uma faixa de migração dos dromedários iranianos para o IRAN e uma faixa de migração de uma população fantasma para a KAZA (Suplementar Fig. 18 e Tabela Suplementar 13). Embora o tempo de divergência entre os camelos bactrianos selvagens e domésticos não tenha sido alterado com o modelo de migração (0,46 Mya, 95% CI: 0,24-0,71 Mya), o primeiro tempo de divergência das populações domésticas (0,19 Mya, 95% CI: 0,08-0,31 Mya) tornou-se irrealista, pois estava muito além da história conhecida de domesticação de gado (11,5 Kya44). Além disso, a taxa de migração total foi estimada em apenas 0,27% e 0,16% para a faixa de migração para IRAN e KAZA, respectivamente, muito inferior à estimada com Admixture (1-10%). Uma possível razão para a má estimativa seria um histórico de admixture mais complexo do que o modelo de migração contínua com taxas constantes assumidas por G-PhoCS.