Le séquençage du génome entier de 128 chameaux à travers l’Asie révèle l’origine et la migration des chameaux de Bactriane domestiques

Collection d’échantillons et séquençage du génome entier

Un total de 105 chameaux de Bactriane domestiques à travers l’Asie, 19 chameaux de Bactriane sauvages de la région de Gobi-Altai au MG, ainsi que 4 dromadaires d’IRAN ont été rassemblés pour cette étude (Fig. supplémentaire 1 et Tableau supplémentaire 1). 1 et tableau supplémentaire 1). Les chameaux domestiques de Bactriane ont été choisis de manière à couvrir le plus grand nombre possible de grandes régions géographiques, dont 55 provenant de la région intérieure de MG (IMG), du Xinjiang (XJ) et du Qinghai en Chine, 28 de MG, 6 de KAZA, 10 de Russie (RUS) et 6 d’IRAN. Comme une variété de races locales s’est formée en raison de la large utilisation des chameaux domestiques de Bactriane en Chine et en MG, huit races représentatives différentes ont été choisies dans les régions. Les autres chameaux domestiques de Bactriane d’Asie centrale vivaient autour de la mer Caspienne.

Après extraction de l’ADN, les génomes individuels ont été séquencés avec une couverture moyenne de 13× (figure supplémentaire 2 et tableau supplémentaire 2). Les lectures de séquence ont été alignées sur notre précédent assemblage du génome du chameau de Bactriane29 pour l’appel de variante. Après un filtrage rigoureux (figure 3 supplémentaire), nous avons identifié 13,83 millions de polymorphismes mononucléotidiques (SNP) et 1,41 million de petits indels. Notamment, le ratio transition/transversion des SNP bruts (2,29) était inférieur à celui rapporté chez les dromadaires (2,31-2,34)31, mais il est passé à 2,44 après les procédures de filtrage, ce qui suggère une amélioration de la qualité des SNP identifiés. L’annotation fonctionnelle des variants a indiqué qu’environ 63,10 % d’entre eux étaient intergéniques, 33,62 % étaient introniques et 0,94 % étaient exoniques (tableau supplémentaire 3). On a identifié 13,73 millions, 6,39 millions et 10,55 millions de variants chez les chameaux de Bactriane domestiques, les chameaux de Bactriane sauvages et les dromadaires, respectivement. Bien que les dromadaires soient plus divergents des deux espèces de chameaux de Bactriane dans la phylogénie, les chameaux de Bactriane domestiques partagent plus de variantes avec les dromadaires (66,73 %) qu’avec les chameaux de Bactriane sauvages (39,31 %) (figure supplémentaire 4) en raison de la réduction considérable des variantes génétiques observée chez le chameau de Bactriane sauvage existant et du flux génétique entre les dromadaires et les chameaux de Bactriane domestiques. Parmi les chameaux domestiques de Bactriane, 12,68 millions et 11,61 millions de variants ont été identifiés dans les populations d’Asie de l’Est et d’Asie centrale, respectivement (figure supplémentaire 4). Bien que les chameaux domestiques échantillonnés en Asie de l’Est soient plus nombreux que ceux d’Asie centrale, le décompte des variants propres à chaque population n’a montré aucun biais significatif entre les deux régions (valeur P = 0,77, test t bilatéral ; tableau supplémentaire 4).

Diversité génétique et différenciation

Pour une comparaison plus détaillée de la diversité génétique entre les différentes populations, nous avons d’abord retiré 14 individus présentant une relation génétique étroite avec les autres (tableau supplémentaire 5). La diversité nucléotidique par paires π (figure 1a) des dromadaires (1,54 × 10-3) était significativement plus élevée que celle des chameaux de Bactriane de toutes les régions géographiques (0,88 × 10-3-1,11 × 10-3 ; tableau supplémentaire 6), ce qui contrastait avec les estimations précédentes de l’hétérozygotie basées sur les génomes individuels10. Une raison importante pourrait être la pratique de l’hybridation entre les dromadaires et les chameaux de Bactriane en Asie centrale30. Parmi les chameaux de Bactriane, la population sauvage a montré le plus faible π (0,88 × 10-3) par rapport à toutes les populations domestiques (Fig. 1a et tableau supplémentaire 6). Bien que ce résultat contrevienne à de nombreux cas où les animaux sauvages ont généralement une diversité génétique plus élevée que leurs homologues domestiques, comme les chiens24, les porcs27 et les lapins32, cela se produirait dans le cas d’animaux sauvages menacés d’extinction dont la taille de la population est extrêmement réduite, comme les chevaux33. En outre, les populations domestiques vivant en Asie centrale présentaient généralement une plus grande diversité (1,03 × 10-3-1,11 × 10-3) que celles vivant en Asie de l’Est (0,95 × 10-3-1,02 × 10-3 ; Fig. 1a). Cette tendance a également été confirmée par le θ de Watterson (Fig. 5 supplémentaire). Là encore, l’hybridation avec les dromadaires en Asie centrale pourrait expliquer la plus grande diversité dans la région.

Fig. 1 : Diversité génétique et différenciation des populations de chameaux.
figure1

a Diversité nucléotidique π. Le boxplot montre π pour 2,0 × 105 fenêtres coulissantes de 10 kb à travers le génome. L’origine géographique et la taille de l’échantillon de chaque population sont indiquées à gauche et la moyenne de π est indiquée à droite. Plusieurs races locales ont été échantillonnées pour MG, IMG et XJ. Les individus présentant des relations génétiques étroites ont été supprimés. Les éléments du boxplot sont définis comme suit : ligne centrale, médiane ; limites de la boîte, les troisième et premier quartiles ; moustaches, 1,5 × l’écart interquartile. b Différenciation des populations par paires Fst. La carte thermique représente la moyenne de Fst pour des fenêtres coulissantes de 2,0 × 105 10 kb. Le dendrogramme représente le regroupement hiérarchique des populations basé sur Fst.

Nous avons ensuite mesuré la distance génétique par paire entre les populations de chameaux par le Fst de Weir (Fig. 1b). Le résultat était bien en accord avec la phylogénie connue, qui indiquait que les dromadaires avaient le Fst le plus élevé avec les chameaux de Bactriane (0,54-0,64) et que les chameaux de Bactriane sauvages avaient le deuxième Fst le plus élevé avec les domestiques (0,27-0,31). La différenciation entre les chameaux domestiques de Bactriane était beaucoup plus faible, ce qui correspond à leur origine unique récente. Il est intéressant de noter que parmi les chameaux de Bactriane domestiques, ceux d’IRAN présentaient la plus grande divergence avec tous les autres (0,05-0,06). Pour valider la différenciation de la population, nous avons construit un arbre de voisinage (NJ) pour tous les individus sur la base de leur matrice d’identité par état (IBS) par paire (figure supplémentaire 6). L’arbre NJ a également soutenu un clade monophylétique de tous les chameaux de Bactriane domestiques, au sein duquel l’IRAN a formé la branche la plus profonde.

Un problème potentiel avec les estimations génomiques de la population était le biais de référence, où l’utilisation d’un seul génome de référence conduirait à une faible efficacité dans l’appel de variants pour les individus qui diffèrent fortement de celui-ci34. Pour étudier ce biais, nous avons comparé le nombre de variants manquants entre les trois espèces, en prenant la profondeur de séquençage comme covariable (tableau supplémentaire 7). L’analyse de la variance (ANOVA) a montré que, bien que les chameaux de Bactriane domestiques ne présentent pas de différence significative avec les chameaux sauvages (valeur P = 0,50), ils ont effectivement un nombre de manquants inférieur à celui des dromadaires (valeur P = 4,38 × 10-3). Pour évaluer l’impact du biais sur nos estimations, nous avons recalculé la diversité génétique et Fst avec seulement les SNP synonymes (Fig. 7 supplémentaire), car les séquences codantes sont plus susceptibles d’être invariantes entre les espèces. En conséquence, les estimations basées sur les SNP synonymes étaient en bon accord avec le génome entier pour toutes les espèces, ce qui suggère que le biais de référence n’a eu que des effets mineurs sur nos estimations génomiques de population.

Structure de la population avec mélange

Pour révéler la structure globale de la population avec mélange potentiel, nous avons élagué les SNP en supprimant ceux qui présentaient un déséquilibre de liaison élevé et des effets fonctionnels potentiels. L’analyse d’échelle multidimensionnelle (MDS) basée sur le sous-ensemble élagué a reproduit le même résultat que l’ensemble complet (Fig. 2a et Fig. 8 supplémentaire). Comme prévu, les dromadaires et les chameaux sauvages de Bactriane ont pu être séparés par les première et deuxième coordonnées, respectivement. Lorsque la troisième coordonnée a été incorporée dans le MDS, l’IRAN a été séparé de tous les autres chameaux de Bactriane domestiques (Fig. 2a).

Fig. 2 : Structure de la population des chameaux basée sur les SNP à l’échelle du génome.
figure2

a Tracé d’échelle multidimensionnelle (MDS) avec les coordonnées 1-4 (C1-C4). b Analyse d’admixture en supposant un nombre différent d’ascendance K. La proportion du génome d’un individu attribuée à chaque ascendance est représentée par différentes couleurs. c Analyse TreeMix avec différentes hypothèses d’événements de migration m. Le poids de la migration est la proportion d’ascendance reçue de la population donneuse.

Pour estimer différentes proportions ancestrales, nous avons effectué une analyse de la structure de la population avec Admixture35 en supposant K populations ancestrales (Fig. 2b). La procédure de validation croisée a confirmé que K = 3 était optimal (figure 9 supplémentaire), montrant une division claire entre les dromadaires, les chameaux de Bactriane sauvages et les chameaux de Bactriane domestiques. Une introgression évidente des chameaux domestiques de Bactriane dans les dromadaires iraniens a été observée, au moins chez un dromadaire. Par conséquent, l’ascendance dromadaire était prévalente dans les populations de chameaux de Bactriane d’Asie centrale, notamment en IRAN, au KAZA et en RUS, avec une proportion estimée à 1-10%. De plus, nous avons observé l’ascendance des chameaux domestiques de Bactriane chez plusieurs individus sauvages avec une proportion de 7-15%. Cela pourrait provenir de polymorphismes ancestraux, mais aussi d’une hybridation introgressive, qui a été observée avec les ADNmt36 et les chromosomes Y15, et qui a été proposée pour menacer la spécificité génétique des espèces sauvages. Il est surprenant de constater que les chameaux sauvages n’ont pratiquement pas contribué à l’ascendance des populations domestiques, même pour les populations mongoles, qui partagent des habitats proches de ceux des chameaux sauvages. Bien que la plupart des chameaux de Bactriane domestiques aient manqué de différenciation lorsque K a augmenté, l’IRAN a été la première population à se séparer avec une ascendance unique (K = 5 ; Fig. 2b).

Comme autre méthode pour examiner la structure de la population avec le mélange, nous avons déduit l’arbre de population pour les chameaux en utilisant TreeMix37 (Fig. 2c). Lorsqu’aucune piste de migration n’a été ajoutée, la topologie de l’arbre a de nouveau indiqué que l’IRAN était la première population séparée parmi tous les chameaux de Bactriane domestiques (figure supplémentaire 10). L’augmentation du nombre de pistes de migration (m = 1-3) a permis d’améliorer considérablement l’ajustement du modèle (figure supplémentaire 11), qui a identifié les flux de gènes des dromadaires vers les chameaux domestiques de Bactriane en Asie centrale, y compris au KAZA, en RUS et en IRAN avec des poids de migration allant de 4 % à 9 % (tableau supplémentaire 8). Il convient de mentionner que, bien que la piste de migration pointe à la fin de la branche des dromadaires vers l’IRAN, elle pointe au milieu de la branche des dromadaires vers KAZA et RUS (Fig. 2c). Cela pourrait impliquer une population fantôme liée au dromadaire iranien qui a contribué à l’ascendance de KAZA et de RUS. Une piste de migration supplémentaire (m = 4) pourrait continuer à améliorer l’ajustement du modèle, qui indique une migration du dromadaire vers une race XJ (Fig. 2c). Bien que TreeMix n’ait pas détecté de signal fort de migration entre les chameaux de Bactriane sauvages et domestiques, les résidus ont montré un mélange modéré entre les races sauvages et d’Asie de l’Est (Fig. 11 supplémentaire). Nous avons ensuite utilisé le test moins paramétré des trois et quatre populations (F3/F4)38 pour évaluer la signification statistique de ces événements de mélange. Une fois encore, le test F3 a fortement soutenu le mélange de dromadaires et de chameaux de Bactriane à KAZA, RUS et IRAN (tableau supplémentaire 9). Le test F4, plus sensible, a confirmé un degré de mélange significativement plus élevé entre les dromadaires et les chameaux de Bactriane en Asie centrale par rapport à ceux d’Asie orientale (tableau supplémentaire 10). Parmi ces derniers, une plus grande étendue de mélange avec les dromadaires a été détectée chez XJ que chez MG/IMG.

Preuve de l’origine d’Asie centrale en supprimant l’introgression

L’Asie orientale et l’Asie centrale étaient les deux régions alternatives de domestication des chameaux de Bactriane sur la base de preuves archéologiques1,12,17, mais la plus probable restait non résolue. Bien que nous ayons observé la plus grande différenciation génétique entre la population iranienne et toutes les autres populations domestiques, l’existence d’un mélange entre dromadaires et chameaux de Bactriane en Asie centrale affaiblirait le soutien à la déduction de l’origine. Pour réduire cet effet, nous avons tenté d’éliminer les segments introgressés des dromadaires des génomes des chameaux de Bactriane en utilisant le test « BABA/ABBA « 39. Nous avons regroupé les populations d’Asie de l’Est et d’Asie centrale, et comparé le partage des allèles entre les deux groupes avec les dromadaires (Fig. 3a). Comme l’ascendance des chameaux de Bactriane dans un dromadaire, ainsi que l’ascendance des chameaux domestiques dans trois dromadaires sauvages (Fig. 2b), seraient des facteurs de confusion, nous avons retiré ces quatre individus de l’analyse. Nous avons utilisé la statistique fd, une version robuste du D de Patterson, pour localiser les segments introgressés40 et appliqué un niveau de signification strict de Z-score = 2 en utilisant la procédure Jackknife (Fig. 12 supplémentaire). Sur un total de 21 153 segments non chevauchants de 100 kb à travers le génome, il y avait beaucoup plus de segments avec des signaux putatifs d’introgression dans les populations d’Asie centrale (11 711, Z-score > 2) que dans les populations d’Asie de l’Est (3891, Z-score < -2) comme prévu. Nous avons ensuite effectué l’analyse d’Admixture basée sur les segments restants et confirmé que l’introgression des dromadaires était effectivement réduite (Fig. 13 supplémentaire). Un nouveau calcul de la Fst par paire après avoir supprimé l’introgression indique toujours que l’IRAN est la population la plus différenciée (0,04-0,06) parmi toutes les populations domestiques (Fig. 3b). Pour mieux comprendre la phylogénie de la population, nous avons reconstruit l’arbre NJ basé sur le Fst par paire et effectué le test bootstrap (Fig. 3b). Il a confirmé que l’IRAN était la première à se séparer parmi toutes les populations domestiques de la Bactriane, suivie par le KAZA et la RUS. L’analyse bayésienne binaire de la chaîne de Markov Monte Carlo (MCMC) basée sur la phylogénie a fortement soutenu l’Asie centrale comme zone ancestrale des chameaux domestiques de Bactriane (probabilité = 99,78 %) et une route de dispersion ultérieure de l’Asie centrale à l’Asie orientale (figure supplémentaire 14).

Fig. 3 : Identification de l’origine des chameaux domestiques de Bactriane en supprimant l’introgression.
figure3

une analyse BABA/ABBA pour l’introgression des dromadaires dans les chameaux domestiques de Bactriane. Pour se concentrer sur cette introgression, un dromadaire ayant l’ascendance des chameaux de Bactriane et trois chameaux sauvages ayant l’ascendance des domestiques ont été retirés. Le nombre de segments de 100 kb avec un fd significatif (|Z-score| > 2) pour chaque configuration d’arbre est indiqué. b Arbre de voisinage (NJ) des populations après l’élimination des segments introgressés. La carte thermique représente la moyenne des Fst par paire pour 5,1 × 104 fenêtres de glissement de 10 kb. Les valeurs Bootstrap de l’arbre NJ ont été calculées en échantillonnant aléatoirement cinq mille fenêtres de 10 kb pour 100 fois. c Arbre de vraisemblance maximale des ADNmt complets. Les populations sont représentées par différentes couleurs et les séquences provenant de Genbank sont indiquées par des points. Les valeurs de bootstrap pour les branches principales sont étiquetées.

En tant que preuve indépendante, nous avons également reconstruit l’arbre de probabilité maximale des ADNmt complets sur la base des 128 échantillons que nous avons séquencés dans cette étude, ainsi que de 39 échantillons supplémentaires disponibles sur Genbank (figure 3c et tableau supplémentaire 11). L’introgression des ADNmt a pu être facilement identifiée et exclue de l’arbre. Par exemple, deux ADNmt récemment séquencés provenant de KAZA et de RUS ont été regroupés avec des dromadaires. Au sein du clade des chameaux de Bactriane domestiques, bien que la plupart des chameaux provenant de différentes régions géographiques étaient mélangés, deux ADNmt provenant d’IRAN formaient les branches les plus basales des populations domestiques (Fig. 3c). L’analyse MCMC binaire bayésienne a de nouveau soutenu l’origine d’Asie centrale des chameaux domestiques de Bactriane (probabilité = 76,43 %).

Histoire démographique des chameaux de Bactriane

Nous avons effectué plusieurs analyses de modélisation paramétrique pour déduire la dynamique démographique des chameaux dans l’histoire. Conformément à l’étude précédente10, les trajectoires à long terme des chameaux de Bactriane basées sur le modèle de coalescence séquentielle markovienne par paire (PSMC)41 ont révélé une énorme diminution de la taille effective de la population des chameaux ancestraux il y a plus d’un million d’années (figure supplémentaire 15). Bien que les trajectoires à long terme des chameaux de Bactriane sauvages et domestiques étaient généralement similaires, il était évident qu’ils divergeaient les uns des autres dès 0,4 million d’années, excluant les premiers en tant que progéniteurs directs des seconds comme l’ont fait les analyses précédentes de l’ADNmt9,14.

Pour explorer plus en détail le temps de divergence entre les populations de chameaux, nous avons utilisé l’échantillonneur coalescent phylogénétique généralisé (G-PhoCS)42. Étant donné la phylogénie des populations de chameaux, G-PhoCS pourrait estimer la taille de la population à l’échelle de la mutation et le temps de divergence de la population sur la base de loci neutres non liés dans les génomes individuels de chaque population. Pour réduire la complexité du modèle, nous n’avons inclus que les dromadaires, les chameaux de Bactriane sauvages et trois populations représentatives (IRAN, KAZA et MG) de chameaux de Bactriane domestiques (figure 16 supplémentaire et tableau 12 supplémentaire). D’après la figure 3b, IRAN et KAZA ont été les deux premières populations d’Asie centrale à se séparer et la scission de MG pourrait indiquer la dispersion de l’Asie centrale vers l’Asie orientale. L’âge a été calibré en supposant une divergence entre le chameau de Bactriane et le dromadaire de 5,73 millions d’années selon la base de données Timetree43. Lorsqu’aucune bande de migration n’a été incorporée, la convergence de toutes les estimations de paramètres a pu être facilement atteinte (figure 17 supplémentaire et tableau 13 supplémentaire). Comme pour les résultats du PSMC, la taille effective de la population a généralement diminué des populations ancestrales aux populations modernes (Fig. 4). Le temps de divergence entre les chameaux de Bactriane sauvages et domestiques a été estimé à 0,43 million d’années (intervalle de confiance à 95 % : 0,13-0,73 Mya ; Fig. 4), ce qui est légèrement plus tardif que celui basé sur l’ADNmt (0,714 ou 1,1 Mya9). Parmi les populations domestiques, l’IRAN a été séparée des autres il y a environ 4,45 milliers d’années (IC 95 % : 0,07-17,6 Kya), puis les populations d’Asie centrale et orientale ont été séparées il y a environ 2,40 milliers d’années (IC 95 % : 0,01-7,84 Kya ; Fig. 4).

Fig. 4 : Inférence de l’histoire démographique basée sur les paramètres avec G-PhoCS.
figure4

Le changement de la taille de la population effective θ échelonnée par mutation est représenté par des couleurs chaudes. Le temps en années a été calibré par le temps de divergence entre les dromadaires et les chameaux de Bactriane. Les intervalles de confiance à 95 % sont représentés par des barres sur l’axe du temps. Les barres rouges et bleues indiquent la divergence IRAN-MG et KAZA-MG, respectivement. Ces estimations sont basées sur le modèle sans migration.

Pour permettre le flux génétique, nous avons également essayé d’introduire des bandes de migration des dromadaires vers les populations de chameaux de Bactriane (figure supplémentaire 16 et tableau supplémentaire 12). Les estimations n’ont pu converger que lorsqu’une bande de migration des dromadaires iraniens vers l’IRAN et une bande de migration d’une population fantôme vers KAZA ont été introduites (figure supplémentaire 18 et tableau supplémentaire 13). Bien que le temps de divergence entre les chameaux de Bactriane sauvages et domestiques n’ait pas été modifié par le modèle de migration (0,46 Mio, IC 95 % : 0,24-0,71 Mio), le premier temps de divergence des populations domestiques (0,19 Mio, IC 95 % : 0,08-0,31 Mio) est devenu irréaliste, car il était bien au-delà de l’histoire connue de la domestication du bétail (11,5 Kya44). En outre, le taux de migration total n’a été estimé qu’à 0,27 % et 0,16 % pour la bande de migration vers l’IRAN et le KAZA, respectivement, ce qui est bien inférieur à celui estimé avec l’admixtion (1-10 %). Une raison possible de cette mauvaise estimation serait une histoire d’admixture plus complexe que le modèle de migration continue avec des taux constants supposé par G-PhoCS.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.