Collection d’échantillons et séquençage du génome entier
Un total de 105 chameaux de Bactriane domestiques à travers l’Asie, 19 chameaux de Bactriane sauvages de la région de Gobi-Altai au MG, ainsi que 4 dromadaires d’IRAN ont été rassemblés pour cette étude (Fig. supplémentaire 1 et Tableau supplémentaire 1). 1 et tableau supplémentaire 1). Les chameaux domestiques de Bactriane ont été choisis de manière à couvrir le plus grand nombre possible de grandes régions géographiques, dont 55 provenant de la région intérieure de MG (IMG), du Xinjiang (XJ) et du Qinghai en Chine, 28 de MG, 6 de KAZA, 10 de Russie (RUS) et 6 d’IRAN. Comme une variété de races locales s’est formée en raison de la large utilisation des chameaux domestiques de Bactriane en Chine et en MG, huit races représentatives différentes ont été choisies dans les régions. Les autres chameaux domestiques de Bactriane d’Asie centrale vivaient autour de la mer Caspienne.
Après extraction de l’ADN, les génomes individuels ont été séquencés avec une couverture moyenne de 13× (figure supplémentaire 2 et tableau supplémentaire 2). Les lectures de séquence ont été alignées sur notre précédent assemblage du génome du chameau de Bactriane29 pour l’appel de variante. Après un filtrage rigoureux (figure 3 supplémentaire), nous avons identifié 13,83 millions de polymorphismes mononucléotidiques (SNP) et 1,41 million de petits indels. Notamment, le ratio transition/transversion des SNP bruts (2,29) était inférieur à celui rapporté chez les dromadaires (2,31-2,34)31, mais il est passé à 2,44 après les procédures de filtrage, ce qui suggère une amélioration de la qualité des SNP identifiés. L’annotation fonctionnelle des variants a indiqué qu’environ 63,10 % d’entre eux étaient intergéniques, 33,62 % étaient introniques et 0,94 % étaient exoniques (tableau supplémentaire 3). On a identifié 13,73 millions, 6,39 millions et 10,55 millions de variants chez les chameaux de Bactriane domestiques, les chameaux de Bactriane sauvages et les dromadaires, respectivement. Bien que les dromadaires soient plus divergents des deux espèces de chameaux de Bactriane dans la phylogénie, les chameaux de Bactriane domestiques partagent plus de variantes avec les dromadaires (66,73 %) qu’avec les chameaux de Bactriane sauvages (39,31 %) (figure supplémentaire 4) en raison de la réduction considérable des variantes génétiques observée chez le chameau de Bactriane sauvage existant et du flux génétique entre les dromadaires et les chameaux de Bactriane domestiques. Parmi les chameaux domestiques de Bactriane, 12,68 millions et 11,61 millions de variants ont été identifiés dans les populations d’Asie de l’Est et d’Asie centrale, respectivement (figure supplémentaire 4). Bien que les chameaux domestiques échantillonnés en Asie de l’Est soient plus nombreux que ceux d’Asie centrale, le décompte des variants propres à chaque population n’a montré aucun biais significatif entre les deux régions (valeur P = 0,77, test t bilatéral ; tableau supplémentaire 4).
Diversité génétique et différenciation
Pour une comparaison plus détaillée de la diversité génétique entre les différentes populations, nous avons d’abord retiré 14 individus présentant une relation génétique étroite avec les autres (tableau supplémentaire 5). La diversité nucléotidique par paires π (figure 1a) des dromadaires (1,54 × 10-3) était significativement plus élevée que celle des chameaux de Bactriane de toutes les régions géographiques (0,88 × 10-3-1,11 × 10-3 ; tableau supplémentaire 6), ce qui contrastait avec les estimations précédentes de l’hétérozygotie basées sur les génomes individuels10. Une raison importante pourrait être la pratique de l’hybridation entre les dromadaires et les chameaux de Bactriane en Asie centrale30. Parmi les chameaux de Bactriane, la population sauvage a montré le plus faible π (0,88 × 10-3) par rapport à toutes les populations domestiques (Fig. 1a et tableau supplémentaire 6). Bien que ce résultat contrevienne à de nombreux cas où les animaux sauvages ont généralement une diversité génétique plus élevée que leurs homologues domestiques, comme les chiens24, les porcs27 et les lapins32, cela se produirait dans le cas d’animaux sauvages menacés d’extinction dont la taille de la population est extrêmement réduite, comme les chevaux33. En outre, les populations domestiques vivant en Asie centrale présentaient généralement une plus grande diversité (1,03 × 10-3-1,11 × 10-3) que celles vivant en Asie de l’Est (0,95 × 10-3-1,02 × 10-3 ; Fig. 1a). Cette tendance a également été confirmée par le θ de Watterson (Fig. 5 supplémentaire). Là encore, l’hybridation avec les dromadaires en Asie centrale pourrait expliquer la plus grande diversité dans la région.
Nous avons ensuite mesuré la distance génétique par paire entre les populations de chameaux par le Fst de Weir (Fig. 1b). Le résultat était bien en accord avec la phylogénie connue, qui indiquait que les dromadaires avaient le Fst le plus élevé avec les chameaux de Bactriane (0,54-0,64) et que les chameaux de Bactriane sauvages avaient le deuxième Fst le plus élevé avec les domestiques (0,27-0,31). La différenciation entre les chameaux domestiques de Bactriane était beaucoup plus faible, ce qui correspond à leur origine unique récente. Il est intéressant de noter que parmi les chameaux de Bactriane domestiques, ceux d’IRAN présentaient la plus grande divergence avec tous les autres (0,05-0,06). Pour valider la différenciation de la population, nous avons construit un arbre de voisinage (NJ) pour tous les individus sur la base de leur matrice d’identité par état (IBS) par paire (figure supplémentaire 6). L’arbre NJ a également soutenu un clade monophylétique de tous les chameaux de Bactriane domestiques, au sein duquel l’IRAN a formé la branche la plus profonde.
Un problème potentiel avec les estimations génomiques de la population était le biais de référence, où l’utilisation d’un seul génome de référence conduirait à une faible efficacité dans l’appel de variants pour les individus qui diffèrent fortement de celui-ci34. Pour étudier ce biais, nous avons comparé le nombre de variants manquants entre les trois espèces, en prenant la profondeur de séquençage comme covariable (tableau supplémentaire 7). L’analyse de la variance (ANOVA) a montré que, bien que les chameaux de Bactriane domestiques ne présentent pas de différence significative avec les chameaux sauvages (valeur P = 0,50), ils ont effectivement un nombre de manquants inférieur à celui des dromadaires (valeur P = 4,38 × 10-3). Pour évaluer l’impact du biais sur nos estimations, nous avons recalculé la diversité génétique et Fst avec seulement les SNP synonymes (Fig. 7 supplémentaire), car les séquences codantes sont plus susceptibles d’être invariantes entre les espèces. En conséquence, les estimations basées sur les SNP synonymes étaient en bon accord avec le génome entier pour toutes les espèces, ce qui suggère que le biais de référence n’a eu que des effets mineurs sur nos estimations génomiques de population.
Structure de la population avec mélange
Pour révéler la structure globale de la population avec mélange potentiel, nous avons élagué les SNP en supprimant ceux qui présentaient un déséquilibre de liaison élevé et des effets fonctionnels potentiels. L’analyse d’échelle multidimensionnelle (MDS) basée sur le sous-ensemble élagué a reproduit le même résultat que l’ensemble complet (Fig. 2a et Fig. 8 supplémentaire). Comme prévu, les dromadaires et les chameaux sauvages de Bactriane ont pu être séparés par les première et deuxième coordonnées, respectivement. Lorsque la troisième coordonnée a été incorporée dans le MDS, l’IRAN a été séparé de tous les autres chameaux de Bactriane domestiques (Fig. 2a).