“遗产”主题文献阅读

NC | 2020 中国北方的古代基因组表明了生存变化和人类迁徙之间的联系

发布日期:2024-07-07

文章信息:Chao Ning, Tianjiao Li, Ke Wang, Fan Zhang, Tao Li, Xiyan Wu, Shizhu Gao, Quanchao Zhang, Hai Zhang, Mark J. Hudson, Guanghui Dong, Sihao Wu, Yanming Fang, Chen Liu, Chunyan Feng, Wei Li, Tao Han, Ruo Li, Jian Wei, Yinqiu Cui. (2020). Ancient genomes from northern China suggest links between subsistence changes and human migration. Nature Communications: 11(1), 2700. https://doi.org/10.1038/s41467-020-16557-2

阅读笔记:杨一鸣

阅读时间:2022年8月12日



1. 科学问题:

从基因组的视角研究中国北方聚落生存变化与人类迁移的关系

2. 文章简述:

中国北方拥有世界上最早的以小米种植为基础的复杂社会,主要位于黄河(YR)和西辽河(WLR)流域两个中心。到目前为止,它们的进化史在很大程度上还是未知的。在这里,我们介绍了来自YR、WLR和阿穆尔河(AR)地区的55个古老的基因组测定,其年代为7500-1700 BP。与AR的遗传稳定性相反,YR和WLR的遗传图谱随时间发生了显著变化。YR群体与当今中国南方人和东南亚人的遗传亲和力随时间单调增加。在WLR中,新石器时代晚期农业的强化与YR亲和力的增加相关,而青铜时代的畜牧经济与AR亲和力增加相关。我们的研究结果表明,生存策略的改变与人类迁移之间存在联系,并引发了关于过去人类迁移的古语言特征的争论。

3. 文章结构

3.1研究背景

中国是世界上最早的谷类作物驯化中心之一,在中国南部的长江流域有旱稻农业,在中国北部有旱地谷子农业。中国北方是一个巨大的地理区域,包括黄河中下游流域的中央平原,这是自新石器时代以来著名的黄河文明的发源地。然而,中国北部远远超出了中部平原,并在不同的生态区域包括了若干其他主要河流系统(图1)。尤其是,现在人们普遍认为,中国东北部的西辽河(WLR)地区(图1)不同于YR地区,在小米种植的采用和传播方面发挥了关键作用。至少从公元前6000年起,在WLR流域和YR流域的下游地区首次种植了谷子(Setaria italica)和高粱(Panicum miliaceum)。在随后的5000年中,中国北方种植的小米遍布欧亚大陆东部和其他地区。小米一直是东北亚的主要主食之一,特别是在16-17世纪玉米和甘薯问世之前。

图 地理位置和日期

a 本研究中涵盖55个古代个体的19个考古遗址的位置。每个符号对应于特定区域的地点:圆形(AR);正方形(WLR);三角形(YR);钻石(来自内蒙古或陕西的地点)(详情见表1)。还列出了已出版的俄罗斯远东早期新石器时代基因组(“Devil’s Gate_EN”)。中国北方的三个主要流域以不同的色调表示,即浅绿色的阿穆尔河流域、粉红色的西辽河流域和浅蓝色的黄河流域。基本地图是从ArcGIS中包含的ArcGIS“世界地形基地”。ArcGIS用户许可证由马克斯·普朗克人类历史科学研究所(德国耶拿MPI-SHH)购买并获得授权。

b在本研究中校准的放射性碳日期和古代样本的相对年代。考古遗址是根据其位置订购的。SX和IM分别指陕西省和中国内蒙古自治区。他们的地理位置介于WLR和YR之间。颜色对应于不同时间段的样本:EN早期新石器时代、MN中新石器时代、LN新石器时代晚期、BA青铜时代、LBIA青铜晚期和铁器时代、IA铁器时代。


3.2结果

(1)古代基因组数据生产

我们最初通过对每人一个Illumina测序库进行测序,在中国北方总共筛查了107名古代人。这些样本来自AR(三个遗址;公元前5525年至公元250年)、WLR(四个遗址;公元前3694-350年)和YR(十个遗址;公元前3550年)盆地的19个考古遗址,以及来自陕西省中部地区(一个遗址;公元前2250-1950年)和内蒙古自治区(一个遗址;公元前3550-3050年)的遗址,从北到南横跨约2300公里的地理区域,覆盖六千年(表1)。我们还对55个保存DNA的个体进行了测序。


我们通过多种措施验证了基因组数据的真实性。所有样本都显示了古代DNA的死后化学损伤特征。它们显示现代人类污染水平较低,所有个体的线粒体估计<4%,除覆盖率低的男性除外(6.3%的污染率×0.07覆盖率为6.3%)。对于每个样本,我们通过随机抽样Affymetrix“人类起源”平台中包含的593,124个常染色体单核苷酸多态性(SNP)和“1240k-Illumina”数据集中的249,162个SNP的单个高质量碱基,生成单倍体基因型。然后,我们将它们与已发布的古代基因组数据和“人类起源”或“1240k-Illumina”数据集中的当今个体合并。这项研究中的古代个体涵盖了“人类起源”面板中的11,690-586,085个SNP,以及“1240k-Illumina”面板中的4481-244,000个SNP。对于基于群体的分析,我们主要根据古代个体的日期、地理区域和考古背景以及他们的遗传特征进行分组。我们在基于群体的分析中删除了一级亲属,以保证样本的独立性。

图 古代和现代东亚人口的遗传概况概述

a 前两个主成分是从2077年至今的欧亚大陆构建的;古代个体被投影到前两个PC上。颜色填充的形状代表古代个体,颜色-形状组合如图1所示。不透明的圆圈代表用于计算PC的当今个体。讲通古斯语的人口和汉族分别用绿色和紫色阴影标记。来自其他群体的个体以灰色阴影为特征。补充图4中提供了当前个体的群体标签。

b WLR和YR集群的放大可视化。

c 前两个主要成分是从“1240k Illumina”数据集中九个东亚人口的当代个体计算得出的。今天的个体是由其相应的群体名称来标记的。

d ADMIXTURE“1240k-Illumina”数据集在K = 5。只有东亚人口被策划。当今人口根据其语言家族进行分类和着色。

(2)中国北方古代个体的遗传分组

“人类起源”数据集中2077名当代欧亚个体的主成分分析(PCA)表明,来自中国北方的古代个体被分为不同的组。古代个体沿着PC1落在今天的欧亚东部。同样,他们也是当今东亚特有的、与潜在适应性表型相关的源自哈伯的等位基因。然而,他们在PC2上处于不同的位置,这在很大程度上以南北向的方式区分了东亚人(顶部是北西伯利亚的Nga-nasan,底部是泰湾讲南岛语的人口)。本研究中的古代个体形成了三大集群,AR个体位于顶部,YR个体位于底部,WLR个体位于中间,这在很大程度上反映了它们的地理起源。为了关注东亚人的变异,我们随后使用了“1240k Illumina”数据集25-27中的九个当代东亚人口组成的小组,其中包括大量高原藏族人。前两个PC分别是讲音乐的人(如鄂伦春族、赫哲族、锡伯族)、藏族人和低地东亚人口(如汉族和土家族)。在这里,古代个体的精细聚类,特别是来自YR和WLR的个体,比欧亚NPCA更为明显。未经监督的混合分析显示,所有古代个体都拥有三个祖先成分,来自同一河流流域的古代个体具有相似的遗传成分,与PCA位置一致,具有相似的模式。

(3)AR群体的长期遗传稳定性

在欧亚和东亚PCA中,两名新石器时代早期的狩猎采集者(“AR_EN”)和三名铁器时代的个体(“AR _xinbei_IA”;公元二世纪;鲜卑背景),以及一名青铜时代的游牧背景下的WLR个体(“WLR_BA_o”)形成了一个紧密的集群,分布在当今的AR人口范围内,他们是最会讲音乐的人。一个个体(AR_IA)不属于AR群,在PCA中沿着PC1向讲蒙古语的人轻微移动,但这可能是一个艺术事实,因为他的覆盖率低(×0.068)和少量污染(6.3±6.4%;点估计±1标准误差度量,s.e.m)。古代和现代AR群体在混合分析中也显示出类似的遗传图谱(图2d和补充图6)。在成对的AR群体、古人以及来自较低AR的当前日样本之间,我们观察到支持其紧密遗传亲和力的大型外群-F3统计量。此外,我们正式确认它们彼此之间存在较大的关联。首先,对于大多数外群种群(X)来说,非显著的统计f4(AR1,AR1,AR2;X,姆布蒂)统计数据是无关紧要的(Z < 3),除了两个现今西伯利亚种群(Nganasan和Itelmen;补充图9和10),它们可能经历过与AR相关基因库的历史遗传交流。其次,qpWave分析无法区分AR人群对与外群的亲和力(p>0.05;补充表3A)。

虽然AR种群与AR以外的种群的亲和力随着时间的推移没有发生重大变化,但已公布的最严格意义上的遗传连续性测试驳斥了本研究中的古代AR种群是当今AR种群的直接祖先的假设。这表明AR基因库内部存在分层,在当今种群形成期间,AR种群之间可能存在基因流动。

(4)YR基因谱的时间变化。

来自中部平原地区的古代YR个体形成了一个集群,与主成分分析中的AR个体不同,并且在混合分析中也具有相似的遗传特征(图2和补充图4)。然而,我们也观察到它们之间存在微小但显著的差异:新石器时代晚期的龙山个体(“YR_LN”)在基因上更接近中国南部和东南亚(“SC-海”)的现今种群,而新石器时代中期的仰韶个体(“YR_MN”),通过阳性F4(YR_ LN,YRU;MN;X,Mbuti)测量(X=Ami时为+3.7 s.e.m.)。这与我们观察到的新石器时代仰韶中期和新石器时代晚期龙山中期和下部水稻种植显著增加的现象提供了遗传学上的平行性(补充注2和补充图12)。我们未检测到青铜/铁器时代晚期个体(“YR_LBIA”)的进一步变化,如无显著性F4(YR_ LN,YRULBIA;X,Mbuti)(|Z|<3)所示。与塔尔地区不同,我们没有发现与YR_ LBIA形成aclade的当今种群(补充图14)。汉族是目前居住在中部平原的一个少数民族,显然与SC-海洋人口有着额外的亲和力(最大|Z|=10.3 s.e.m.)。来自中国西南部的讲藏缅语的纳西族人口与古代人口相比减少了很多,但仍有显著差异(最大值|Z|=4.0 s.e.m)。这些结果表明,YR群体之间存在长期的遗传联系,但有一个重要的外生遗传贡献轴,可能与华南(如长江)群体迁移导致的水稻种植向北扩展有关。

中央平原周围地区的新石器时代基因组表明,YR基因图谱具有广泛的地理分布。位于YR和WLR之间的内蒙古新石器时代中期(“庙子沟”)和山西新石器时代晚期(“石茂_LN”)的基因组在遗传学上彼此相似,并且与古代YR种群相似。与齐家文化相关的晚新石器时代上YR个体(“上YR_LN”)也表现出类似的模式(补充图16和17)。我们将这些群体建模为YR农民和狩猎采集者的混合体,大多数祖先(约80%)来自YR(p≥0.278; 补充表4)。来自上YR区域(“上YR_IA”)的铁年龄基因组显示出更高的YR贡献,与100%的YR祖先一致(94.7±5.3%;补充表4)。

考古学研究表明,青藏高原东北边缘的中海拔地区,即齐家文化所在地,在大约公元前1600年后,在人类对高原的永久占领中起着关键作用。更广泛地说,最近的语言学研究支持汉藏语言的北方起源,表明仰韶文化是他们的相似起源。我们利用外加剂研究了当今汉藏和古代YR群体之间的遗传联系。藏族人被建模为夏尔巴人和Upper_ YR_。这为先前报告的混合抗性信号提供了可能的本地来源。在我们的数据集中的其他汉藏语系人口中,根据我们的分辨率,纳西族和彝族与YR_。我们的结果与上述语言和考古学情景相一致,尽管我们发现由于我们的遗传数据的分辨率,其他模型也大致可行。

(5)WLR中基因和生存的相关性变化

WLR区域位于YR和AR之间,随着时间的推移,遗传变化频繁。新石器时代中期WLR个体位于PCA的AR和YR集群之间:三个属于红山文化(“WLR_MN”)更接近YR集群,而来自附近站点(“HMMH_MN”)的三个更接近AR集群。F4统计数据证实,这两组介于AR组和YR组之间,分别由AR_EN和YR_MN表示。我们充分将两组建模为AR和YR组的混合物,AR对HMH_MN的贡献更高(WLR_MN和HMMH_MN分别为39.8±5.7%和75.1±8.9%。考虑到来自内蒙古的同期苗子沟_MN,我们观察到新石器时代中期在约600公里范围内从主要与YR相关的基因剖面急剧过渡到AR相关基因剖面。在语言上,WLR盆地与跨欧洲语系的起源有关,AR和YR组之间的混合可能发现跨欧洲语言亚群和Sinitic语言亚群之间的借用相关性,从青铜时代开始变得更加密集。

图 中国北方古代人口的qpAdm模型

将古代种群建模为YR_MN和AR_EN的混合物。a本研究中的新石器时代中期人口。X轴显示了与YR_MN位点的大圆距离,y轴显示了AR相关祖先比例的估计值(由AR_EN表示)。b新石器时代中期至青铜时代的WLR人群。黑色方块表示点估计值。垂直条表示±1 s.e.m的范围,通过5 cM的块顶切进行估计。

4.讨论

在这项研究中,我们对来自中国北方的古代基因组进行了大规模调查,涵盖了该地区许多(尽管不是全部)主要考古文化。特别是,我们的研究首次对生活在中国北方最早复杂社会的人进行了基因组研究,即YR和WLR中的阳韶和红山文化。通过在这些地区提供基因组时间序列,我们可以随着时间的推移检测每个地区的遗传变化,并将其与外部遗传来源以及社会文化和环境变化联系起来。

与从事有限粮食生产的AR种群遗传特征的长期稳定性相反,我们观察到过去六千年来,中国北方复杂的小米种植社会中心YR和WLR经常发生遗传变化。WLR基因概况随着时间的推移而变化,与生存策略的变化密切相关。更具体地说,新石器时代中后期对小米种植的依赖增加与新石器时代晚期WLR中较高的YR遗传亲和力有关,而青铜时代上夏家店文化中部分转向畜牧业与较低的YR亲和力有关。在新石器时代中期,我们观察到WLR周围从YR到AR相关基因剖面的急剧转变。这种空间遗传异质性在青铜时代和铁器时代可能在WLR中持续存在,尽管我们目前的数据不足以测试这种假设。年新石器时代中晚期的遗传变化也与中原水稻种植的加剧相吻合,这可能会通过流行病传播提供另一种生存策略变化的案例。我们承认,我们目前的数据集缺乏来自候选来源人群的古代基因组,这些基因组可能将水稻养殖带入了中原,并呼吁对他们进行考古遗传学研究,特别是来自山东和长江下游地区的新石器时代人。未来对中国古代基因组的研究,特别是第一批农民的基因组,对于测试本研究中报告的基因组的代表性,了解我们在更精细的遗传、考古和地理范围内检测到的遗传变化,以及测试考古文化、语言和基因之间的进化相关性至关重要。



原文链接:https://www.nature.com/articles/s41467-020-16557-2 

版权所有©   流域人居系统研究中心   地址:北京市海淀区燕园街道中关村北大街100号 · 北京大学建筑与景观设计学院

邮政编码: 100871