人类基因组是一部用遗传密码写就的人类自传。自生命诞生之日起,就用“基因语言”记录了人类所经历的世事更迭与沧桑变迁。
中国科学家通过创新构建的全基因组分析方法和理论,研究发现在距今93万年前,人类祖先在早、中更新世过渡期,由于剧烈的气候变化,短期内丧失了98.7%成员个体;在此后长达11.7万年的时间里,人类祖先平均成年个体数仅为1280。国际学术期刊《科学》(Science)9月1日在线发表了相关研究论文。
93万年前人类遭遇了严重的“群体瓶颈”几近灭绝?这一研究成果引起社会各界广泛关注、甚至质疑。本报记者专访了论文的共同通讯作者、中国科学院上海营养与健康研究所李海鹏研究员。
研究成果示意图(受访者供图)
“群体瓶颈”与人类学和古气候学一系列证据时间吻合
“我是谁?我从哪里来?我要到哪里去?”面对这三个终极追问,科学家从未停止探索人类自身的起源之谜。
根据目前考古成果,人类进化始于灵长类的森林古猿,随后历经南方古猿、能人、直立人、智人四个阶段,其中“智人”就是目前世界上现存的人类。最近100万年是人类进化的关键时期,但由于分析方法的局限,对人类祖先群体数量变化历史的研究多局限于最近的30万至10万年内。
化石是研究人类进化的最直接证据。古生物学家发现非洲古人类化石存在“缺失的环节”,在距今95万至65万年之间的化石极为稀缺,但在距今95万年之前和距今65万年以内的则相对较为丰富。在非洲发现的多个直立人化石,都是距今约90万年之前的,在距今约90万年之内的,则没有发现过,取而代之的是另外一个新的人类物种。
“我们通过对现代人基因组分析,发现人类祖先在距今93万年至81.3万年的时间里,经历了一个长达11.7万年的群体瓶颈。这一时间段正好解释了非洲人类祖先化石缺失的环节、非洲直立人化石消失的谜团。因为根本就没有化石留下来。”李海鹏说。
根据研究结果,在大约81.3万年前,人类祖先从人口衰减过程中快速恢复,相对应的是一个新的古人类物种的形成。
“基于我们的分析,这是一个新的古人类物种,而不是一个古人类物种取代另外一个古人类物种。”李海鹏说,“如何命名这一新的古人类物种?目前化石界争议很大。为了避免争议,我们将其命名为LCA,即现代人、尼安德特人和丹尼索瓦人的最近共同祖先。”
染色体数目的变化,对于生物体的影响极大。染色体的融合或断裂,是进化过程中一个重要事件。人类是猿类的后代,和黑猩猩有共同的祖先。但自从600万年前黑猩猩和人类在进化树上分道扬镳之后,在人类这一支发生了形成现代人2号染色体的染色体融合事件,即人类的2号染色体,是由两个中等大小的猿染色体融合而成。
“通过统计人类2号染色体融合区域AT到GC的转换率,并与黑猩猩同源区域进行比较,可估计两条古人类2号染色体的融合时间。国际上有两个研究组分别对古人2号染色体的融合时间进行了估计。其中一组研究的估计结果为74万年前,另外一组的估计结果为90万年前。因此,这一染色体融合时间很可能发生在74万-90万年前,这也与我们研究的远古严重瓶颈时间段相对应。”李海鹏说。
创新构建“快速极小时间溯祖(FitCoal)”理论和方法
近年来,虽然古DNA测序技术迅猛发展,但由于炎热条件不利于DNA的保存,科学家无法从30万年前非洲人类祖先化石中提取古DNA。这一研究成果的取得,源于李海鹏和华东师范大学脑功能基因组学研究所潘逸萱,带领胡王杰、郝子谦等团队成员,创新构建了“快速极小时间溯祖(FitCoal)”新理论。
这一基于群体遗传学和计算生物学交叉的新理论,可在百万年这一大时间尺度上,实现高精度的时间回溯,准确估算远古的群体历史,从而对古人类群体进行“人口普查”。
史前虽然没有文字记载群体数量,但有效群体大小会影响每个世代的“溯祖率”,也就是两个谱系在上一世代来自同一祖先的概率。因此,人类祖先曾在群体基因组中留下印记,反映当时的群体大小。群体历史越久远,留存至今的印记信号越微弱。
李海鹏和潘逸萱研究团队根据这一原理创建了FitCoal理论。遵循这一理论进行数学推导,获得在任意群体模型下各突变类型(即突变频谱)对应溯祖树枝长期望值的解析解,就获得精确的似然值,即在群体历史条件下观察到样本突变频谱的概率。因此,无需事先获得群体历史的先验知识,FitCoal即可自动快速搜寻出极大似然值,从而估算群体历史。
研究一开始遇到了非常大的困难。“我们的思路是通过计算任意模型下突变频谱的期望值,与观察到的突变频谱相互比较来推断群体历史。突变频谱的期望值等于溯祖树对应枝长的期望值和突变速率的乘积。然而,对于如何计算溯祖树对应枝长的期望值,我们起初是完全不知道的。”李海鹏说。
经过近一年的艰辛数学推导和计算机编程之后,研究人员发现自己陷入了一望无际的泥潭,根本看不到出路在何方。发现理论推导的方向是错误的,程序内存开销极大,完全没有实用价值,而且计算的结果也是错误极大。后来经过许多次讨论,潘逸萱当时建议:“与其耗时解开一个乱线团,还不如重新绕一个线团。”
“研究团队最终决定将所有代码删除,从头开始进行数学推导,从头开始编程。此后,研究回到正轨上,基本上没有碰到太大问题,并且经过日常的讨论机制,避免了很多弯路。科研的过程就是痛苦和快乐并存。”李海鹏说。
对研究结果进行七年验证并发布论文预印本
经过三、四年时间构建起“快速极小时间溯祖(FitCoal)”新理论方法后,研究团队在2016至2017年开始进行人群数据分析,并且很快“看到了”远古时期的人类群体瓶颈。
在长达11.7万年的时间里,人类祖先平均成年个体数仅为1280?“回想起来,我们第一次看到这个结果的时候,不是吃惊,而是有点沮丧。因为这太令人不可思议了,或许代表着我们程序有错。毕竟这样明显的一个群体历史事件,为什么前人没有发现,难道是我们哪些地方算错了?”李海鹏说。
胡王杰、郝子谦、李海鹏、潘逸萱等团队成员反复检查理论方法、检查代码,经过好几个月无数次尝试之后,始终没找到错误。这时,他们才意识到这个人类群体瓶颈有可能是真实存在的。
此后,他们用了近七年时间证实这个群体瓶颈的存在。从分析千人基因组数据,到分析另外一个测序倍率高、但样本相对较小的人类基因组多样性计划(HGDP-CEPH)数据,都检测到了同样的群体瓶颈。并且两组独立的、共50个现代人类群体的基因组数据,获得的群体瓶颈时间和人数的估计,几乎完全一样。
接着,研究人员又采用HGDP-CEPH数据集的两个南部非洲群体做了进一步验证,虽然样本量仅为6个和8个个体,但依然检测到了远古群体瓶颈。对非洲群体样本重抽样的研究结果表明,仅需3个非洲个体的基因组,即可检测到这一远古群体瓶颈,进一步表明“快速极小时间溯祖(FitCoal)”理论创新带来的这一重大发现。
“群体遗传学在群体历史估计的领域,有标准的证伪流程。可以简单理解为,群体数量的变化,是一个统计学意义上发生的事件,相当于一个假设检验。因此,我们通过了大量的模拟实验来验证我们的结论。论文附录有100多页,其中很大一部分都是对于远古时期群体瓶颈的验证,所有的验证结果都是支持我们的结论。”李海鹏说。
他说:“这十年来,我们绝大部分的时间都是围绕着我们的发现,做进一步验证。就像福尔摩斯的名言:排除一切不可能的,剩下的即使再令人难以置信,那也是真相。目前网络上出现的批评建议,都没有超出我们过去六、七年在反复验证过程中考虑过的范畴。”
即使经过反复的交叉验证确认发现了一个重要的人类群体瓶颈,但依然缺乏古生物学证据。研究团队经过讨论之后,2021年5月决定通过发布预印版的方式,开诚布公听取学术界的反馈并寻求合作。
预印本发布几天之后,意大利罗马大学、佛罗伦萨大学的古人类学家Giorgio Manzi教授和Fabio Di Vincenzo教授,很快主动来联系,告知这一发现与他们化石考古学上现象一致。经过认真讨论和交流,大家决定联合起来,进一步完成这个课题。最终,经过近一年紧密合作和修改之后,于2022年4月28日将文章投寄给了《科学》(Science)。
在正式发表的论文中,研究团队将众多技术细节放到了100多页的补充材料中。为了便于学术界重复和验证他们的结果,还特地提供了模拟程序具体的参数,排版好了便于同行使用。
中山大学生命科学学院教授、博士生导师吴仲义评价说:“这篇论文,理论架构全部在附件里。正文只是刊登了结论。这是个买椟藏珠的故事,也是近年来CNS期刊(Cell、Nature和Science三个期刊的简称)上凤毛麟角的理论论文。”
人类自古就是命运共同体
通过现代人群的基因组数据回溯到的进化信息,均代表了现代人类祖先的信息(包括基因渐渗)。
“我们研究中看到的远古群体瓶颈,代表了现代人类的直接祖先,在一个很短的时间内快速丧失了98.7%的成员个体,降低到原有数量的1.3%,这是一个非常强烈的冲击,与目前许多濒危物种中观察到的群体数量变化现象一致。人类祖先曾经濒临灭绝的结论,不依赖于分子钟假设。”李海鹏说。
他认为,当时如果人类祖先没有任何实际行动,不做出任何改变,任由群体数量快速衰减,必然是全员绝灭的结果。只有紧密团结在一起,更加有效、公平地获取并分配极为有限的食物,才能够使得我们的祖先,在长达11.7万年的时间里渡过难关。
除了文化上和相互合作方面的改变,生存压力也让人类祖先产生许多改进性的进化。例如,脑容量的增加、两条染色体的融合、新的古人类物种形成等。此外,人类控制火的早期考古记录,与人类祖先种群开始快速恢复的时间也非常接近,或许也对恢复群体大小有着重要作用。
“人类自古就是命运共同体,面对严酷的生存环境,我们的祖先团结应对,才有了今天人类在地球上的生命繁华。”李海鹏说,“今天,我们面对严峻的极端气候和纷繁复杂的纷争,我们更应该回归到人类的本源,秉持人类命运共同体理念,团结协助、共同发展,才能更好地在地球上世代繁衍、生生不息。”
美国南佛罗里达大学人类遗传学家刘晓明教授,西湖大学统计遗传学实验室负责人、生命科学学院杨剑教授等专家认为,人类在93万年前遭遇“群体瓶颈”这一里程碑事件,对于人类进化具有重要影响,可能决定了现代人类许多关键表型的形成。人类祖先在这一远古时期群体数量的急剧衰减,还降低了65.85%现代人群的遗传多样性,也对人类生命和健康产生了深远影响。这是一个“新理论带来新发现”的研究典范。(记者 张建松)