在现代DNA中发现古代人类的痕迹!
在深度学习技术的帮助下,古人类学家发现了人类家谱上丢失已久的分支证据。深度学习技术能帮助古生物学家和遗传学家寻找古人类的痕迹吗?7万年前,当现代人第一次走出非洲时,至少有两个已经灭绝的相关种群在欧亚大陆等候着他们。这两个相关种群就是古代人类尼安德特人和丹尼索瓦人,而后古代人类与早期的现代人杂交,现今的非洲后裔基因组还存留着古代人类DNA片段。越来越多的迹象表明,这段 历史 远比我们了解到的精彩。一个研究小组在《自然》(Nature)上报道称:他们在西伯利亚的一个洞穴中发现了一块属于人类杂交后代的骨头碎片,这一后代的母亲是尼安德特人,父亲是丹尼索瓦人,这块骨头碎片是第一代人类杂交的第一个化石证据。
不幸的是,类似的化石十分罕见,例如对丹尼索瓦人的了解基于从一根指骨中提取的DNA。虽然那些来自早期杂交群体的结合以及其他祖先结合很容易被发现,但当涉及到物理证据时,它们可能难以求证。它们出现过的线索可能只存在于某些人的DNA中,即便如此,它们也可能比尼安德特人和丹尼索瓦人的基因更微妙。统计模型帮助科学家在没有化石数据的情况下推断出这些种群的存:例如2013的古人类和现代人基因变异模式表明,一个未知的人类种群与丹尼索瓦人(或他们的祖先)进行了杂交。但专家们认为,这些方法也不可避免地忽视了许多细节。
还有谁对现今人类的基因组做出了贡献?这些种群长什么样子?它们生活在哪里?它们与其他人类物种互动和交配的频率是多少?发表在《自然通讯》(Nature Communications)上的一篇论文中,研究人员展示了深度学习技术的潜力,这种技术可以帮助填补一些缺失部分,填补的部分专家甚至可能还没有意识到。他们通过深入研究,挑选出了另一个种群的存在证据:欧亚大陆上一个未知的人类祖先,它可能是尼安德特人和丹尼索瓦人的混血,也可能是丹尼索瓦人的亲戚。这项研究工作指出了人工智能在古生物学中的未来用途,它不仅能识别不可预见的痕迹,还能揭示出我们在进化过程中的缺失部分。
目前统计方法涉及同时检测4个基因组的共同特征,这是对相似性的测试,但不一定是对实际祖先的测试;因为很多不同的方法都可以解释它揭示的少量基因混合物。例如这些分析可能表明,现代欧洲人与尼安德特人的基因组有某些共同特征,但与现代非洲人不同,然而这并不意味着这些基因来自尼安德特人与欧洲祖先的杂交。后者可能与一个与尼安德特人关系密切的种群繁殖,而不是尼安德特人本身。因为缺乏物理证据来表明这些古老的假定基因变异来源于何时、何地以及如何生活的种群,所以很难说在众多的推测祖先中,明确指出是哪一个。
威斯康星大学麦迪逊分校(University of Wisconsin-Madison)的古人类学家约翰·霍克斯(John Hawks)说:这项技术简单而强大,但在理解进化论方面还有很多问题没有解决。深度学习方法试图解释基因流动的水平,虽然基因流动水平相对于统计方法来说太小了,但它提供了更广泛、更复杂的模型来解释。通过训练,神经网络可以学习在基因组数据中根据最可能产生它们的人口 历史 对各种模式进行分类,而不需要被告知如何建立这些联系。
深度学习技术的使用可以发现研究人员没有怀疑过的古人类痕迹。首先,我们没有任何理由认为尼安德特人、丹尼索瓦人和现代人是人类 历史 脉络中仅有的三个种群。根据霍克斯的说法,这样的种群可能有几十个。纽约州立大学石溪分校(Stony Brook University)人类学家贾森·刘易斯(Jason Lewis)赞同这种观点并表示:我们的想象力一直受到限制,因为我们总是在关注活着的人,或者在欧洲、非洲和西亚发现的化石。深度学习技术以一种奇怪的方式重新聚焦这些可能性,这种方法不再受我们想象力的限制。
深度学习似乎不太可能解决古生物学家的问题,因为这种方法通常需要大量的训练数据。以其最常见的图像分类器为例,当专家训练一个模型识别猫的图像时,专家有成千上万张可以训练的,并且专家本身知道它是否有效,因为他知道猫应该长什么样。由于缺乏相关的人类学和古生物学数据,想要利用深度学习技术的研究人员不得不通过创造自己的数据来让它变得更聪明。巴塞罗那国家基因组分析中心(National Center of Genomic Analysis)的研究员奥斯卡·劳(Oscar Lao)说:我们在玩肮脏的把戏,能够使用无限数量的数据来训练深度学习引擎,因为我们使用的是模拟。
研究人员根据不同的人口统计细节组合生成了成千上万的模拟进化史:祖先人口的数量,大小,当他们彼此分离时的混血率等等。从这些模拟的 历史 中,科学家们为现代人生成了大量的模拟基因组。他们对这些基因组进行了深度学习算法的训练,使其了解哪种进化模型最有可能产生给定的遗传模式。然后,研究小组将人工智能释放,以推断出最符合实际基因组数据的 历史 。最终,该系统得出结论,一个以前未被确认的人类群体也对亚洲后裔的祖先有所贡献。从所涉及的基因模式来看,这些人本身可能要么是30万年前丹尼索瓦人和尼安德特人杂交产生的一个独特种群
要么是在那之后不久从丹尼索瓦人后裔中进化而来的一个群体。这并不是深度学习第一次被这样使用,该领域的一些实验室已经在应用类似方法来解决进化研究的其他线索。俄勒冈大学(University of Oregon)的安德鲁•科恩(Andrew Kern)领导的一个研究小组,利用基于模拟的方法和机器学习技术,对包括人类在内的物种如何进化的各种模型进行了区分。发现进化所青睐的大多数适应并不依赖于种群中有益的新突变的出现,而是依赖于已经存在的遗传变异的扩展,将深度学习应用于这些新问题正产生令人兴奋的结果。
存在一些问题,首先、如果实际的人类进化史与深度学习方法训练的模拟模型不相同,那么这项技术将产生错误的结果。这是科恩和其他人一直在努力解决的问题,为了提高准确性,还有很多工作要做。普林斯顿大学(Princeton University)生态学家和进化生物学家约书亚·阿基(Joshua Akey)说:我认为人工智能在基因组学方面的应用被过度夸大了。深度学习技术是一种奇妙的新工具,但它只是一种方法,这并不能解决我们想要了解人类进化中的所有谜团和复杂性。
一些专家甚至持怀疑态度,哈佛大学(Harvard University)和皮博迪博物馆(Peabody Museum)的古生物学家戴维·皮尔比姆(David Pilbeam)在一封电子邮件中写道:我的判断是,除了经过深思熟虑的、智能的、非人工的分析之外,数据的密度和质量并不理想。然而在其他古生物学家和遗传学家看来,这是一个很好的进步,可以用来预测未来可能的化石发现和人类几千年前应该存在的遗传变异。我认为深入学习真的会促进群体遗传学,对于我们可以访问数据但不能访问生成数据过程的其他字段,情况可能也是如此。
大约在科恩和其他种群遗传学家和进化生物学家开发基于模拟的人工智能技术来解决问题的同时,物理学家也在研究如何筛选大型强子对撞机和其他粒子加速器产生的海量数据,地质研究和地震预测方法也开始受益于深度学习方法。麻省理工学院和哈佛大学布罗德研究所(Broad Institute of the Massachusetts Institute of Technology)的计算生物学家尼克·帕特森(Nick Patterson)说:我真的不知道会发生什么,但有新方法出现总是好的。它如果能很好地回答我们的问题,我们会尽所能发展它!
博科园-科学科普|参考期刊文献: 《natural》,《Nature Communication》
文: Jordana Cepelewicz/Quanta magazine/Quanta Newsletter
DOI: 101038/s41586-018-0455-x
DOI: 101038/nature12886
DOI: 101038/s41467-018-08089-7
博科园-传递宇宙科学之美
专家后面相信这个村民的话,因为这个村民拿出来的家谱被证实确实是清末民初时期的家谱,而且村民说的话都有理有据,所以专家肯定了这个村民的话。
这位村民说自己是闯王李自成的后代,其实刚开始他说自己是君王后代的时候,很多人都表示很震惊,因为据民间资料记载,李自成并没有留下后代。直到这位村民拿出来他的家谱,才让所有人静下心来思考这件事情。
专家专门去鉴定这个家谱的真假,具体时间虽然不能确定,但是大概的时间确实是吻合史实的。其实说起李自成还是比较可惜的,这个人确实有一定的军事才能,也有着将军该有的熊子野心,做事不拖泥带水,所以他能够从一个普通的农民做到闯王的位置上。
但是让人惋惜的是,虽然他灭了明朝,但是后来却没有留住民心,不顾百姓的生活,开始沉迷享乐,自轻自贱,所以最后他也没有能够成功。
大家都以为李自成失败以后就去世了,但是根据这个农民的说法,当年李自成在离开北京以后,他成功躲过很多人的追杀,每一次他都是那么幸运。所以李自成和自己的哥哥生活在一起,为了避免落人口实,哥哥还把自己的孩子过继给李自成,从此李自成也算有了自己的后代。
在证据和种种说法面前,专家自然会选择相信。毕竟民间很多传言还是没有真凭实据。
孔子生于公元前551年,孔子身后,四代单传,自第八代起逐渐繁衍,迄今已历2500多年,子孙遍布全球。根据最近续修孔子世家谱的统计数据显示,孔子的后裔以山东曲阜为中心,遍及中国及海外,将近300万人。中国内地的孔子后裔约250万到260万人,以曲阜为居住中心。海外的孔子后裔以韩国的8万人最多,其次是美国、马来西亚、新加坡等地,居住在中国台湾的孔子后裔也有2000人左右。
记者从中科院遗传研究所的专家处得知,人体细胞当中的DNA不单单能决定眼珠和皮肤的颜色,而且还留下了我们祖先的信息。一个孩子的基因当中包含着父亲和母亲双方的遗传信息,但是其中只有两个部分保存着相对纯粹的父系或者母系遗传信息:Y染色体穴由父亲传给儿子雪,线粒体DNA穴由母亲传给儿女雪,Y染色体是男性特有的,拥有相同Y染色体的男性必定源自同一祖先。在进化中,Y染色体上发生的突变会保留下来,而且会传递到男性后代。这些信息是该家族的一个宗族标记,找到这些遗传标记,不仅可以得到自己父系或母系的相关资料,而且还可以知道自己的“老祖宗”是谁。
受英国一则报道的启发,有中国专家近日表示,可以借助DNA鉴定的方法,为孔子后裔验明正身。同时,这也使得山东曲阜孔氏族谱修订工作得以加快进行。
本报讯大陆孔子“准后人”如今正希望借助DNA鉴定技术来确认自己的血缘。
孔氏族谱金光缭绕
北京《京华时报》13日报道,按照孔府家规,孔氏族谱有“六十年一大修,三十年一小修”的定约。山东曲阜孔府上一次修订孔氏家谱是在20世纪30年代,为此,1996年5月,经孔子第77代嫡孙孔德成同意,开始进行孔子家谱续修筹备工作。
历史上,孔子的家谱一共进行过四次大规模的修订,这次是第五次,也是规模最大的一次。
山东曲阜孔子家谱修谱协会编辑孔德威说,由于孔子的后人散落于全国各地及海外,他们只负责国内部分家谱的修订,海外的孔子后裔由设在香港的“孔子世家谱续修工作协会”负责收集。
孔德威说,家谱是记载同宗共祖的血缘集团世系人物的历史图籍,它与方志、正史构成了民族历史大厦的三大支柱,是中国珍贵文化遗产的一部分,同时对海内外华人寻根认祖,增强民族凝聚力也有着重要意义。
后代子孙拟鉴血统
《北京晨报》13日报道,在修谱的过程中,调查核实用去了大部分的时间。上世纪30年代修订的《孔子世家谱》在这个过程中起到了巨大的作用。有些孔氏后人能够拿出支脉家谱来,而这些家谱又能和《孔子世家谱》对上,那么,这一脉孔子后人就能比较全地收入新修的家谱。而有些孔氏后人想入谱,却说不出他属于哪个谱支,甚至连辈分都不知道,这就给入谱工作造成了很大的麻烦。
英国《泰晤士报》此前曾报道,英国“牛津祖先”公司通过DNA对比测试发现,现年48岁的英国移民后裔、美国会计学教授汤姆·鲁宾逊的Y染色体与成吉思汗的“精确匹配”。鲁宾逊被确认为成吉思汗迄今为止第一位在欧美发现的男性后人。正是这一消息给孔子“准后人”们提供了灵感。
对此,中科院遗传研究所的专家支招儿,那些既没有支谱又没有辈分、却想入谱的孔子后人,只要提取体内DNA进行检测就能确定正身。根据对一些孔姓人士的采访,他们表示,如果经济允许,会考虑通过DNA检测来验证自己是否为孔子后人。
那么,如何获得孔子的DNA样本呢?有关专家表示,只要取得孔子一个嫡系后人的DNA即可。技术上已经不存在问题,关键是做这种检测花费较高,很多人想通过DNA检测来证明自己确是孔子后人,却承担不起每例检测人民币千元以上的费用。
根据最近续修孔子世家谱的统计数据显示,孔子的后裔以山东曲阜为中心,遍及中国及海外,将近300万人。中国内地的孔子后裔约250万到260万人,以曲阜为居住中心。海外的孔子后裔以韩国的8万人最多,其次是美国、马来西亚、新加坡等地,居住在台湾的孔子后裔也有2000人左右。
2009年,河南安阳对外宣布发现曹操墓,此消息一出即引发轰动,亦引发争议。随后,复旦大学人类遗传学实验室宣布,拟用DNA技术开展对曹操家族DNA的研究。曹操本是生活在2000年前的历史人物,寻找他的DNA似乎遥不可及。
要把曹操后人与2000年前的曹操进行“亲子鉴定”,首先需要的是可靠的样本。课题组李辉教授告诉记者,从2009年起,专家组在全国各地采集了79个曹姓家族的280名男性和446个包括夏侯、操等姓氏男性志愿者的静脉血样本,最终样本总量超过1000例。
随后,课题组进一步梳理全国258个曹姓家谱,筛选出8支持有家谱、经过史料分析有一定可信性的曹氏族群,再对他们的DNA进行检测,最终发现其中6个家族的祖先交汇点在1800年至2000年前――这正是曹操生活的年代。
“这些家族共同检出了一个非常罕见的染色体类型,这个比例在全国人口只占到5%左右。”李辉说,这也就意味着他们假冒的可能性只有千万分之三,“因此法医学上可认定他们是曹操的后代。”
课题组透露,在确认曹操后代的同时,他们还用同样方法验证了汉代丞相曹参的家族基因与曹操家族基因没有关系,从而证明曹操是曹参后人说法有误;同时对民间传说曹姓是曹操后代避祸改姓而来、曹操是夏侯氏抱养而来等说法,研究证明曹操家族与这两个姓基因没有明确遗传关系、家族基因不一致,因此说法也不准确。 通过成功反推出曹操家族DNA,课题组破解了曹操部分身世之迷;而曹操家族之迷,也随着研究的深入,慢慢揭开谜底:
2011年,复旦课题组来到曹氏宗族墓所在地――安徽亳州,并从上世纪70年代从曹氏宗族木“元宝坑一号墓”出土的文物中找到两颗牙齿,“经过现场挖掘人的口述和墓内中央位置的铭文等,最终确定两个牙齿均来源于曹操叔祖父――河间相曹鼎。”
有了数千年前曹操叔祖父的牙齿,通过古DNA测试,隐藏在这颗牙齿中的时空记忆也逐渐展现。
根据现代基因和古DNA的双重验证,课题组得出最终结论――100%确定曹操家族DNA。通过比对,安徽亳州的曹操祖辈墓葬元宝坑1号墓的遗骨与现代曹操后人紧密关联;夏侯氏、曹参后人都不是该类型。故此,课题组认为曹操之父来自家族内部过继,该家族并非曹参本族。
记者了解到,至今找到的曹操后人有9支,分别来自安徽绩溪、安徽舒城、安徽亳州、江苏海门、广东徐闻、江苏盐城、山东乳山、辽宁东港、辽宁铁岭,“这一课题研究第一次从基因层面验证了许多同姓人群在千百年前确实是一家。
爷爷与孙子的基因DNA不完全相同。
父母和子女DNA吻合度为1/2,即子女的一半DNA来自父亲,父亲的一半DNA来自爷爷,理论上爷爷和孙子的DNA吻合度为1/4,但是这仅仅是理论上,有可能父亲给孙子的DNA来自奶奶,即实际上爷爷和孙子的DNA吻合度为 0 到 1/2 (正态分布)。
在现代DNA中发现古代人类的痕迹!
本文2023-10-01 13:55:07发表“资讯”栏目。
本文链接:https://www.lezaizhuan.com/article/148779.html