基于CRISPR/Case9全基因组敲除文库筛选功能基因

栏目：资讯发布：2023-10-22浏览：4收藏

基于CRISPR/Case9全基因组敲除文库筛选功能基因,第1张

1 文库构建：针对某个物种，每个基因设计3个或以上的sgRNA，高通量合成sgRNA，然后把合成的sgRNA克隆到慢病毒载体中。

2 慢病毒转导：包装GeCKO慢病毒文库，并以低MOI（一般标准<03）感染靶细胞，保证一个病毒颗粒感染一个细胞，筛选同时表达sgRNA和Cas9的细胞；每个细胞都只会敲除自身携带的sgRNA对应的一个基因，细胞文库中包含的细胞的数量一般为细胞文库中全部sgRNA数量的100-1000倍。

3 表型筛选：将全基因组敲除细胞库分成两份，其中一份作为实验组施加筛选压力，如：病毒侵染，药物治疗等；另一份作为对照组。根据耐药性、增殖能力、存活能力等表型筛选细胞。

4 候选基因的分析：将实验组和对照组的细胞分别抽提基因组，PCR扩增sgRNA片段，高通量测序，并进行生物信息学分析。

根据筛选目的的不同，分为阳性筛选和阴性筛选。阳性筛选是对已成功整合sgRNA的细胞文库施加一定的筛选压力，仅使少数目的表型的细胞能够存活，达到富集关键基因的目的。阴性筛选与之相反，存活的细胞并不是目的表型细胞，需要比较不同时间点sgRNA的丰度找出差异sgRNA来确定关键基因，阴性筛选可以鉴定出引起细胞某些功能缺失的基因，如筛选时间较长，可以筛选到细胞生存所必需的基因。

个人理解：阳性、阴性筛选或者正向、负向筛选听起来容易混淆，其实在英文中就2个词，positive selection和negative selection，无论怎么选择，最后都是看sgRNA的计数情况，然后根据实验目的确定候选基因。如果最后选出的细胞内富集的sgRNA所靶向的基因就是我们要的目的基因，那么这种选择我们称其为positive selection。相反，如果最后富集的sgRNA并不是我们实验想要的，我们通过比较不同时间点的sgRNA变化进而推断候选基因，这样的选择称之为negative selection。举个例子，我们要筛选细胞生长的必需基因，如果把这个基因敲除了（这个基因由其对应的sgRNA作为标记，每个细胞内都敲除了一个基因），那么细胞肯定不能存活了，对应的sgRNA肯定也不会富集。所以存活的细胞意味着没有敲除必需基因，随着细胞的增值，整合到其基因组上的sgRNA大量富集，我们最终测到了这些sgRNA，但其靶向的基因敲除了并不影响细胞生长，所以这些基因不是目的基因。因此我们比较不同时间点sgRNA的消耗情况，那些sgRNA明显减少的，其靶向的基因才是必需基因。

那么什么情况下是positive selection？我们知道，这两者是反的，所以假如我们想筛选细胞生长的抑制基因（和必需基因相反），这种情况就属于positive selection（和negative selection相反）。如果敲除了抑制基因，显然细胞可以正常增值，抑制基因对应的sgRNA也能不断富集，这两个方向是相同的。

如果富集sgRNA靶向的基因就是目的候选基因，则为positive selection，否则为negative selection。

①筛选炭疽毒素使细胞中毒所必需的宿主基因

由于毒素的强选择性压力，大多数细胞都会死亡，只有少量的细胞存活和增殖，这些存活的细胞内富集了大量sgRNA，而这些sgRNA靶向的基因是被敲除的，这些基因就是使细胞中毒所必需的宿主基因，正是由于这些目的基因被敲除，细胞才得以存活。

Zhou等（2014）利用敲除文库筛选，在初步确定的291个基因中成功鉴定出炭疽和白喉毒素致细胞中毒所必需的宿主基因，并通过功能验证得到了证实。

②筛选药物敏感基因

细胞若含有药物敏感基因将失去抗药性。若敲除了敏感基因，则可以存活，最终富集的sgRNA正是实验目的需要的sgRNA。

①鉴定细胞生长必需的基因

一个时间段内的连续生长，减少的细胞中往往携带靶向细胞增殖所必需基因的sgRNA。这些基因可以通过比较每个sgRNA的相对频率来找到。阴性筛选的一个重要应用是鉴定癌细胞生长所必需的基因，而这些基因可能成为治疗癌症的新靶标。

2014年，Shalem等首次利用GeCKO文库鉴定出人黑色素瘤细胞和多能干细胞存活的关键基因，研究结果与RNAi筛选结果高度一致。

②筛选药物抗性基因

若敲除了抗药性基因，细胞在药物压力下不能存活，存活的细胞内并没有敲除目的基因，最终富集的sgRNA不是目的sgRNA，需要通过与对照组比较sgRNA消耗情况（或不同时间点的sgRNA丰度）来确定目的基因。

1 测序数据质控，去除低质量的reads，使用clean reads data进行后续分析。

2比对分析：将测序数据中拼接reads与sgRNA 文库序列比对，并对sgRNA 文库中完全匹配的sgRNA 数目、丢失sgRNA、基尼指数等进行统计。

•Reads: Total number reads in the fastq file (Recommended: 100~300 times the number of sgRNAs)

• Mapped: Reads that can be mapped to gRNA library

• Percentage: The percentage of mapped reads (Recommended: at least 60%)

• TotalsgRNAs: The number of sgRNAs in the library

• ZeroCounts: The number of sgRNA with 0 read counts(Recommended: no more than 1%)

• GiniIndex: The Gini Index of the read count distribution Gini index can be used to measure the evenness of the read counts, and a smaller value means a more even distribution of the read counts (Recommended: around 01 for plasmid or initial state samples, and around 02-03 for negative selection samples )

3sgRNA 及基因的read counts 统计

CRISPR全基因组筛选的主要内容便是统计sgRNA在不同样本间的消耗和富集情况，进而推断候选基因。

4主成分分析和样品相关性聚类分析

有助于考察样本间的相似性和差异，评估实验设计的合理性以及对后续数据分析起到一定指导作用。对于有重复的实验来说，样本同一处理不同重复应该尽可能聚在一起，若存在个别重复样本明显偏离，可以考虑剔除该样本。样品聚类还可用于判断数据处理中是否剔除了批次效应。

5候选基因筛选

MAGeCK-RRA算法根据测序结果中sgRNA的富集情况产生对应基因位点的RRA得分，RRA得分代表基因的必要性，RRA得分越小表明其重要性越高。MAGeCK返回RRA lo value（neg|score、pos|score）检验统计显著性，并据此对基因进行了排序，按照实验目的的不同，候选基因筛选可分为正向筛选和负向筛选，筛选指标一般参考lfc（log2 fold change）和FDR（adjusted-pvalue），比如：根据lfc<-2且FDR<005进行负向筛选，lfc>2且FDR<005进行正向筛选。

6GSEA富集分析

对CRISPR筛选得到的候选基因进行富集分析以了解基因的更多功能，同时也可以对CRISPR筛选结果进行验证，以便对潜在候选基因开展进一步研究。

参考文献：

[1]刘燕飞基于CRISPR/Cas9技术的HeLa细胞全基因组敲除文库的建立及初步应用[D]中国农业科学院,2020

[2]Shalem,Ophir, et al “Genome-Scale CRISPR-Cas9 Knockout Screening in Human Cells”Science, vol 343, no 6166, 2014, pp 84–87

[3]Zhou, Yuexin, et al “High-Throughput Screening of a CRISPR/Cas9 Library for Functional Genomics in Human Cells” Nature, vol 509, no 7501, 2014, pp 487–491

[4]Kweon, Jiyeon, and Yongsub Kim “High-Throughput Genetic Screens Using CRISPR-Cas9 System” Archives of Pharmacal Research, vol 41, no 9, 2018, pp 875–884

[5]Li, Wei, et al “Quality Control, Modeling, and Visualization of CRISPR Screens with MAGeCK-VISPR” Genome Biology, vol 16, no 1, 2015, pp 281–281

[6]Wang, Binbin, et al “Integrative Analysis of Pooled CRISPR Genetic Screens Using MAGeCKFlute” Nature Protocols, vol 14, no 3, 2019, pp 756–780

科学家们公布了有史以来最大的人类家谱 ，这是一个由3600多个个体基因组序列编织而成的共同祖先，可以追溯到10多万年以前，为我们这个物种的深邃过去和复杂现在提供了一个前所未有的一瞥。

这个巨大的家谱是由现有的数据集拼接而成的，包含了来自世界各地的现代遗传信息，以及尼安德特人和丹尼索瓦人等已灭绝人类亲属的样本。科学家能够从这个综合框架中确认人类历史上的重大事件，如我们的物种从非洲迁出，同时也遇到了关于过去人口的意外，需要更多的研究来了解。

周四发表在《科学》杂志上的一项研究称，其结果是一个"现代和古代人类的统一谱系"，显示了计算方法"恢复个体和种群之间的关系以及识别古代样本后代"的力量。尽管这项特殊的研究集中在人类身上，但该团队指出，同样的方法可以用于几乎任何其他物种。这项工作中提出的统一谱系，代表了建立对人类基因组多样性全面理解的基础，包括现代和古代样本，这使得应用范围从改善基因组解释到破译我们最早起源。

基因组是如何制造一个生物体的蓝图，每个人的细胞中都带有一个独特的版本。这些基因单元包含大量的异质信息，这些信息通常由不同的技术产生，长期以来，这给希望结合各种数据集的科学家带来了计算上的障碍。研究的创新之一是一种新的算法，可以更有效地将所有这些信息整理成一个单一的家谱或树状序列。通过揭示延伸到我们史前深处的人类个体和种群之间的关系，该方法绘制出了我们人类家族随着时间推移的231亿条祖先世系。

这些发现证实了从考古学证据中得知的许多迁移时间，但数据中也有一些意想不到的影响。例如，新的家族树暗示人类首次到达北美是在56000年前，比目前估计的时间早得多，并指出人类迁移到巴布亚新几内亚的时间比该地区最早的居住证据早了整整10万年。这些诱人的结果并不一定意味着这些迁移的时间线应该被推后，但它们确实提供了一个引人注目的研究途径，向前推进。

为此，该团队希望继续为这棵史无前例的家谱添加分支。虽然这个项目的初始版本包含了几千个人的遗传信息，但研究人员说，这种方法在未来的迭代中可能会容纳数百万个基因组，为我们庞大的人类家族提供一个不断发展的肖像。

北美洞穴里的收获

在美国俄勒冈州古老的佩斯利洞穴里，考古学家们常常会有不错的收获。在洞里的沉积物中，埋藏着大量的石器矛尖、动物骨骼、植物纤维、绳索和兽皮。放射性碳年代测试法表明，它们的年代都非常久远了。2014年，一位名叫艾斯克·威勒斯列夫的丹麦科学家慕名而来，希望在佩斯利洞穴找到一些古骆驼或者古野马的遗骸化石。他正在研究一个在“圈外人士”看来异常深奥难懂的课题——测序远古生物的DNA，即，用科学的方法将遗传物质从有着成千上万年历史的样本中分离出来。

俄勒冈州立大学的丹尼斯·詹金斯教授就是一位“圈外人士”，他作为佩斯利洞穴考古项目的负责人，起初并不太看好威勒斯列夫的工作。詹金斯说道：“我觉得，他（威勒斯列夫）可以来这里考察并撰写论文，但如果他的研究让我不爽，那么我不会允许他带走任何样品。”但最终，威勒斯列夫不仅为哥本哈根大学的实验室带回了古骆驼和古野马的骨头，另外还带回了14块人类粪便的化石。詹金斯后来承认，威勒斯列夫的考古结果让他惊掉了下巴，因为威勒斯列夫从6块粪便化石中提取出了线粒体DNA。这些线粒体DNA显示出粪便的主人属于单倍群A2和B2——本土印第安人的两个主要遗传谱系的起点，它们的年代甚至比北美已知最古老的克洛维斯人还要早1000多年。

很显然，威勒斯列夫的发现会重新校准人们对美洲大陆早期原住居民的认识，这已经不是威勒斯列夫第一次用古代基因重写人类历史了。他已经测序过许多古人类的基因，比如格林兰岛上一个4000岁的古爱斯基摩人、西伯利亚冻土的一个24000岁高龄的小孩以及美国蒙大拿州的一个12000多岁的婴儿。在短短几年里，威勒斯列夫的这些研究解开了人类早期历史中的许多秘密。

探险西伯利亚

威勒斯列夫并不是第一个试图分析古生物遗传物质的人，早在20世纪80年代，这种开创性的研究已经应用在尼安德特人和古埃及木乃伊身上了。但是，威勒斯列夫很小的时候就对远古历史有着一种异常的痴迷，这使他能够在这个竞争愈发激烈的研究领域长期处在前沿的位置。

威勒斯列夫出生于哥本哈根附近的郊区，孩童时期，他常常随着家人到古老森林中做家庭旅行。登山、滑雪、伐木等活动使他对北极探险养成了兴趣，而古代狩猎者的传说又让他迷上了生物学和历史学。威勒斯列夫决定，等到差不多的年龄，自己一定要到更广阔的冻土——西伯利亚探险一番。

进入大学后，威勒斯列夫觉得时机成熟了，他和双胞胎弟弟一起划着一叶扁舟，在西伯利亚的河网旅行，在河床的冻土地带，他见到了一些远古巨型动物的遗骸，比如猛犸象。威勒斯列夫听说，在西伯利亚冻原的北部，生存着神秘的尤卡吉尔人。这些人是一群北极古代人的遗族，以捕猎麋鹿和驼鹿为生，由于他们长期在世界上气候最严酷的地区生活，贫困、侵略和疾病已经将尤卡吉尔人带至了灭绝的边缘。“没人知道他们在哪里，”威勒斯列夫说道，“当时在地图上标有一些村庄，然而我却连他们的影子都没找到。”此后的几年里，威勒斯列夫沿着19世纪人类学家的脚步在西伯利亚苦苦追寻，终于，一位浑身伤疤累累的老猎人将威勒斯列夫带到了尤卡吉尔人的部落。然而，令威勒斯列夫感到有些意外的是，尤卡吉尔人并不是一个完全与世隔绝的孤立部落，事实上，他们几乎所有人的祖先都有俄罗斯人和其他族群的血统，威勒斯列夫也只找到了一个讲尤卡吉尔人当地语言的老人。

复原古人类基因

博士毕业后，威勒斯列夫开始把寻找古人类基因作为重要任务，他希望能够理清诸如尤卡吉尔人祖先的古代人的历史。

2006年，威勒斯列夫和同事来到格陵兰岛，试着从带有被猎杀痕迹的动物骸骨上寻找古代猎人残留的DNA。在一个多月的时间里，威勒斯列夫潜入格陵兰岛的地下，穿上全套防护服，以免污染样本。然而，当他们回到哥本哈根大学并对骸骨进行研究时，却失望地发现其中没有人类的DNA。幸运的是，威勒斯列夫却从另一个意想不到的途径获得了古人类的基因。早在1980年代，科学家已经在格陵兰岛找到了一束4000多年前的毛发。它被完好储存起来，却忘在了地下室。威勒斯列夫随即找到了毛发，从那束毛发中提取了人类DNA，并以强大的新技术重建了古格陵兰人的基因组。这是科学家首次复原出完整的古人类基因组。

通过这束毛发的DNA，威勒斯列夫可以推断出许多信息。比如，这簇头发来自萨卡克文明（古爱斯基摩文明的一种），它的所有者极有可能是一个健壮的男性，拥有黑色的皮肤与褐色的双眼。其中，最有趣的是这束毛发属于一个古爱斯基摩人，而且他并非格陵兰岛现在的居民——因纽特人的直系祖先。分析完此人的基因组之后，威勒斯列夫认为，古爱斯基摩人在大约5000多年前从西伯利亚离开，来到加拿大和格陵兰岛，并在那里生活了几个世纪后灭绝了。古爱斯基摩人并非如今因纽特人的祖先，他们只是被因纽特人取代了。

格陵兰岛古人类基因组给了威勒斯列夫一些新的启发。他原本认为，世界上的主要人种分布在世界不同的地区并且有十分独立的遗传历史。然而，现在他发现，这种想法也许过于简单化，早期人类的迁移历史还有许多秘密需要揭开。

测序“玛尔塔小孩”

和“蒙大拿婴儿”

在首次成功复原出古人类基因组之后，威勒斯列夫继续发表了一系列研究，从很大程度上改变了我们对人类历史的认识。人类起源于20万年前的非洲，然后一批批迁移到世界的各个角落。格陵兰岛的毛发就证明，古人类曾经从西伯利亚来到了北美，然后又穿越北美大陆来到了格陵兰岛。为了进一步理解美洲移民的历史，威勒斯列夫研究了一具埋在西伯利亚东部的古人类骸骨。

这块骸骨样本来自西伯利亚一个名叫玛尔塔的小村庄，被称作“玛尔塔小孩”。威勒斯列夫从这具遗骸中获得了高质量的DNA样本，他测出了小孩的DNA序列。分析结果表明，这个孩子生活在距今24万年之前，是个男孩，死时只有4岁。最令他吃惊的是，玛尔塔小孩染色体上的DNA序列更加符合欧洲人的特点，却完全没有找到任何东亚人特有的遗传标记。换句话说，他来自欧洲，同时并不是现代东亚人的祖先。而且，更奇怪的是，玛尔塔小孩的基因组序列和美洲人非常相似，带有大量只有美洲原住民才有的遗传特征。这个结果让威勒斯列夫大吃一惊，因为它和现有的人类学理论完全不同。

随后，威勒斯列夫来到加拿大的蒙大拿州，开始着手测序一个12600岁的婴儿的DNA。这个婴儿名叫Anzick-1，在蒙大拿的一个农场中被发现，是北美大陆有史以来发现的最古老的人类的遗骸，男婴死时约12到18个月大，他与100多件古物同葬，包括鱼叉及鹿角制的工具等，这些古物显示出，男婴遗骸属于北美洲的克洛维斯文化时期。

几十年来，考古学家曾假设北美洲的第一批原住民是克洛维斯人，他们在约13万年前于北美洲中西部和西南部留下了大量带有特色的古物。威勒斯列夫的DNA测序结果也证实了这一点，Anzick-1的基因与所有现代土著居民的基因组都显示出密切的亲戚关系，而且Anzick-1显示出自己是属于亚洲人的后裔，而非欧洲人后裔。威勒斯列夫推断，这证明克洛维斯人至少是当今80%甚至100%的本土印第安人的祖先，而且他们的祖先来自亚洲。

新的理论和新的问题

结合了“玛尔塔小孩”和“蒙大拿婴儿”的基因组，威勒斯列夫提出一种新的理论，试图解决北美洲长期以来存在的关于土著居民血统的争论。

此前已有的考古学证据表明，美洲原住民的祖先很可能是在15万年以前跨过白令海峡到达美洲大陆的。当时地球正处于冰期，海平面下降导致白令海峡出现了一个陆桥，为迁徙的古人类提供了一条临时通道。此后地球回暖，海平面上升，路桥被淹没，亚洲和美洲又被分开了，直到哥伦布发现美洲大陆才又重新联系上。但是，美国的一些考古学证据与这个理论不相符，比如，美国华盛顿州曾经挖掘出具有欧洲人特征的古人类头盖骨。于是，考古学界又有一个新的理论，认为美洲原住民是欧洲和东亚人混血的结果，但该理论认为欧洲人是跨过大西洋，从东边进入美洲大陆的。

威勒斯列夫的研究结果改进了这个新理论。“玛尔塔小孩”所属的族群虽然来自欧洲，但却为美洲原住民贡献了基因组，同时，大多数印第安人的基因组源自亚洲，但和许多东亚的古老族群又不完全一样。威勒斯列夫认为最可能的解释就是，这个玛尔塔小孩所属的族群最初从欧洲迁徙到西伯利亚，他们在这里遇到了另一支东亚族群，两者发生通婚，大量基因交流融合在一起。随后，这支新的人类族群在15万年之前跨过了白令海峡，他们才是美洲原住民的真正祖先。

然而，这里还是有一个问题没有解开——克洛维斯人是最早的美洲土著居民么？威勒斯列夫对佩斯利洞穴粪便化石的分析结果表明，化石中包含着北美大陆最古老的人类基因，距今已有14300年，其年代比克洛维斯人还早1000年。克勒斯列夫认为，克洛维斯人和佩斯利山洞的居民可能都源于第一批从亚洲迁徙来的移民，但他们在何时与何地为何变成了两个不同的族群，目前还是谜题。不过，威勒斯列夫对此并不担心，他表示，我们已经有了探寻历史和真相的新方法——测序远古DNA，这将为我们解答更多的古人类谜题。

本文源自大科技百科新说2016年第9期杂志文章、欢迎广大读者关注我们大科技的微信号：hdkj1997

多倍化（polyploidy）或全基因加倍/复制（whole genome duplication, WGD）事件是指基因组内的所有序列都发生重复，重复为生物进化提供了原始的遗传材料，使植物基因组快速重组，丢失大量基因，增加结构变异，对植物进化极其重要。

多倍体植物广泛存在于自然界中，如日常生活中的马铃薯、小麦、棉花等。多倍化事件或全基因组复制事件直接将染色体进行加倍，被认为是一种物种分化的驱动力。研究发现多倍化在有花植物进化过程中十分频繁，在现存的被子植物和种子植物分化之前，都分别发生过加倍事件，可能对花和种子的产生有重要贡献（Jiao et al, 2011）。基因组加倍为物种提供了丰盛的演化材料（图1）。被认为是提升了物种多样性、环境适应能力等（Jiao, 2018）。多倍化后的物种需要在原植物多倍化的研究对于生物进化、物种保护及遗传育种等方面都具有重要的理论指导意义及实践应用价值。

鉴定全基因组复制的方法一般可以通过以下三种：

下面我们就前两种方式进行重点介绍。

基因组共线性是基因组加倍比较直接的证据，通过比较两个基因组的序列并将共线性的区域作图展示，可以直观发现全基因组加倍的痕迹，如图2（左）苹果基因组（Daccord et al, 2017）的circos图中，可以明显染色体间大片段的共线性，表明该物种近期发生了全基因组复制。在向日葵基因组（Badouin et al, 2017）中，通过基因组自身的比对展示如图2（右），对角线为物种自身的基因和其本身的共线性。其余的点为基因组其他位置的旁系同源基因对。图中红色圆圈标注的位置，表明这两段之间具有一定的共性，为基因组加倍事件留下的痕迹。

如果物种经历过多次全基因组加倍事件，近期的加倍事件会加速早期加倍事件的基因丢失，早期的加倍事件痕迹往往越来越不明显，共线性直观上不明显，这就需要我们探索其他方式来挖掘加倍事件，这就用到了4DTv和Ks的信息。下面我们对这两种方式来进行简单的介绍。

同义突变指突变并不影响氨基酸序列，进而不会影响蛋白结构与功能。一般认为，同义突变不受自然选择，同义突变率（Ks）的计算为同义突变SNP数/同义位点数。由于同义位点突变不会引起氨基酸的变化，可以认为对编码蛋白没有影响，那么密码子同义位点的变化是完全随机的，并随时间推移累积。如果物种发生了全基因组加倍事件，现有基因组中会有一定数量的基因保留下来，这些基因在进化过程中累积的同义突变接近，计算得到的Ks值也接近，在某一个Ks值处会形成一个峰（ks peak）。如果这处Ks值的基因数目足够多，就会形成比较间的峰值，可以认为在进化过程中该处发生过全基因组加倍事件。全基因组加倍发生的时间越久远，基因丢失越多，发生的变化也要越大，形成的Ks峰越扁平，影响对全基因组加倍事件的判断。

4DTv与Ks有异曲同工之处（Tang et al, 2008），如果密码子的某个位点上任何核苷酸的改变都不影响其都编码的氨基酸，则称这个位点为4倍简并位点（fourfold degenerate site）是指共线性区段所包含的基因对的4DTV值可反映物种在进化史中的物种相对分化事件以及全基因组复制事件。4DTV指4D位点上发生颠换（嘌呤突变为嘧啶或者嘧啶突变为嘌呤）的位点所占的比例。

以辣椒基因组文章中的4DTv和**基因组文章中的Ks结果为例，解析全基因组复制事件。在辣椒基因组（Qin et al, 2014）文章中（如图3），选取了辣椒（pepper）、葡萄（grape）、土豆（potato）、番茄（tomato）进行4DTv分析。结果如下图。从图中可以看出在辣椒和葡萄分后（**线，4DTv值05处），茄科植物辣椒、土豆和番茄在分化之前共同发生了全基因组复制（图中指示WGD位置，黑线、蓝线和红线在4DTv值03处的峰值），之后辣椒和番茄分开（图中绿线，4DTv值01处）。关于4DTv如何推断全基因组加倍时间，文章中也给出了建议：在4DTv值048和01处分别为辣椒和葡萄、辣椒和番茄的物种分化时间，对应的时间点为∼89和20Mya，辣椒、番茄和土豆共有的全基因组加倍事件在4DTv值约03处，基于此可以大致推断该全基因组复制事件发生的时间约在55Mya。

在**基因组文章(Guo et al, 2018)中，选取了**（opium poppy）、耧斗菜（Aquilegia coerulea）、莲（otus）、葡萄（grape）、拟南芥（Arabidopsis）进行Ks分析，结果如图4，从Ks峰图和进化树可以看出，葡萄和**在Ks值约16处（黄线）分开，葡萄在Ks值约14处（绿线）发生了核心双子叶植物共有的全基因组三倍化事件，耧斗菜在Ks值约10-12处发生了单独的全基因组复制，由于复制时间比较久远，所以峰较为扁平，莲在Ks值约05处发生了单独的全基因组复制事件，**在Ks值约01处发生了全基因组复制，这是一个较为近期的全基因组复制事件。通过公式T=Ks/2r可以计算全基因组加倍事件发生的时间，r为核苷酸替代率，在文章中使用了698 × 10-9，计算得到的加倍时间在78百万年前。

全基因组加倍后的复制基因的命运各有不同，其保留与丢失是否有偏向性？哪些基因倾向于保留，保留基因功能是否发生变化？保留的重复基因及其对调控网络进化的影响？基因组加倍在被子植物的适应性进化中发挥的作用，如何帮助植物适应剧烈环境变化等（Wu et al, 2020），这些都是全基因组复制后续可以挖掘的内容，在此不做过多介绍。

Badouin, H, Gouzy, J, Grassa, CJ, Murat, F, Staton, SE, Cottret, L, Lelandais-Briere, C, Owens, GL, Carrere, S, Mayjonade, B, et al (2017) The sunflower genome provides insights into oil metabolism, flowering and Asterid evolution Nature 546, 148-152

Daccord, N, Celton, JM, Linsmith, G, Becker, C, Choisne, N, Schijlen, E, van de Geest, H, Bianco, L, Micheletti, D, Velasco, R, et al (2017) High-quality de novo assembly of the apple genome and methylome dynamics of early fruit development Nat Genet 49, 1099-1106

Guo, L, Winzer, T, Yang, X, Li, Y, Ning, Z, He, Z, Teodor, R, Lu, Y, Bowser, TA, Graham, IA, et al (2018) The opium poppy genome and morphinan production Science 362, 343-347Jiao, Y (2018) Double the Genome, Double the Fun: Genome Duplications in Angiosperms Mol Plant 11, 357-358

Jiao, Y, Wickett, NJ, Ayyampalayam, S, Chanderbali, AS, Landherr, L, Ralph, PE, Tomsho, LP, Hu, Y, Liang, H, Soltis, PS, et al (2011) Ancestral polyploidy in seed plants and angiosperms Nature 473, 97-100

Qin, C, Yu, C, Shen, Y, Fang, X, Chen, L, Min, J, Cheng, J, Zhao, S, Xu, M, Luo, Y, et al (2014) Whole-genome sequencing of cultivated and wild peppers provides insights into Capsicum domestication and specialization Proc Natl Acad Sci U S A 111, 5135-5140

Tang, H, Wang, X, Bowers, JE, Ming, R, Alam, M, and Paterson, AH (2008) Unraveling ancient hexaploidy through multiply-aligned angiosperm gene maps Genome Res 18, 1944-1954

Wu, S, Han, B, and Jiao, Y (2020) Genetic Contribution of Paleopolyploidy to Adaptive Evolution in Angiosperms Mol Plant 13, 59-71