脊椎动物基因组计划(VGP)和合作者在此宣布的脊椎动物的染色体级基因组组件中的最大数目(101)的所述第二数据集对完成VGP,其中包括每脊椎动物顺序一个代表种或〜260种的第1阶段。这101个基因组大多数已完成或处于组装的最后阶段,证明了VGP在利用和开发实验和计算工具以实现可扩展性方面的成功,以实现生产高质量,接近无错误且完整的染色体水平基因组组件的目标。地球上现存的所有7万种脊椎动物物种。由于物种鉴定和分类的更新,自第一次数据集以来,VGP将脊椎动物物种的数量从66,000上调。

这些基因组将有助于解决生物学,医学和保护方面的问题,包括对生命,疾病和生物多样性的研究,例如生成更完整和准确的脊椎动物家谱,破译脊椎动物染色体基因组进化,比较趋同性状的基因组学(即声乐)学习,飞行,失去肢体和水生/陆地适应),并重建所有脊椎动物和关键脊椎动物进化枝(如哺乳动物,鸟类,爬行动物,两栖动物,硬骨鱼和四足动物)的共同祖先的基因组。

VGP现在已经能够每月扩展到大约10个基因组,比自2018年9月15个基因组的第一个数据集以来每月大约1个基因组的速率增加,产量增加10倍。之前的公告确立了G10K -VGP联盟的优势和新测序技术的能力,可靠地实现高质量,接近无错误的分阶段参考基因组,这些基因组已经进一步改进,以生成更高质量的基因组组装。

几乎所有基因组都是与个别科学家或其他财团项目合作完成的,包括Wellcome Sanger研究所的25个基因组25年的脊椎动物,Bat1K基因组和B10K鸟类基因组。大多数基因组数据是在投资VGP任务的三个测序中心生成的,包括纽约洛克菲勒大学脊椎动物基因组实验室(VGL),英国Wellcome Sanger研究所和马克斯普朗克研究所(MPI)在德国德累斯顿,由马里兰州贝塞斯达国立卫生研究院的VGP组装小组主席Adam Phillippy和VGL的团队成员Olivier Fedrigo,英国剑桥大学的Richard Durbin和MPI的Gene Myers领导。VGP在DNANexus上建立了新的基因组装配管道,DNANexus是一个基于云的基因组计算平台。

这些新组件包括他们和其他人在基因组测序和组装技术中所做的改进,因为第一个数据集更好地解决了发现导致基因组组装错误的父系和母系染色体序列。这些物种中有许多已经组装了早期版本的基因组,但由于这些先前的组装过于分散且不符合VGP设定的质量指标,因此他们重新审视了VGP帮助的新的长读DNA测序和染色体组装技术。开发。

G10K主席,洛克菲勒大学教授兼霍华德休斯医学研究所研究员Erich Jarvis说:“第二组数据证明了VGP将国际集体智慧和专业知识汇集在一起​​,可以产生最高质量的基因组数据,以最低的成本,尽可能为最好的科学,为了人类和其他物种的利益“。

在这101个物种中,100个是脊椎动物,1个是无脊椎动物,是由桑格研究所25个基因组项目作为外群亲属贡献的海星。100只脊椎动物代表了77种分类顺序,这是第一次对这种完整性进行了测序,与之前的数据集中的13种相比,共增加了90种~260种第1种。这些基因组包括标志性物种,如最大的脊椎动物 – 蓝鲸,以及宽吻海豚,长尾小鹦鹉,mar猴,红腹食人鱼,大笨蛋和无颌海鳗,一种原始鱼类。

爱尔兰都柏林大学教授,Bat1K联合主任Emma Teeling表示,“我们已经完成了我们的试验研究,并对从系统发育不同的家族到染色体水平组装的六种蝙蝠物种的基因组进行了测序。这些基因组已经揭示了一些独特的与哺乳动物飞行,回声定位和非凡免疫有关的基因组适应“。

对于保护工作,这些基因组将用于帮助识别具有灭绝风险的遗传物种,保存未来的遗传信息,并帮助将它们从人类引起的第六次大灭绝中拯救出来。该数据集包括四种极度濒危物种(vaquita,欧洲鳗,Bolson龟和小锯齿),七种濒危物种(蓝鲸,灰冠鹤,绿海龟,大西洋大比目鱼,环尾狐猴,黑猩猩和金色的aronawa)和八种脆弱的物种(小鱼,棘手的滑冰,暹罗斗鱼,阿比西尼亚犀鸟,大白鲨,棱皮海龟,大西洋鳕鱼和欧洲乌龟鸽子)。

vaquita可能是这一组中最关键的。通过洛克菲勒大学VGL的Jacquelyn Mountcastle的联系,VGP与墨西哥研究人员合作,与海洋和大气管理局的Phillip Morin合作。墨西哥的小海豚不小心陷入渔网中,并且为了供应黑人野生动物市场而恢复非法捕捞濒危鱼类加速了这种下降,每年有近一半死亡。2017年的一次救援工作涉及来自9个的90名研究人员,试图捕获留在加利福尼亚湾的30个vaquitas,以拯救他们免于灭绝。不幸的是,当时捕获的一只动物在休克后很快就死亡,但她的活细胞被圣地亚哥冷冻动物园培养和冷冻,然后将其用于产生高质量的参考基因组序列。今年,莱昂纳多·迪卡普里奥(Leonardo Dicaprio)制作了一部纪录片“阴影之海”(the Sea of​​ Shadows),以纪念小城镇的困境,以帮助建立公众支持,使其免于濒临灭绝; 该纪录片包括VGP测序和组装的基因组的女性。她的染色体是高度纯合的,但初步分析表明,这是由于成千上万年的持续存在作为一个小群体,而不是最近可能加速灭绝的多样性丧失。Phillip Morin说:“vaquita基因组分析提供了一个强有力的反对遗传厄运的共同论点,这种论证已被反复提出作为反对试图拯救物种的红鲱鱼论点。” 莱昂纳多·迪卡普里奥(Leonardo Dicaprio)制作了一部纪录片“阴影之海”(the Sea of​​ Shadows),讲述了小丑的困境,以帮助建立公众支持,使其免于濒临灭绝; 该纪录片包括VGP测序和组装的基因组的女性。她的染色体是高度纯合的,但初步分析表明,这是由于成千上万年的持续存在作为一个小群体,而不是最近可能加速灭绝的多样性丧失。Phillip Morin说:“vaquita基因组分析提供了一个强有力的反对遗传厄运的共同论点,这种论证已被反复提出作为反对试图拯救物种的红鲱鱼论点。” 莱昂纳多·迪卡普里奥(Leonardo Dicaprio)制作了一部纪录片“阴影之海”(the Sea of​​ Shadows),讲述了小丑的困境,以帮助建立公众支持,使其免于濒临灭绝; 该纪录片包括VGP测序和组装的基因组的女性。她的染色体是高度纯合的,但初步分析表明,这是由于成千上万年的持续存在作为一个小群体,而不是最近可能加速灭绝的多样性丧失。Phillip Morin说:“vaquita基因组分析提供了一个强有力的反对遗传厄运的共同论点,这种论证已被反复提出作为反对试图拯救物种的红鲱鱼论点。” 该纪录片包括VGP测序和组装的基因组的女性。她的染色体是高度纯合的,但初步分析表明,这是由于成千上万年的持续存在作为一个小群体,而不是最近可能加速灭绝的多样性丧失。Phillip Morin说:“vaquita基因组分析提供了一个强有力的反对遗传厄运的共同论点,这种论证已被反复提出作为反对试图拯救物种的红鲱鱼论点。” 该纪录片包括VGP测序和组装的基因组的女性。她的染色体是高度纯合的,但初步分析表明,这是由于成千上万年的持续存在作为一个小群体,而不是最近可能加速灭绝的多样性丧失。Phillip Morin说:“vaquita基因组分析提供了一个强有力的反对遗传厄运的共同论点,这种论证已被反复提出作为反对试图拯救物种的红鲱鱼论点。”

同样,马萨诸塞大学阿默斯特分校保护基因组学和生态生理学助理教授Lisa M. Komoroske领导了为VGP为太平洋棱皮龟基因组筹集资金的工作,他说:“人口减少了90%以上这主要是由于直接收获和渔业相互作用等人类活动造成的。太平洋棱皮龟是近期受濒临灭绝的NOAA保护的八种濒临灭绝的物种之一。物种法,“Komoroske继续。“通常被称为’活恐龙’,棱皮龟是一种古老的血统,具有独特的生理适应能力,

该数据集还包括12个基于三个组件,其中父母的DNA用于分离儿童染色体的DNA序列以组装来自一个个体的两个基因组(一个来自母亲和父亲):斑胸草雀,宽吻海豚,常见的刷尾负鼠,普通mar猴,尼罗鼠,虎皮鹦鹉,鸡,布尔森龟,沙漏树蛙,斑马鱼SAT,小品种和人类。基于由NHGRI的Phillippy实验室的Sergey Koren和Arang Rhie开发的组装方法,这些基于三重组的组件在分离出亲本遗传的DNA时比非三重组件好40-60%。正在进行的新鸡三重奏组合预计将改进农业和生物医学研究,因为鸡是这些地区最常研究的禽类基因组。

这些基因组已被用于培训下一代科学家如何生产高质量的染色体水平参考组件。Arang Rhie博士在开发用于生成高质量VGP组件的计算管道方面发挥了关键作用,对国际学生进行了在线培训和监督,然后组装了101个基因组中的许多。为新手研究人员提供的这一培训机会有助于实现民主化和扩大高质量参考基因组的产生; 在未来,这个机会将使每年生成数千个基因组,以满足VGP和相关项目的雄心勃勃的目标。

新的序列存储在Genome Ark数据库中并公开提供,该数据库是由G10K联盟生成并由亚马逊托管的新的基因组数字库,并在国际公共基因组浏览和分析数据库(包括生物技术信息中心)中进行注释和显示( NCBI),欧洲生物信息学研究所的Ensembl和UCSC基因组浏览器 – UC Santa Cruz Genomics Institute的一部分 – 最近推出了24种脊椎动物组件。在101个中,有60个可以立即使用,其他的很快就可以存放,所有这些都符合G10K数据使用政策,以确保公平的数据使用和发布。

所有70,000种脊椎动物物种的序列需要大约6亿美元。我们目前专注于完成第1阶段,该阶段将通过科学家之间的众包提供所有260种脊椎动物订单的代表性参考序列,并成功地将迄今为止需要的600万美元中的480万美元投入资金(阶段1 物种的样本和资金可用性可在此处获得))。