上海交通大学创造全球最快全基因组序列拼接速度

发布时间:2016-10-10
  在精准医学的框架下,每年产生的全基因组数据会大量增长,可达每年数十万人。相应的在转化医学应用领域,数据分析速度将会成为瓶颈,因此急需高效稳定快速的基因组分析技术。

  上海交大-耶鲁大学联合生物统计中心与美国Sentieon公司合作,在2016年10月2日首次在一小时之内完成在通用平台上的全基因组拼接。使用5台服务器,系统可以在57分钟完成拼接。而使用16台服务器,达到了22分钟完成拼接,是目前有据可查的世界纪录。所有测试是在转化医学国家重大科技基础设施(上海)的通用计算平台上完成。测试流程是在30X WGS NA12878 进行,从FASTQ 到 VCF,完整实现了broad institute 建议的最佳规范工作流程(best practice workflow)。

  上海交大-耶鲁大学联合生物统计中心,由上海交通大学和耶鲁大学根据双边协议共建,主要面向生命医学领域发展中的生物医学信息处理的瓶颈问题,引进耶鲁大学高层次国际科研团队,同时建设与国际水平对接的国内研究团队,为生命医学发展,特别是转化医学、精准医学发展过程中的生物医学大数据处理提供创新方法和技术解决方案,并引领该领域的发展。