像乔布斯那样做一个基因组测序难吗

像乔布斯那样做一个基因组测序难吗
基因组测序?  不少人对这个姓名还有些生疏,但早在30多年前,人类基因组测序方案就现已成为破译人类遗传暗码的大科学工程,并与曼哈顿原子弹方案、阿波罗登月方案并称为“20世纪人类三大科学方案”。  所谓基因组测序,便是一种新式基因检测技能,可以从血液或唾液中剖析测定基因全序列,确定个人病变基因,提早防备和医治。多年前,苹果公司创始人史蒂夫·乔布斯在确诊胰腺癌后,曾花费10万美元进行个人基因组测序,引发大众重视。  现在科技开展一日千里,完结一个人的全基因组测序,现已是一般实验室乃至家庭都可以负担得起的“平常事”。以当下炽热的第三代测序为例,完结个人全基因组测序仅需1天时刻,有的费用现已低于5万元。  不过,第三代测序技能也面临着一个为难窘境:要完结这样数据规划的全基因组拼装剖析,需求耗费50万个CPU小时,只能在超大计算机集群上进行。这种情况下,一起对很多个别的全基因组进行拼装剖析,是不可思议的。  以全基因组拼装办法对集体进行测序剖析,成为生物和医学研讨的趋势。生物信息学范畴的科学家们,也致力于改动这种数据产出速度高于数据剖析速度的为难情况,不断开宣布更高效的拼装剖析算法。  现在,中国农业科学院农业基因组研讨所博士阮珏与美国哈佛大学医学院博士李恒协作,研宣布第一个可以跟上基因组测序发生速度的拼装算法——Wtdbg。  世界学术期刊《天然—办法学》(Nature Methods)近来刊发了这一效果的论文,其间说到,这一算法极大进步三代测序数据的剖析功率,与本年4月科学家研制的Flye算法比较,剖析速度提升了5倍,并初次将测序数据剖析时刻降低到少于测序数据产出时刻。  据阮珏介绍,Wtdbg算法的开发得益于一个新的拼装图理论的提出,将测序数据切分为固定长度的短串,再从短串构建出的图上康复出全基因组序列。  “因为第二代测序错误率低,大部分短串是正确的,相同的短串间可以运用德布鲁因图的原理兼并起来构成拼装图。”阮珏说,突破性的办法根据突破性的理论基础。  从2013年开端,阮珏和李恒着手处理第三代测序拼装的问题,随后在德布鲁因图基础上,规划出一个新的拼装图理论——含糊布鲁因图。  “咱们从头界说了‘短串’,新规划的含糊布鲁因图可以忍受高噪声数据,并随后对生成拼装图与康复基因组序列做了很多相应的重构,使其兼具高功率和高容错的长处。”阮珏说。  2016年,这一研讨效果开端对所有人免费敞开运用,不只被几十篇学术论文引证,还被国内多家基因测序剖析公司作为首要拼装剖析东西,并且在2019年世界大学生超算比赛中做为功能测验赛题。  阮珏说,这一研讨效果标明我国在基因组算法范畴具有了引领世界的实力,也代表了我国科技开展的软实力。有了这个更快的全基因组拼装办法,也将有更多的人从中获益,比方,像史蒂夫·乔布斯那样做一个基因组测序。(记者 邱晨辉)