人学研究网renxueyanjiu.com 人学研究网renxueyanjiu.com
首页 > 人类通史 > 科学 >

以癌症检测为起点,打造世界一流的权威基因数据库

2017-07-31 10:27:36来源:动脉网 已浏览人数:
基因数据的计算与解读一直都是基因检测的重要环节。在数据激增的情况下,如何更快速,更准确的进行数据分析和解读,将是基因检测领域下一个命题。

来源:动脉网

首度基因是一家专注 基因大数据的生物与IT技术相结合的公司 。公司拥有一支多年从事基因测序、分子生物学、算法开发、与大数据处理的跨学科研发团队,致力打造世界一流的生物信息分析中心,并建立国内权威的基因信息数据库。

创始人唐元华告诉动脉网记者:“华人的人口占了世界总人口的1/4,但是针对华人的基因数据研究却远低于欧美人种。因此,我们想专注于打造华人的基因数据库,包括人种的基因和癌症的变异。”

跨界:世界上发现人类基因最多的科学家

在创立首度基因之前,唐元华先后在美国几家生物公司担任生物信息部门的主管 。从个人履历来看,这是一位生物信息学的专家。但唐元华告诉记者自己却是数学背景出身,这让记者颇感意外。

唐元华回忆:“去到美国的时候,是1988年。那时候人类全基因组计划正在筹备中。在我刚入学的第一天,詹姆士·华生到我们的学校做了一次演讲。 这次演讲完全改变了我的生命轨迹。”

唐元华形容自己是个理想主义者,去到美国就是为了学习西方最先进的科学技术。“一听到人类基因组计划,堪比阿波罗登月计划和曼哈顿原子弹计划,这不正是我来到美国的目的吗?”原本是学数学的唐元华,下定决心转向了基因组学的研究。

生物信息学概念的正式提出,是在1993年。在唐元华读博期间,国际上还没有生物信息这个专业,但这个大趋势是有了。这位数学系学生, 博士论文研究的问题,却是生命科学方向了。毕业以后,唐元华更是全身心投身到人类基因组项目中,领导的团队发现了超过20%的人类基因。 他是世界上发现人类基因最多的科学家,发现并命名了4个重要的基因家系。

“当时生物信息学还是一个处女学科,没有自己的理论体系。对很多人来讲,生命科学是一个实验科学,学好它主要靠记忆。”唐元华回忆到。他告诉记者, 当时有一些数学家,希望能够建立生命科学的理论基础:“这就是当时的大背景,一群数学界的科学家希望寻找到一个统一的理论,可以解释所有生命现象 。”

经过近30年的发展,“理论生物学”已经发展到了一个很成功的高度。生命科学的基础,落实到了信息学的基础之上。甚至说,它与计算机科学变成为同源的学科。到了今天,生物学家对生命本质的认识已经超越了物理学家对物理世界的认识。(因为生命的本质落实到了DNA的层次,是实验能够完全接触的。而理论物理,却还受到实验方法的限制)。 能够在生命信息学这个领域做一些开创性的工作,唐元华表示,自己感觉很自豪。

同源:生命即程序

早年间,唐元华通过基因组学的研究发现了一类新的搜索技术,在搜索的维度和问询的复杂度方面,全面提升了当时的搜索算法。这些发明专利,被包括谷歌、雅虎、IBM、微软等世界IT巨头引用。一位数学背景的生物信息学家,开发出了被这些IT巨头公司采用的专利搜索技术,相信不少人也会跟记者一样——惊呆了。

唐元华笑了笑表示,并非自己跨界跨得远,而是信息科学本就是个多元学科。严格说来自己是信息科学家,所研究的也是信息技术。这些发明,是立足于信息学的发明。它们对生命科学是有用的,对计算机科学同样是有用的。

他向记者解释道:“这又要退会去讲生命科学的本质了。”生命现象,从本质上讲,是由基因组这个程序控制的化学反应与物理变化。引发生命的本质是信息。基因组信息是静态的,人在被赋予基因那一刻,就注定了伴随一生的生命信息。换个说法,可以将其理解为,所有地球上的生命其实是一个程序,是一个受基因组控制的生化与物理过程。

唐元华认为,生命科学,计算机科学,甚至是人类的理性、人工智能都是同源的,都可以归纳到信息科学:“这就是为什么信息技术的研究在计算机科学和生命科学界都有意义。”

顶级团队:科研、临床、创新,三管齐下

2013年,唐元华被从美国的“完全基因组公司”派到深圳的华大基因,负责核心算法团队的管理。唐元华回忆,这段时间自己在美国和中国来回跑,越发感觉到中国基因领域正在酝酿一次大爆发。2015年遇到一位做基金的朋友,原来也是做基因组学的。他们交谈一番后,唐元华更加坚定了对中国市场的信心。这一年,唐元华决定在中国创业,成立了首度基因。

徐健博士,公司的联合创始人,是比较传统的分子生物学家。此前,徐健任职于国际知名生物技术公司凯杰,担任基因技术部门的主管。后来,自己在硅谷创办“多态 DNA 技术公司”, 担任科研副总裁。现在,在首度基因,唐元华负责数据相关领域,徐健则负责生命科学领域。两人更像是珠璧联合、完美地互补。

公司员工60%都拥有硕士以上学历。公司成立仅仅一年半,在生物信息领域已有15项专利申请,同时有5个授权的软件著作权,这证明了他们超强的研发能力。谈起自己的团队,唐元华显得很有信心:“我们的团队覆盖了基因组学的方方面面。从专业性上讲,算得上生物信息领域的世界级团队吧。”

成立不久,公司就获得了1000万美元的A轮融资,也得到苏州工业园区的大力支持,一路都比较顺利。公司还在合肥建立了医学检验所,用于处理客户的样品;同时在中国科技大学设立了首度基因实验室,用于开展高端产学研项目。虽然成立不久,但可以看出首度的远大目标,在科研、临床、创新,同时三管齐下。

数据库与检测服务,科研与临床

在首度基因成立的第一年,他们并没有急着往市场方向走,而是静下心来做数据库的建立和核心算法的开发。经过整整一年的努力,他们已经建立起了比较完善和很有特色的产品线。并通过专利申请和软件著作权对这些产品形成了一个保护层。

1、基因测序

为打造全民精准医疗信息平台,首度基因自主开发了FD-Exome全方位遗传检测。基于高通量测序平台,FD-Exome提供覆盖遗传肿瘤风险、常见疾病风险、营养代谢能力以及药物使用风险在内的全方位健康风险基因检测。

不同于全基因组检测,首度基因的FD-Exome只针对人类全部基因的编码区域进行检测。“基因组包含的信息很多,但我们真正所了解的就是蛋白编码区和其调控区域,大约占总体的2%。”唐元华向记者介绍。剩下98%的区域都是目前无法解释的。对于C端用户来说,对98%的未知区域的测序意义就更不明显了。相较全部基因组的检测,FD-Exome大范围砍掉了现目前用途并不明朗的区域,大大地降低了用户的测序成本,使得今天基因测序就能成为每一位国人的产品,而不是等到遥远的将来。

不仅如此,成本的降低并不意味着降低测序的深度。相反,因为采用了目标区域捕获技术,对目标区域进行一次性平行捕获,首度大大提升了测序深度(>200X),从而实现对于变异的临床精度的检测。 通过公司自主开发的变异动态注释算法,可扫描人类全部基因的外显子区域变异情况,针对已知基因进行详细解读;对于未知的变异,也能做到实时跟踪。通过全方位的基因解读,帮助用户实现有针对性的健康管理。不仅如此,对于B端用户来说,动态的解释服务能够帮助他们及时跟踪世界科技的进步,获取最新的科研成果。

“对于C端用户来说,我们的产品有实用价值;对于医生来说,我们的产品具有临床价值;对研究人员来说,它又有科研价值。”唐元华总结道:“最重要的是在价格上得到了有效的控制,使得人类基因组项目的成果,今天就可以在广大的国民身上体现出来。”

除了检测客户遗传信息的全基因测序, 公司还提供全套的癌症基因检测服务,包括基于癌症组织的测序,和基于血液的ctDNA无创检测。“FD-180-Tissue 是测序癌症组织的,FD-180-ctDNA 是测序客户的血液样品,可以实现对癌症患者病情的实时跟踪。我们的目标用户同时覆盖健康和疾病人群,也帮助临床医生为癌症患者制定个性化的治疗方案。”

2、数据服务

数据服务方面,首度基因通过中国癌症云平台这一公益数据平台,为广大癌症基因组学研究人员提供免费的数据库资源。

数据库的推出能够共同推进癌症基因领域分析研究的发展,不断完善有助于患者治疗的癌症基因大数据。但这也只是首度基因构建中国癌症基因大数据的第一步。尽管目前公开的数据信息中也不乏华人数据库,但并没有完全针对华人的数据库。

“东亚人口占了全世界人口的1/4,但针对华人的研究数据量远远少于其他人种。”唐元华认为中国是一个很大的市场,基因特性跟欧美人种也存在不少差异。建立一个专业的,有统一标准的华人数据库,很有必要。

“不同人种之间的不同癌症发病率存在明显差异,比如乳腺癌,美国的发病率就比中国高出许多,而胃癌的发病率又低于中国。”他向记者解释:“究竟不同癌症在不同人种之间存在什么样的差异,这必须要借助大数据分析。”

唐元华透露,目前华人数据库正在精密建设中,测序人数已经超过1000人。数据最终会通过云平台对外开放,其中包括高频癌症基因、华人基因曲线、以及癌症分布等数据。

目前中国基因检测行业百家争鸣,不同检测机构之间存在许多差异,测序基因不同,测序仪器不同,软件分析标准不一样,这导致了数据分析不能相互交流。首度基因希望在自身数据量达到一定规模后,能够形成国内的行业标准。

未来20年,基因组学会像手机一样普及

2017年,人类编码基因的测序成本进入数百美元级时代,整个基因领域都为之振奋。成本的降低毫无疑问将进一步推动基因组学的普及。

唐元华预测,未来20年内,基因组学会像今天的手机一样普及,每个人都能够拥有自己的基因组数据,并通过这些数据了解自己的健康状况,医生可根据数据制定个性化健康管理方案。“首度基因的定位就是为每个人提供这样的服务。”唐元华表示。

去年,国家卫计委通过的NIPT的批文,各地政府也在积极推广,NIPT有望在未来实现临床上的普及。“每年中国有1千7百万的新生儿,从父母算起,到祖父母/外祖父母一辈,直接影响到的人口超过1亿。”唐元华说。“虽然NIPT检测的只是遗传疾病中的很小一部分。但这是对遗传检测行业的非常大的东风,因为它会很快波及到人口的一个广大层面,使得大家都对于基因检测变得不再陌生。 顺着这股东风,我们可以把遗传疾病的筛查整盘推开。 再通过强调癌症遗传基因、以及遗传疾病基因在家族中的普遍性,一步一步把遗传检测产品在市场上推开。”在这里,唐元华看到了全基因检测在市场上普及的契机。

生物信息方面的核心竞争力,再加上测序行业的经验,很难去界定首度基因是一家生物科技公司还是一家IT行业的公司。这正是首度基因不同与众的地方。“国内众多的基因检测公司大多是分子生物学家创办的,它们对于基因大数据行业的计算机、信息科技方面的知识,掌控不太全面。”唐元华说。“而首度基因,从创业的第一天开始,它就既是一家生物科技公司,又是一家IT技术公司。” 经历了一年的发展,首度基因产品线逐渐丰富成熟,如今正是扩张时期。唐元华透露,目前公司B轮融资正在进行中,融资目标超过1亿。公司希望融资后加大市场推广力度,扩大消费群体,产生更多数据,为华人数据库的建设添砖加瓦。

人学研究网·人类通史栏目责编:童心竹

相关热词搜索:基因检测 癌症

上一篇:“终极保险”打造更安全的基因工程生物    下一篇:美国首次对人类胚胎开展基因编辑