经过5年建设,年9月22日,总部位于深圳的中国国家基因库将正式投入运行。这是继美国的NCBI,日本DDBJ和欧洲EBI之后全球第四个建成的国家级基因库,也是目前为止世界最大的基因库。中国国家基因库要解决什么问题?未来如何运营?华大基因与国家基因库之间是什么关系?这些将是本文要解答的问题。
国家基因库要做什么?
相关资料显示,美国NCBI在成立之初定位于四个主要功能:第一,“为储存和分析分子生物学、生物化学、遗传学知识创建自动化系统”(即信息存储功能);第二,“从事研究基于计算机的信息处理过程的高级方法,用于分析生物学上重要的分子和化合物的结构与功能”(即数字化功能);第三,“促进生物学研究人员和医护人员应用数据库和软件”(既产业共享功能);第四,“努力协作以获取世界范围内的生物技术信息”(即开放平台功能)。这四个功能定位至今未有大的调整。而欧洲的EBI则更加注重开放和创新的学术氛围,其功能更多定位与分子生物学基础研究和教育培训
在中国国家基因库的相关介绍中,绕不开“三库两平台”的描述,国家基因库未来的架构功能,也与此有关。华大基因研究院院长、国家基因库执行主任徐讯向网易科技介绍,“三库”包括“干库”(数字化库,既基因、蛋白、分子、影像等多组学生物信息数据库)、“湿库”(多样性生物样本和遗传资源库)和活库(既活体生物库);“两平台”则是基因信息读取平台和基因编辑与合成平台。
从功能上看,中国国家基因库的“三库两平台”定位涵盖了基因库基本的功能属性,并在综合性上有所超越。根据徐讯的描述,中国国家基因库将是世界上综合性最强的基因库,“他们(指DDBJ、NCBI、EBI)只是数据库,没有样品保存功能。相比之下,国家基因库还有样品库和活体库,目前全球没有这么大规模的综合性数据库,我们一期就达到了。”
徐讯介绍,国家基因库主要产生人类疾病和物种多样性的相关数据。目前,罕见病数据库已检测了多个家庭,新发现多种罕见病;癌症数据库包含上万份不同种类的数据。公开资料显示,华大基因今年在与地方政府合作中总计完成27万多个样本检测,包括无创产前、遗传性耳聋、地中海贫血、新生儿遗传代谢病、宫颈癌筛查等。这些数据都将在政策规范指导下通过数据共享中心向全国科研机构和人员、产业机构开放。
从国家基因库所采用的“PPP模式”中不难发现,将基因技术产业化、商业化将是国家基因库极为重要的功能之一,这种属性和一开始的定位,与NCBI、DDBJ和EBI有很大的不同。梅永红向网易科技表示,“国家基因库与国外三大基因库相比,不仅在存储规模上有很大的超越,更注重研发和在产业生态中发挥积极作用,未来国际基因库希望成为国内基因产业孵化器,绕着存储、解读、利用这条产业链,希望通过这个平台有更多人、更多模式走出来。”
另一方面,由于目前国内民众对基因和基因库价值的认知尚且有限,科普和科教也是基因产业化必须面临的课题。对此,梅永红认为“国家基因库必须具备科普的功能,人才培养也在国家基因库的功能规划之中,根据梅永红的介绍,国家基因库不是一个保存平台,而是一个研发平台,未来会建立基因库联盟,未来人才队伍会很庞大。”
与美欧的国家级基因库相比中国国家基因库有什么不同?
在中国国家基因库建成以前,NCBI(美国国家生物技术信息中心)、DDBJ(DNADataBankofJapan语译“日本基因数据库”)和EBI(欧洲生物信息研究所)已有多年运营历史。中国国家基因库立项建设开始是在年,这种晚起步对中国而言意味着什么?能否产生后发优势?
以NCBI为例,受当时的美国参议员ClaudePepper提议,美国国立医学图书馆(NLM)于年建立国家生物技术信息中心(NCBI)。在管理体系上,NCBI是在国立医学图书馆(NLM)的一个分支。这种体制划分,最初来源于当时基因行业的产业化程度不足和国立医学图书馆的存储功能模型思考,也决定了政府在NCBI的组建和运营过程中的核心角色。
与NCBI不同,中国国家基因库借鉴经济学理论中的“PPP模式”,由国家财政、地方财政和华大基因三方出资、最终由财政向华大基因购买这种专业服务。这种模式在理论上比NCBI更加先进和高效,但具体效能的发挥仍有待进一步观察。国家基因库主任、华大农业集团董事长兼总裁梅永红向网易科技表示:“国家基因库设有理事会,由国家发改委、财政部、工信部、卫计委四部委牵头,深圳市政府共同参与。这个平台怎么建设、运营,按照什么样的机制实现资源共享,都由理事会建立标准。”
另一方面,国家基因库在未来的运营过程中能否发挥更大研发、产业化和社会公益价值,将取决于国家基因库运营的具体操盘手华大基因的思考和运营方式。梅永红向网易科技表示,“国家基因库作为一个国家级平台,不仅是获得更多的基因资源,我们还要对这些基因资源进行数字化、进行研发、进行利用,这是一个很浩大的系统工程”。
在DNA数据库容量方面,由于DDBJ、NCBI、EBI这三大数据中心在各自收集序列数据的基础上共同组成了国际DNA数据库,于每日都交换和更新数据信息,因此,三个库的数据实际上是相同的。根据国家基因库执行主任徐讯的介绍,国家基因库目前已实现基因信息数据总量达60PB的访问支持,生物样本存储量达到万份,已成为全球最大生命信息平台。徐讯向网易科技表示,国家基因库已与国外多个国家级自然历史博物馆、挪威世界末日种子库等机构建立合作,待国家基因库正式运营后,也将与国际DNA数据库三方组织一样开放数据共享平台,但出于国家安全或伦理方面的要求,特殊的数据将在一定的监管制度和规范下通过特殊授权才可实现共享。
华大基因在中国国家基因库中的角色
国家级基因库乃国之重器。梅永红向网易科技表示:“基因库是真正的国库,比银行的金库还要宝贵,农耕时代的核心资源代表是耕地,工业时代是能源,而生命科学时代则是基因。以精准医学为例,很大程度是通过DNA医院的范式。未来精准医学方面的发展和竞争,一定程度上是基因资源的竞争。”换言之,在未来生命科学产业的发展中,基因库将是产业的基础和核心平台。
中国政府为什么会把如此重要之事交给“华大基因,这与华大基因的发展历史和目前国内国际基因产业格局的现状不无关系。
华大基因成立于年9月9日,年代表中国与美国、英国、德国、日本、法国共同承担完成人类基因组绘制计划,目前已是全球最大的基因测序机构。
华大基因在中国基因领域的研究能力首屈一指。从年到年5月5日,华大基因平均每两天即有一篇论文发表,其中95%被SCI收录。在今年4月发布的自然指数排名中,华大基因位列中国产业机构首位、全球产业机构第12名。中国其余基因公司中的创始人、主要负责人大多来自华大基因。
(位于华大基因博物馆的华大科研和专利展示)
(华大基因业务/产业板块组成)
而对于公众对国家级平台为什么要交给华大基因承建运营,而不是中科院或者高校的疑问,梅永红向网易科技表示:“民营机构比体制内机构在研究方面拥有更大的优势,没有壁垒,资源能得到充分的共享。交给华大,是国家对目前国内科研态势的一个判断。”
正是基于这样的发展背景、科研水平和产业化组织能力,年1月10日,国家发展改革委等四部委批复同意华大基因承建并运营深圳国家基因库。
在建设方面,在根据梅永红的介绍,在国家基因库一期7.8亿的工程总投资款中,华大基因已经投资了3.6亿,配套服务和设备都是由华大基因提供,未来还会继续加大投入。
运营方面,基因库作为国家级平台,将为公众提供公共产品和公共服务,华大在这个过程中是参与者和具体的操盘手。梅永红向网易科技强调:“国家基因库是政府资助、官办的机构,是由华大基因来运营,或者某种程度上来说可以理解为是由政府来购买服务,但是现在这个机制还并没有最终完全明确。”
在产业化方面,“国家基因库是公共服务平台,不是民生工程。国家基因库是一个开放的网络平台,而不是垄断所有的基因信息。华大或者国家基因库不可能包打天下,更多的是提供一个模式和建构标准,使得基因资源得以开发利用,这对提升国家在生命科技领域的能力是非常有价值的。”梅永红表示。
而对于在产业化过程中如何平衡公共利益和商业属性之间的关系,梅永红表示:“产业化的事情,可以是华大来做,也可以是授权,经营的收益一定是属于基因库的发展的”。徐讯也表示:“国家基因库是完全独立的,虽然由华大团队建设和管理,但与我们的商业版块是分开来的。基因库会提供对外公共服务统一的政策和规则,产业机构包括华大都必须按照规则使用这个公共平台。”
华大基因在整个过程中会得到什么?对于这个问题,梅永红向网易科技表示:“华大基因在商业模式上不是研发技术,形成产品,最后卖产品的公司,华大是做基础研究起步的机构,在方向和架构选择时都在摸索一种新的生存发展模式。”另一面,梅永红同时表示,树立大目标,集中大资源、搭建大平台,就会产生大数据,有了大数据就可能产生大科学,最终衍生出产业门类和产业化机构。
年,国家发展改革委、财政部、工业和信息化部以及国家卫生和计划生育委员会四部委批复同意有华大基因研究院组建深圳国家基因库。这是继美国、欧洲、日本之后的第四个国家级基因库,但在样本容量、综合性和产业布局思考上,深圳国家基因库都具有一定的后发优势。
国家基因库主任、华大农业集团董事长兼总裁梅永红向网易科技介绍称,国家基因库是真正的国库,比银行的金库更宝贵。作为国家级平台,基因库将为公众提供公共产品和公共服务。梅永红表示:“国家基因库产业化运作后,会有更多人、更多模式将通过这个平台走出来,这对提升国家在生命科技领域的能力是非常有价值的。”
国家基因库执行主任、华大基因研究院院长徐讯在深圳国家基因库接受媒体采访。徐讯介绍称深圳国家基因库是全世界最大的综合性基因库,1期建成后,在可访问数据量、数据存储能力、可访问样本量、样本存储能力都是世界第一。
深圳国家基因库内景
深圳国家基因库基地位于深圳市大鹏新区“禾塘仔”地块,建设规模约,平米,分两期建成。一期工程投资7.8亿元人民币,其中国家财政和深圳市地方财政总共投入4亿左右,华大基因目前投入约3.6亿。
深圳国家基因库内景休闲和休息区。
国家基因库已与国外多个国家级自然历史博物馆、挪威世界末日种子库等机构建立合作,开幕之后也将正式开放数据共享平台。
深圳国家基因库内景深圳国家基因库内景国际基因库的工作人员陆续从大约20公里外的华大基因总部迁往这里。
基因库三楼摆放着华大基因自主研发的台桌面型BGI-Seq基因测序仪,以及一台造价万美元的Revolocity超级测序仪。
图为深圳国家基因库工作人员正在华大BGI-Seq基因测序仪前工作。中国国家基因库的建设虽晚于发达国家,但综合性较强,一个基因库包含了国外多个基因库的类型,包括生物多样性库、农业种子库、疾病库和数据库组成的综合库。其中,生物多样性库包括动植物组织、活体细胞、微生物株和人血液、尿液、组织、细胞等以及实体的DNA、RNA、蛋白质和小分子样本等。
国家基因库具备“三库两平台”功能。三库指干库(生物信息数据库)、湿库(生物样本资源库)和活库(生物活体库),两平台包括读平台(数字化平台)和写平台(合成与基因编辑平台)。
数据中心将发挥“干库”的主要功能,将储存全球生物样本、生物信息数据,并通过与基因库合作的云平台,面向全球的科研机构、企业开放数据。在试运行期间,国家基因库已初步建成40多个数据库,如中国肿瘤基因组(CCGC)数据库、癌症数据库等。据介绍,CCGC现已收集了超过25种癌症类型数据,近例样本数据,近5万条变异信息。
基因库内已摆放数十台用于储存样本的冰箱。国家基因库已存储众多生物资源样本,目前存储总量达万份。根据徐讯介绍,国家基因库为样本提供了四种选择,分别是4℃冷库、-20℃冷库、-80℃冷库和-℃液氮储存。国家基因库与中国第一个进口LNG(液化天然气)接收站—相距不远,基因库可以利用LNG气化过程中产生的大量冷能,用于样本的冷却等。
深圳国家基因库露台外景。
从这张图可以明显看出,深圳国家基因库是依山势而建的梯田建筑,每层都相当于是第一层,靠山体结构支撑,稳固性相对好,可以摆放大型设备。
深圳国家基因库的占地面积超过5万平方米,建筑总面积11.6万平方米,即将投入使用的Ⅰ期建筑面积4.75万平方米。徐讯向网易科技介绍称:“这里的气温比深圳市区低2℃左右,负氧离子浓度比市内高很多。”
深圳国家基因库夜景。徐讯介绍,基因库选址主要考虑资源整合和未来的产业化区域聚合优势。一方面,湿库的冷却可利用临近的LNG(液化天然气)码头气化过程中产生的大量冷能;另一方面,深圳正在全力推进“东进战略”,将在深圳东部的大鹏半岛规划建设国际生物谷,并将其打造成为国际领先的生物科技创新中心,国家基因库是大鹏新区的重要产业基础设施,有助于生物产业提升创新能力。
梅永红认为,基因库是真正的国库,比银行的金库还要宝贵。农耕时代的核心资源代表是耕地,工业时代是能源,而生命科学时代则是基因。以精准医学为例,很大程度是通过DNA医院的范式。未来精准医学方面的发展和竞争,一定程度上是基因资源的竞争。中国政府为什么会把如此重要之事交给“华大基因?华大基因成立于年9月9日,年代表中国与美国、英国、德国、日本、法国共同承担完成人类基因组绘制计划,华大基因拥有全球最大的基因数据,其人类基因组数据一度占到全球的近50%,全球农业基因组数据拥有量占全球70%。
论文相关说明。
21-2年,华大基因代表中国与美国、英国、德国、日本、法国共同完成人类基因组绘制计划。1年华大基因在全球首先完成水稻(籼稻)基因组的”工作框架图”绘制和数据库搭建。
华大基因在中国基因领域的研究能力可谓首屈一指。从年到年5月5日,华大基因平均每两天即有一篇论文发表,其中95%被SCI收录。
在年4月发布的自然指数排名中,华大基因位列中国产业机构首位、全球产业机构第12名。中国其余基因公司中的创始人、主要负责人大多来自华大基因。
现任华大基因总部办公室主任,新闻发言人,生物科学博士杨碧澄介绍华大基因学术研究成果。
国际化方面,华大基因在年全球产业机构合作指数中排名第一。《Nature》评价认为,华大基因对深圳基础科研贡献度达44%。
产业化方面,华大基因目前是全球最大的基因测序机构。截至目前,全国有数百家基因测序服务公司,主要分布在北京、上海、广州、深圳、杭州、成都、天津等省市,年中,几乎每周都有成立新公司的消息。基因组学应用的产业链上游为测序仪器、设备和试剂供应商;中游为基因测序与检测服务提供商;下游为使用者,包括医疗机构、科研机构、制药公司和受检者。据不完全统计,
在目前华大基因的业务板块中,“华大司法”、“华大智造”、“华大农业”、“华大基因股份有限公司”四大模块都围绕产业化方向展开。其中,“华大智造”主要在体外诊断试剂、测序仪等设备研发生产和销售;“华大股份”则提供科技服务和医学类基因疾病检测服务。
国家基因库副主任,华大基因研究院副院长张国捷在华大基因研究院向媒体展示生物多样性研究的价值和意义。张国捷认为,国家基因库这个平台可以帮助搜集全球资源,研究和保护生物多样性。
目前,生物多样性主要分为基础研究方向和应用方向,基础研究主要回答重大基础性的生物学问题。
张国捷表示:“应用方向刚刚起步,未来希望通过探索基因资源,在生物新能源、新医药和新材料科学应用研究上提供重要的基础知识和样品储备。”
华大基因研究院跨组学实验室
华大基因研究院跨组学实验室
华大基因研究院跨组学实验室
华大基因研究院跨组学实验室
华大基因研究院跨组学实验室
华大基因研究院跨组学实验室
(文章版权归原创作者所有,如有侵权请及时联系)