《表3 不同维度基因组信息举例》

《表3 不同维度基因组信息举例》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《多维度基因组信息:起源、内涵与技术瓶颈》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
STR,简单串联重复序列;BDR,生物学界定的重复序列,如各类转座子

多维基因组信息有组织地获取,就技术而言面临来自三个层面的挑战:系统性、规模化、精准性.系统性是指每个层面上的信息必须要相对应,从染色体DNA序列到基因在染色体上的坐标,从基因转录本到功能产物和细胞机器,从分子机制到细胞过程等,都是细胞的有序活动,这些活动必须在一个相顺相通、相辅相成的平台上来解释.这不仅需要有规划的数据获取,还要准备强大的算力算法支持.目前不同维度的组学数据可以罗列的有很多(表3),并且可以无限细分下去,但是除了基因组序列——一维基因组信息外,其他层面都还缺乏计划性和完整性的思考.人类基因组序列测定从30年前一个人的“人类基因组计划”到如今的“十万基因组”(英国)、“百万基因组”(英国),甚至“人人基因组”(美国)计划,成功在于“五位一体”地思考:建立机构、孵育学科、制定规划、突破技术瓶颈、引导新业态产生.其中技术瓶颈的突破最为重要,试想如果没有第二代测序仪(亦称“下一代测序仪”或next-generation-sequencers,NGS)的支持,这些基因测序计划不都是“天方夜谭”吗?就目前技术汇聚的现状来看,规模化与微型化是必然的.所谓微型化,就是实现以微流控为核心技术的生化检测(assays)在“片上”(亦可称为芯片上系统或片上系统,即on-chip;本文简称“片上”)的量产.片上操作的必要性是很显然的,就是要保证低成本、高通量和高速度.第三代和第四代测序仪就是以片上技术——包括“湿法”(微流控)和“干法”(微电子)——为基本平台.精准性要通过技术和方法学,以及重复性、高覆盖数据来实现.与技术相关的考量之一就是准确性,就DNA测序而言,有两个方面:单核苷酸的准确性(也与序列的覆盖度有关)和序列的连续性(与测序读长有关);而另一个重要的考量就是成本.在降低成本的压力下,很多技术、方法和项目都打了折扣,其中相当一部分数据难以重复验证,生命力因此缩水,比如早期转录组研究的方法,如SAGE(serial analysis of gene expression)、微阵列(microarrays)、EST等[35].数据的准确性是质量保证,也是数据的生命力所在.原则上讲,材料和数据的处理流程越简便,其数据的真实度和可信度就越高.细胞RNA组研究(通常指信使转录组)的起点就应该是单细胞转录组本身及其异质化特征(同相同克隆细胞作为一个有物质和信号交流的群体),然而人们却没有理想的定量技术和设备表征异质化.目前的单细胞信使转录组研究正在从以界定细胞种类和表达谱差异为主的研究,转变到转录组本身的研究[36,37]并形成具有系统性、初具规模的一系列大科学项目[38,39],但是数据的生命力取决于质量,取决于RNA直测技术和微流控单细胞建库技术的进展.