《表1 元数据释义表:面向精准医学的基因突变数据分类与融合研究》

《表1 元数据释义表:面向精准医学的基因突变数据分类与融合研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《面向精准医学的基因突变数据分类与融合研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

设计统一的元数据标准,以利于数据的标准化、存储与共享。本文借鉴一体化医学语言系统(Unified Medical Language System,UMLS)的超级叙词表对异构数据整合的原则,对收集的基因突变数据进行融合、组织。UMLS利用以RRF和ORF格式组织的数据文件管理生物医学和健康相关的概念、术语以及概念之间的关系[11]。遵循UMLS“概念-术语”的组织方式和保留来源数据库信息的原则,根据本实验数据特性简化元数据的设计,主要保留突变数据的名称、来源数据库、在来源数据库的ID和类型的信息。利用CID对融合后的突变数据进行唯一标识,利用AID对每一个原始数据库的突变数据进行唯一标识,再利用一个CID对应多个AID的方式对多来源同一概念的突变数据进行组织。具体元数据及其释义、数据格式和取值示例如表1所示。