《表1 元数据释义表:面向精准医学的基因突变数据分类与融合研究》
设计统一的元数据标准,以利于数据的标准化、存储与共享。本文借鉴一体化医学语言系统(Unified Medical Language System,UMLS)的超级叙词表对异构数据整合的原则,对收集的基因突变数据进行融合、组织。UMLS利用以RRF和ORF格式组织的数据文件管理生物医学和健康相关的概念、术语以及概念之间的关系[11]。遵循UMLS“概念-术语”的组织方式和保留来源数据库信息的原则,根据本实验数据特性简化元数据的设计,主要保留突变数据的名称、来源数据库、在来源数据库的ID和类型的信息。利用CID对融合后的突变数据进行唯一标识,利用AID对每一个原始数据库的突变数据进行唯一标识,再利用一个CID对应多个AID的方式对多来源同一概念的突变数据进行组织。具体元数据及其释义、数据格式和取值示例如表1所示。
图表编号 | XD00215119200 严禁用于非法目的 |
---|---|
绘制时间 | 2018.11.01 |
作者 | 吴萌、李姣、康宏宇、侯丽 |
绘制单位 | 中国医学科学院、北京协和医学院医学信息研究所、中国医学科学院、北京协和医学院医学信息研究所、中国医学科学院、北京协和医学院医学信息研究所、中国医学科学院、北京协和医学院医学信息研究所 |
更多格式 | 高清、无水印(增值服务) |