《表3元数据实际应用比较》
注:*代表该项不确定,☆代表使用难度
结合现有元数据标准在科学数据仓储中的实际应用情况,可以分析出元数据标准在科学数据仓储中发挥的作用。本文以应用上述元数据标准的6个科学数据仓储为例,对目前元数据标准在科学数据仓储中发挥作用的功能模块进行分析与总结(见表4)。在数据上传和数据著录模块,科学数据仓储依据元数据标准设定用户上传数据时必填写的数据的元数据描述,进而形成数据的著录信息,以便用户在不必浏览数据的情况下,能够对数据有基本的了解和认识。DataMed作为数据集检索系统,其并不提供数据上传功能,而是通过收录科学数据仓储,利用DATS元数据标准将各科学数据仓储内数据集的元数据描述进行统一与规范化,进而实现跨数据仓储的数据集检索。在数据检索和数据浏览模块,各科学数据仓储依据元数据标准设定用户可选的检索项、检索结果筛选项以及分类浏览的分类依据。在数据获取和数据引用模块,许多科学数据仓储不仅提供数据集的获取方式及获取路径,还基于科学数据仓储的元数据描述提供规范的数据引用格式。但也有部分仓储并未提供数据引用模块,如DataMed和EBI RDF Platform。在普通数据转RDF模块,仅利用标准W3C HCLS Dataset Description的科学数据仓储EBI R DF Platfor m能够实现,即将ChEMBL、Ensembl、UniProt等数据库中的数据转换为RDF格式,从而使这些数据集能够通过利用语义网技术进行访问。在API接口和OAI-PMH模块,部分科学数据仓储依据元数据标准为用户提供批量数据上传、数据下载、数据检索以及数据的元数据项下载等功能。图2从左至右分别展示了:(1)科学数据仓储Zenodo的数据上传界面,包括用户上传数据时必填元数据描述项、推荐填写元数据描述项和选填元数据描述项,对应元数据标准DataMed的必备元素、推荐元素和可选元素;(2)科学数据仓储Dryad的数据著录信息详情页面,不仅提供了数据集的基本信息说明,还提供了数据的获取路径以及引用数据的标准格式;(3)科学数据仓储DataMed的高级检索界面,为用户提供了22个可选检索项,如“Title”“Author”“Description”等。
图表编号 | XD0076552900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.25 |
作者 | 崔佳伟、吴思竹、邬金鸣、修晓蕾、钱庆 |
绘制单位 | 中国医学科学院医学信息研究所、中国医学科学院医学信息研究所、中国医学科学院医学信息研究所、中国医学科学院医学信息研究所、中国医学科学院医学信息研究所 |
更多格式 | 高清、无水印(增值服务) |