《表3 具有新研究潜力的数据形式》

《表3 具有新研究潜力的数据形式》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《人文社会科学数据管理的现实困境与对策分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

一是数据来源广泛、外延不断拓展,“不仅包括数值型数据,还包括文本数据、档案数据、汇编数据、音频、图片等非结构化数据,以及微观宏观尺度数据等”【6】,除点击量、搜索日志、聊天记录乃至传感器数据外,基因组数据、空间地理数据等现代科技数据逐步进入心理学、行为科学、经济学等研究领域(见表3【7】);二是数据量总体偏小。英国学者调查发现,绝大多数人文艺术类学者创建的数据集总量不足1GB,社会科学学者的数据集总量基本在1-10 GB之间,远低于工程类学者的数据集总量【8】;三是数据背后的语义信息丰富而难以捕捉,如直觉、印象、灵感等,基本依赖于研究人员/创作人员的学术积累与主观感知,难以度量或用标准化的数值形式表示;四是范畴界定的宽泛模糊。有学者指出:“人文、艺术和社会科学的研究数据几乎可以是任何东西”【9】,如手稿整理、史料编撰、领域知识图谱等往往难以厘清数据管理与学术研究的清晰边界,“除传授数据技术和服务外,(数据管理)重要的目标还在于促进方法论和范式向定性和定量方法、跨学科研究设计、开放科学政策和跨国合作的整合转变”【10】。