《表1 判定有效增量数据的部分样本实例》
为便于判定增量数据与存量数据的合理时间分界点,本文对不同更新周期的数据集数量进行统计。为了便于计算,本文对每个周期进行标准化处理,由于每日为最小单位,所以本文以天数(日数)作为每个更新周期的时间间隔单位,本文规定每周为7天,每月为30天,每季度为91天,每半年为182天,每年为365天。按每年更新的数据集占较大比重,因此本文以数据发布日期在一年内(2016年9月8日至2017年9月8日),且数据在更新周期内未进行任何更新(即发布日期与更新日期相同,间隔天数为0)作为增量数据,其余则为存量数据。由于首次发布日期与最近更新日期相同的数据集并不一定为增量数据,为了阐明选取标准,本文选取了部分首次发布日期与最近更新日期相同的数据集作为判定两类数据的实例,如表1所示,四个数据集的首发日期与最近更新日期都相同,但它们的更新周期不同。按照更新周期,编号为1、3、4的数据集应当在首次发布之后至调查日期之间进行数据集的更新,但三者的最近更新日期并未发生变化,只有编号为2的数据集在更新周期内,所以本文判定1、3、4号数据集为无效增量数据(纳入存量数据),2号为有效增量数据。
图表编号 | XD0072265600 严禁用于非法目的 |
---|---|
绘制时间 | 2019.01.25 |
作者 | 唐长乐、张晓娟 |
绘制单位 | 武汉大学国家级图书情报实验教学示范中心 |
更多格式 | 高清、无水印(增值服务) |