《表2 LRCFP各特征计算方法》

《表2 LRCFP各特征计算方法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《社交媒体用户价值画像建模与应用研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

探索4.1节中的数据,在数据清洗时,去除作品数大于0且播放数为0的无效数据,由于这部分数据占比较小,对研究影响不大,故直接进行丢弃。有效数据计14295个。在属性约简时,根据LRCFP模型,抽取6个属性:发布第一部作品的时间(Original_time)、发布最后一部作品的时间(Latest_time)、作品总数(Contributions)、粉丝数(Fans)、累积播放数(Plays)、观测时间(Observe_time)。将14295个有效数据打散,抽取11000个数据作为建模数据,3295个数据作为增量未知数据。根据3.1节LRCFP特征模型中L、R、C、F、P的定义做数据变换,如表2所示。使用拉格朗日多项式插值法填补缺失值,由于各特征取值范围差异较大,为了规避数据数量级别的影响,对数据做Z-score标准化处理。