《表1 样本聚类后产生层次化特征目录》

《表1 样本聚类后产生层次化特征目录》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《科技资源共享服务中用户“画像”研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了更好地描述用户群,对各聚簇用户的指标所包含的原数据进行聚类分析,以得到近似用户的近似特征语义,即形成同类标注词。由于近似用户的主特征权重及供需倾向差异,一次求解并不能得到真实的近似标注词,因此需连续随机抽样后再进行聚类分析,通过聚类评价不断细分聚簇。如此,可得到Mi个聚类标注词。进一步对同类型数据进行分类后再分层抽样,同样可得到Mk个聚类标注词。再对Mi和Mk进行相似度计算,建立关联特征词库。特征词提取流程如图6所示,继而进行相似度计算后可得到相似特征集,示例如图7所示。将不同样本下得到的聚类中心作为特征中心,以同簇词为语料可构建相似特征词库,形式如表1所示。关联词为聚类中心同簇词向量,记录数据包括词向量和该词的离心距离。根据表1即可对该类用户的特征进行预描述。