《表1 样本聚类后产生层次化特征目录》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《科技资源共享服务中用户“画像”研究》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

为了更好地描述用户群，对各聚簇用户的指标所包含的原数据进行聚类分析，以得到近似用户的近似特征语义，即形成同类标注词。由于近似用户的主特征权重及供需倾向差异，一次求解并不能得到真实的近似标注词，因此需连续随机抽样后再进行聚类分析，通过聚类评价不断细分聚簇。如此，可得到Mi个聚类标注词。进一步对同类型数据进行分类后再分层抽样，同样可得到Mk个聚类标注词。再对Mi和Mk进行相似度计算，建立关联特征词库。特征词提取流程如图6所示，继而进行相似度计算后可得到相似特征集，示例如图7所示。将不同样本下得到的聚类中心作为特征中心，以同簇词为语料可构建相似特征词库，形式如表1所示。关联词为聚类中心同簇词向量，记录数据包括词向量和该词的离心距离。根据表1即可对该类用户的特征进行预描述。

图表编号	XD0079748100 严禁用于非法目的
绘制时间	2019.07.28
作者	周俊杰、赵晓萌、方少亮、林珠
绘制单位	广东省科技基础条件平台中心、广东省高性能计算重点实验室、广东省科技基础条件平台中心、广东省高性能计算重点实验室、广东省科技基础条件平台中心、广东省高性能计算重点实验室、广东省科技基础条件平台建设促进会、广东省科技基础条件平台中心、广东省高性能计算重点实验室
更多格式	高清、无水印（增值服务）