《表1 样本聚类后产生层次化特征目录》
为了更好地描述用户群,对各聚簇用户的指标所包含的原数据进行聚类分析,以得到近似用户的近似特征语义,即形成同类标注词。由于近似用户的主特征权重及供需倾向差异,一次求解并不能得到真实的近似标注词,因此需连续随机抽样后再进行聚类分析,通过聚类评价不断细分聚簇。如此,可得到Mi个聚类标注词。进一步对同类型数据进行分类后再分层抽样,同样可得到Mk个聚类标注词。再对Mi和Mk进行相似度计算,建立关联特征词库。特征词提取流程如图6所示,继而进行相似度计算后可得到相似特征集,示例如图7所示。将不同样本下得到的聚类中心作为特征中心,以同簇词为语料可构建相似特征词库,形式如表1所示。关联词为聚类中心同簇词向量,记录数据包括词向量和该词的离心距离。根据表1即可对该类用户的特征进行预描述。
图表编号 | XD0079748100 严禁用于非法目的 |
---|---|
绘制时间 | 2019.07.28 |
作者 | 周俊杰、赵晓萌、方少亮、林珠 |
绘制单位 | 广东省科技基础条件平台中心、广东省高性能计算重点实验室、广东省科技基础条件平台中心、广东省高性能计算重点实验室、广东省科技基础条件平台中心、广东省高性能计算重点实验室、广东省科技基础条件平台建设促进会、广东省科技基础条件平台中心、广东省高性能计算重点实验室 |
更多格式 | 高清、无水印(增值服务) |