《表2 项目间局部与全局评分分布》
根据前述讨论,相似度计算是协同推荐算法中最为关键的计算过程,稀疏性问题会对其产生直接影响,因此针对稀疏性问题的改进多是在相似度计算中引入评分数据之外的可用信息,挖掘这些信息中的可用知识,并将所获知识与传统相似度进行不同形式的融合,从而实现克服稀疏性问题并提高相似度计算准确性的目标。在IBCF算法中,式(1)形式的传统相似度本质上是从评分数值大小的角度来度量项目之间的相关性,这类度量方法在目标项目已获得较多评分,项目间具有足够共同用户评分的情况下具有较高的可信度。然而,在稀疏评分环境下,项目间的共同用户评分数量相对较少,传统相似度只从两项目共同评分局部进行度量,而未对项目评分的全局分布进行区分,将难以准确表达项目间的相关性,如在表2所示的项目ti与tj以及tk的评分分布示例中,项目ti与tj在局部共同用户评分上表现出强相关性,而两者在全局非共同用户集合上均未获得评分,这与其局部评分特征相一致;而项目ti与tk在局部共同用户评分上虽表现出强相关性,但其在全局非共同用户集合上却表现出较大分歧,而传统相似度计算方法却无法对这种分歧情况进行区分,导致所得相似度计算结果不够客观全面。
图表编号 | XD00222765600 严禁用于非法目的 |
---|---|
绘制时间 | 2020.10.05 |
作者 | 任磊 |
绘制单位 | 上海师范大学信息与机电工程学院 |
更多格式 | 高清、无水印(增值服务) |