《表3 TF-IDF召回候选日志实际效果示例》

《表3 TF-IDF召回候选日志实际效果示例》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《电力通信运行管理中典型业务数据的智能关联方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

无监督召回中,第1种召回方法采用TF-IDF,将故障名称及值班日志内容文本转化为TF-IDF。具体地,一条故障名称或日志内容记录均可认为是一篇文档,用文档中每个词的TF-IDF组成的词袋向量表示该文档,再根据余弦相似度计算某条故障工单与所有日志的相关性,按照余弦相似度的大小对日志进行排序,取相似度最大的前30条日志作为该故障工单的召回候选日志。选取一条故障工单为例,该故障工单名称为“主干网A变-B中调光路异常”,表3展示了采用TF-IDF召回的相似度排序靠前的3条候选日志,从结果可以看出召回的候选日志在内容上基本与故障工单有关,说明采用TF-IDF可有效召回。