《表3 TF-IDF召回候选日志实际效果示例》
无监督召回中,第1种召回方法采用TF-IDF,将故障名称及值班日志内容文本转化为TF-IDF。具体地,一条故障名称或日志内容记录均可认为是一篇文档,用文档中每个词的TF-IDF组成的词袋向量表示该文档,再根据余弦相似度计算某条故障工单与所有日志的相关性,按照余弦相似度的大小对日志进行排序,取相似度最大的前30条日志作为该故障工单的召回候选日志。选取一条故障工单为例,该故障工单名称为“主干网A变-B中调光路异常”,表3展示了采用TF-IDF召回的相似度排序靠前的3条候选日志,从结果可以看出召回的候选日志在内容上基本与故障工单有关,说明采用TF-IDF可有效召回。
图表编号 | XD00193002500 严禁用于非法目的 |
---|---|
绘制时间 | 2021.02.20 |
作者 | 吴桂龙、杨志敏、黄昱 |
绘制单位 | 中国南方电网电力调度控制中心、中国南方电网电力调度控制中心、中国南方电网电力调度控制中心 |
更多格式 | 高清、无水印(增值服务) |