《表5 短语相似度聚类核心》

《表5 短语相似度聚类核心》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《配电线路跳闸填报文本智能挖掘方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

由于文本叙述的相似性,在上述抽取过程中除所需目标内容外还会抽取得到大量无关结果,因此需要进一步筛选将无关结果舍弃,进而得到其中与故障现象及故障原因相关的抽取结果。在短语相似度筛选阶段,基于前述词频统计结果及已建立的词向量化模型,针对配电线路跳闸填报文本中故障现象及故障原因描述特征划定短语相似度筛选的动词/名词筛选核心,通过给定每组筛选核心不同的相似度阈值,使得在阈值范围内核心词汇的相似词汇为故障现象、原因相关内容。表5中给出了故障现象及故障原因的部分聚类核心样本及其相似度阈值。通过结合3.3节中条件1)、2),明确故障现象、故障原因相似度筛选所需的聚类核心词汇及每组核心对应的相似度阈值。