《表1 部分候选概念的特征向量》

《表1 部分候选概念的特征向量》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《煤矿事故本体自动构建》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在经过数据预处理得到候选概念集合后,需要定义特征来表示煤矿事故本体概念与非煤矿事故本体概念的差异。特征是对一个客体或一组客体特性进行抽象的结果,用来描述概念。为更好地区分煤矿事故本体概念与非煤矿事故本体概念,需要添加背景语料库来进行概念特征提取[13],本文从艺术、教育、军事、体育、健康、金融6个领域选取100篇文本组成背景语料库。煤矿事故本体概念有众多特性,根据煤矿事故本体概念共有的特性抽象出某一特征,该特征就可用来区分是否为煤矿事故本体概念。同时,将这些特征通过向量的形式作为BP神经网络的输入,从而完成神经网络训练和概念分类。本文选用TF (Term Frequency,词频)、DF (Document Frequency,文档频率)、IDF (Inverse Document Frequency,逆文档频率)这3种特征组成特征向量[14],部分候选概念的特征向量经归一化处理后结果见表1。