《表1 基于词性的关键词及权重表示》

《表1 基于词性的关键词及权重表示》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《结合学科同义词与词向量的相似度评分算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

目前,关键词提取算法包括TF-IDF[12]、Text Rank[13]、LDA[14]等。TF-IDF和Text Rank算法通过计算词频来判断词语重要程度,但答案文本中词语分布较均匀,并不能通过词频来提取关键词。LDA算法可以提取文档中隐含的主题信息,但答案文本主题单一,表达明确,不完全适用于自动评分过程中的关键词提取。本文通过分析高考地理试卷和部分中学试题及答案特征,提出了一种基于词性的关键词提取及权重分配方法,即将关键词按照词性分类,每类关键词赋予权重,见表1。