《表1 基于词性的关键词及权重表示》
目前,关键词提取算法包括TF-IDF[12]、Text Rank[13]、LDA[14]等。TF-IDF和Text Rank算法通过计算词频来判断词语重要程度,但答案文本中词语分布较均匀,并不能通过词频来提取关键词。LDA算法可以提取文档中隐含的主题信息,但答案文本主题单一,表达明确,不完全适用于自动评分过程中的关键词提取。本文通过分析高考地理试卷和部分中学试题及答案特征,提出了一种基于词性的关键词提取及权重分配方法,即将关键词按照词性分类,每类关键词赋予权重,见表1。
图表编号 | XD00206690000 严禁用于非法目的 |
---|---|
绘制时间 | 2020.12.16 |
作者 | 付鹏斌、杨广越、杨惠荣 |
绘制单位 | 北京工业大学信息学部、北京工业大学信息学部、北京工业大学信息学部 |
更多格式 | 高清、无水印(增值服务) |