《表1 实验试剂一览表:MOOC环境下领域知识点的多重滤波提取》
第一步进行词法分析。词法分析包含分词(tokenization)、词性标注(part-of-speechtagging)等操作。以连续的自然语言文本为输入,返回语义完整的词序列,并为词序列中的每个元素打上对应的词性标签。不同自然语言处理工具给出的词性标签有一定差异,本文使用基于统计的方法,以Spa Cy作为处理工具。以输入文本“KNNisthe basicclassificationalgorithminmachinelearning.”为例,得到分词及词性标注结果见表1。
图表编号 | XD00206691100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.12.16 |
作者 | 陈之翼、王聪、李敏 |
绘制单位 | 四川师范大学计算机科学学院、四川师范大学影视与传媒学院、四川师范大学计算机科学学院、电子科技大学网络与数据安全四川省重点实验室 |
更多格式 | 高清、无水印(增值服务) |