《表2 采用词袋模型提取特征》
(%)
然后使用sklearn提供的CountVectorizer(词袋模型)进行相同的特征提取操作。本文采用2-Gram来获得词袋模型,最小词频为10次,忽略解码错误,其他参数保持默认状态。表2是使用词袋模型处理相同数据后的性能分析结果。
图表编号 | XD0078282900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.07.10 |
作者 | 姜天 |
绘制单位 | 武汉邮电科学研究院 |
更多格式 | 高清、无水印(增值服务) |
(%)
然后使用sklearn提供的CountVectorizer(词袋模型)进行相同的特征提取操作。本文采用2-Gram来获得词袋模型,最小词频为10次,忽略解码错误,其他参数保持默认状态。表2是使用词袋模型处理相同数据后的性能分析结果。
图表编号 | XD0078282900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.07.10 |
作者 | 姜天 |
绘制单位 | 武汉邮电科学研究院 |
更多格式 | 高清、无水印(增值服务) |