《表1 分词、权重图:基于SimHash的文本相似检测算法研究》
(1)分词:将文本进行分词,形成该文本的特征单词同时为每个词加上权重[7]。设定权重为五个级别(1-5)。针对例句进行分词以及分配权重,如表1所示。
图表编号 | XD0077607500 严禁用于非法目的 |
---|---|
绘制时间 | 2019.08.05 |
作者 | 王添男、冯锋 |
绘制单位 | 宁夏大学信息工程学院、宁夏大学信息工程学院 |
更多格式 | 高清、无水印(增值服务) |
(1)分词:将文本进行分词,形成该文本的特征单词同时为每个词加上权重[7]。设定权重为五个级别(1-5)。针对例句进行分词以及分配权重,如表1所示。
图表编号 | XD0077607500 严禁用于非法目的 |
---|---|
绘制时间 | 2019.08.05 |
作者 | 王添男、冯锋 |
绘制单位 | 宁夏大学信息工程学院、宁夏大学信息工程学院 |
更多格式 | 高清、无水印(增值服务) |