《表2 句中第i个字的特征模板》
我们采用的特征模板如表2所示。其中,ci表示句子中的第i个字;N-gram特征信息表示这个字周围的信息;Type表示这个字属于Number,Punctuation,English还是Chinese;Identical表示第i个字和前面一个字的是否相同,这个特征捕捉周围字是否是叠词这一信息。
图表编号 | XD0091813400 严禁用于非法目的 |
---|---|
绘制时间 | 2019.09.01 |
作者 | 朱运、李正华、黄德朋、张民 |
绘制单位 | 苏州大学计算机科学与技术学院、苏州大学计算机科学与技术学院、苏州大学计算机科学与技术学院、苏州大学计算机科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |