《表3 特征模板Table 3 Feature template》
为了获得更好的标注效果,针对不同的窗口大小(窗口大小可以为3、5、7,分别代表当前字符及其前后的1、2、3个字符),以及是否包括词性特征,设计了6种CRF特征模板。表3示出了窗口大小为7、包括词性特征的特征模板,其中Ci表示当前症状的第i个字;Pi表示当前症状的第i个字所在词语的词性;Unigram是一元特征,即当前字符;Bigram是二元特征,表示相邻两个字符所结合的特征;Trigram是三元特征,表示当前字符与前后相邻的两个字符结合所产生的特征。
图表编号 | XD0025788400 严禁用于非法目的 |
---|---|
绘制时间 | 2018.04.30 |
作者 | 曾露、高大启、阮彤、王祺、高炬、何萍 |
绘制单位 | 华东理工大学信息科学与工程学院、华东理工大学信息科学与工程学院、华东理工大学信息科学与工程学院、华东理工大学信息科学与工程学院、上海中医药大学附属曙光医院、东华大学旭日工商管理学院 |
更多格式 | 高清、无水印(增值服务) |