《表1 自动生成数据题目》
数据集主要包含两个,即真实数据集(Real Data)与自动生成数据集(Auto Data)。其中,真实数据集来源于某市高考语文试题与模拟试题,包含四道词义判断题;自动生成数据集来源于通过散文吧网站下载的文学作品语料库。数据生成理念是,选词即选定文档,从中选取词频为多字词并且词典为单义词的词;明确正确选项,选择四个词语赋予词典词义解释;明确错误选项,从正确选项中选择,将词义解释中的某词通过相似性最低,字数相同的同义词代替,或者把被词的词义解释通过相似性最低,字数相同的同义词的词典词义解释代替[6]。自动生成数据示例具体如表1所示。
图表编号 | XD00142605400 严禁用于非法目的 |
---|---|
绘制时间 | 2020.03.25 |
作者 | 张菊、杨勇 |
绘制单位 | 河北工业职业技术学院宣钢分院、河北工业职业技术学院宣钢分院 |
更多格式 | 高清、无水印(增值服务) |