《表2 实验数据说明:基于计量风格学的多层次特征在作者识别应用研究》
从大众的认知基础上分析,如果作者的风格差异较大,比如鲁迅和张爱玲的风格对比来看,鲁迅是批判现实的短篇小说家,散文家,张爱玲是以描写生活风月为主的小说作家,无论是人为的根据经验,还是使用统计方法,都是比较容易区分的。武侠小说作者金庸、古龙、东方玉、梁羽生所处时代相似,都是比较有名且具有代表作品的武侠小说作者,因为创作时间和主题相似,且部分作品会受到先发表作品的作者影响而具有一定的风格相似性,如果不是有非常丰富的经验,或者是采用复杂的统计学方法,是比较难以区分的[13]。所以本文使用Python爬虫工具和解析工具从武侠小说网站清洗得到了四位作者的部分或者全部小说作品作为了本次的实验数据如表2。
图表编号 | XD00163292500 严禁用于非法目的 |
---|---|
绘制时间 | 2020.05.20 |
作者 | 钟敏、汪洋 |
绘制单位 | 武汉邮电科学研究院、南京烽火软件科技有限公司 |
更多格式 | 高清、无水印(增值服务) |