《表1 语料库字、词情况:张爱玲和王安忆小说的计量统计和分析》
本文选择张爱玲及王安忆的三部小说为研究语料,并为了在图表中方便表示进行编号。首先对文本进行预处理:删去章节号、标题、前言与后记。再使用NLPIR汉语分词系统对文本进行分词,并据此统计语料库中字、词、标点的数量和句子、段落的长度,见表1,表2。
图表编号 | XD00139070300 严禁用于非法目的 |
---|---|
绘制时间 | 2019.12.25 |
作者 | 杨晨 |
绘制单位 | 南京师范大学文学院 |
更多格式 | 高清、无水印(增值服务) |
本文选择张爱玲及王安忆的三部小说为研究语料,并为了在图表中方便表示进行编号。首先对文本进行预处理:删去章节号、标题、前言与后记。再使用NLPIR汉语分词系统对文本进行分词,并据此统计语料库中字、词、标点的数量和句子、段落的长度,见表1,表2。
图表编号 | XD00139070300 严禁用于非法目的 |
---|---|
绘制时间 | 2019.12.25 |
作者 | 杨晨 |
绘制单位 | 南京师范大学文学院 |
更多格式 | 高清、无水印(增值服务) |