《表1 语料库字、词情况:张爱玲和王安忆小说的计量统计和分析》

《表1 语料库字、词情况:张爱玲和王安忆小说的计量统计和分析》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《张爱玲和王安忆小说的计量统计和分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文选择张爱玲及王安忆的三部小说为研究语料,并为了在图表中方便表示进行编号。首先对文本进行预处理:删去章节号、标题、前言与后记。再使用NLPIR汉语分词系统对文本进行分词,并据此统计语料库中字、词、标点的数量和句子、段落的长度,见表1,表2。