《表7 小说中人物外号频数不小于基准名频数的统计 (节选)》

《表7 小说中人物外号频数不小于基准名频数的统计 (节选)》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《长文本武侠小说外号识别研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

图2是选取的15部小说指示词、OW内外号、基准名和外号名频数统计。其中,基准名和外号名频数统计对应图二中的折线图,对应的坐标轴是右边纵坐标轴和下边横坐标轴;指示词和OW内外号频数统计对应图2中的直方图,对应的坐标轴是左边纵坐标轴和上边横坐标轴。如图2中折线图所示,选取的15部武侠小说中人名和外号名的频数分布基本符合我们的常规认知,即小说中主要人物出现次数会远大于次要人物;从图中也可以看出15部小说中人物原名与外号名出现频数相差较大,所以在利用ORS算法来对外号进行识别的时候会有很多“噪音”字符串。这也印证了引入KNHD和LPD的必要性,有利于对“噪音”字符串的去除以及对真实外号的提取。同时,如表7所示,在实验中,若小说中人物外号出现次数比原名出现频数多,则这些外号都可以被正确识别。这可以通过对ORS算法的分析解释,因人名所在的观察窗口的字符串除了外号还有很多“噪音”字符串。但是,外号频数若大于人名频数,人名所在的观察窗口的字符串为外号的概率会增大,则通过ORS方法往往能找出人名对应的外号。