《表3 正文结束行块定位方法及步骤》

《表3 正文结束行块定位方法及步骤》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《改进的中文静态网页新闻正文自动抽取算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

经过行块分割后可得到行块分布函数,考虑到行块分布函数里面所有的内容都是按顺序连续排列的。因此需要准确定位正文的结束行块位置只需从后往前遍历,定位出结束边界即可。利用字符串最长公共子序列长度来辅助定位结束行块位置,具体计算步骤如表3所示。