《表1 藏文初始语料库:基于MLP和SepCNN神经网络模型的藏文文本分类研究》

《表1 藏文初始语料库:基于MLP和SepCNN神经网络模型的藏文文本分类研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于MLP和SepCNN神经网络模型的藏文文本分类研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

针对新闻类文本分类任务,通过网络爬虫技术分别从中国西藏网、中国西藏新闻网、青海藏族网、中国藏族网通4家新闻网站中找到所需类别文本链接,抓取新闻文本内容,构建初始藏文语料集。为了提高数据质量,通常还需要对初始文本进行预处理操作,其中包括文本规范化处理和编码转换保存处理。整理得出可用于实验的语料类别和数量分布如表1所示。