《表1 藏文初始语料库:基于MLP和SepCNN神经网络模型的藏文文本分类研究》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于MLP和SepCNN神经网络模型的藏文文本分类研究》
针对新闻类文本分类任务,通过网络爬虫技术分别从中国西藏网、中国西藏新闻网、青海藏族网、中国藏族网通4家新闻网站中找到所需类别文本链接,抓取新闻文本内容,构建初始藏文语料集。为了提高数据质量,通常还需要对初始文本进行预处理操作,其中包括文本规范化处理和编码转换保存处理。整理得出可用于实验的语料类别和数量分布如表1所示。
图表编号 | XD00207357900 严禁用于非法目的 |
---|---|
绘制时间 | 2020.12.01 |
作者 | 苏慧婧、索朗拉姆、尼玛扎西、群诺 |
绘制单位 | 西藏大学信息科学技术学院、西藏大学信息科学技术学院、西藏大学信息科学技术学院、西藏大学信息科学技术学院 |
更多格式 | 高清、无水印(增值服务) |