《表3 大语料集上藏文词同现网络的基本数据表》
为了从各个方面准确地分析藏文词同现网络的特征,本文将语料按体裁分为诗歌、散文、政治、佛教、教材、口语六大类,诗歌10篇、散文15篇、政治8篇、佛教2篇(因佛教类语料规模较小,故比较时不做考虑)、教材15篇及口语14篇共计64篇大小基本相同的文章。在建立的藏语语料库的基础上,依据藏文词同现网络的构建规则,从小语料集、大语料集和全集语料集等3个层面构建了藏文词同现网络,进而分析了藏文词同现网络的小世界效应和无标度特征。小语料集是指6种不同体裁中的每一篇文章,大语料集是指从每类体裁语料中相应的小语料合并而成的6种不同类型的语料集,全集语料集是指将6种不同体裁合并成一个整体的语料。为每个小语料构建一个词的同现网络,共64个藏文词同现网络;每一类语料构造一个词同现网络,共构造了6个词同现网络;对全语料集构建了1个词同现网络。对收集整理的语料建立的71个藏文词同现网络,统计了藏文词长度Length、顶点数N、边数E、直径D、平均度
图表编号 | XD00224529500 严禁用于非法目的 |
---|---|
绘制时间 | 2020.09.01 |
作者 | 加羊东周、才智杰、才让卓玛、三毛措 |
绘制单位 | 青海师范大学计算机学院、藏文信息处理教育部重点实验室、青海省藏文信息处理与机器翻译重点实验室、青海师范大学计算机学院、西南民族大学计算机科学与技术学院、藏文信息处理教育部重点实验室、青海省藏文信息处理与机器翻译重点实验室、青海师范大学计算机学院、西南民族大学计算机科学与技术学院、藏文信息处理教育部重点实验室、青海省藏文信息处理与机器翻译重点实验室、青海师范大学计算机学院、藏文信息处理教育部重点实验室、青海省藏文信息处理与机器翻译重点实验室 |
更多格式 | 高清、无水印(增值服务) |