《表3 大语料集上藏文词同现网络的基本数据表》

《表3 大语料集上藏文词同现网络的基本数据表》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《藏文词同现网络的构建及特征分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了从各个方面准确地分析藏文词同现网络的特征,本文将语料按体裁分为诗歌、散文、政治、佛教、教材、口语六大类,诗歌10篇、散文15篇、政治8篇、佛教2篇(因佛教类语料规模较小,故比较时不做考虑)、教材15篇及口语14篇共计64篇大小基本相同的文章。在建立的藏语语料库的基础上,依据藏文词同现网络的构建规则,从小语料集、大语料集和全集语料集等3个层面构建了藏文词同现网络,进而分析了藏文词同现网络的小世界效应和无标度特征。小语料集是指6种不同体裁中的每一篇文章,大语料集是指从每类体裁语料中相应的小语料合并而成的6种不同类型的语料集,全集语料集是指将6种不同体裁合并成一个整体的语料。为每个小语料构建一个词的同现网络,共64个藏文词同现网络;每一类语料构造一个词同现网络,共构造了6个词同现网络;对全语料集构建了1个词同现网络。对收集整理的语料建立的71个藏文词同现网络,统计了藏文词长度Length、顶点数N、边数E、直径D、平均度、平均最短路径长度L、平均最短路径长度参考系数Lr、平均聚类系数C、平均聚类系数参考系数Cr、幂律指数γ等统计参数。小语料集藏文词同现网络的基本数据(平均值)参数见表2,相应同现网络的L、C和γ的平均值分布如图2所示;大语料集藏文词同现网络的基本数据参数见表3,相应同现网络的L、C和γ的分布如图3所示;全集语料藏文词同现网络的统计参数见表4。