《表1 VUA语料分布情况》

《表1 VUA语料分布情况》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于神经网络方法的隐喻识别研究综述》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

VUA(VU Amsterdam Metaphor Corpus)[9]是隐喻识别任务中目前公开的最大的人工标注的,跨领域的比喻性语言语料,由四大类文本组成,即学术文本、小说文本、新闻文本、对话文本,语料包含2626个段落(

标签),16000多个句子(标签),20万词汇量(标签),其中对话文本不存在段落标签,而是用标签来表示每一轮对话。该语料是基于MIPVU隐喻识别规则,并从BNC-Baby中选择一部分文本进行标注而得到,标注Kappa值超过0.8,其文本大致分布见表1。