《表1 词林编码分级表:词向量和语义知识相结合的汉语未登录词语义预测研究》

《表1 词林编码分级表:词向量和语义知识相结合的汉语未登录词语义预测研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《词向量和语义知识相结合的汉语未登录词语义预测研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文使用《同义词词林(扩展版)》[16]作为语义类别标注的依据。《同义词词林》是由梅家驹等[4]编纂的一部类义词典,2005年哈尔滨工业大学信息检索研究室对其进行扩充及编码,共计收录词语7万多个,分为12个大类、94个中类、1 428个小类、4 223个词群和17 809个原子词群。词林中每个原子词群表示一个概念,由一个8位编码表示,收录一个或多个同义词。例如,词集“Bi18A01=昆虫虫虫子”各编码位意义如表1所示。