《表1 3GPP技术规范测试数据集》

《表1 3GPP技术规范测试数据集》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于万有引力模型的关键词自动抽取方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文以3GPP官网(http://www.3gpp.org/)公开的技术规范作为实验数据,由于3GPP技术规范在通信行业专利侵权检测工作中被广泛引用,因此具有较高的权威性和标引价值。去除3GPP技术规范中的扉页、图片、公式、表格以及非法字符等噪音后,得到8000篇不同版本不同系列的技术规范,大小为1.22G。同时,在11G英文维基百科语料和8000篇3GPP技术规范上训练word2vec模型,上下文窗口设为10,向量维度m设为200,得到1 124 676条词向量。从8000篇技术规范中随机抽取5组不同主题系列的文献作为测试数据集,技术规范涵盖服务、技术实现、信号处理以及无线电领域,具体分组见表1。