《表1 专利文本数据集:基于BERT+ATT和DBSCAN的长三角专利匹配算法》

《表1 专利文本数据集:基于BERT+ATT和DBSCAN的长三角专利匹配算法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于BERT+ATT和DBSCAN的长三角专利匹配算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

BERT的词向量模型的训练语料THUCNews中文数据集。THUCNews是根据新浪新闻RSS订阅频道2005至2011年间的新闻数据筛选得到,包含74万篇新闻文档(2.2GB),均为UTF-8纯文本格式。专利向量的聚类模型采用DBSCAN模型。