《表1 专利科学引文摘要各聚类中心点》

《表1 专利科学引文摘要各聚类中心点》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于专利科学引文内容表示学习的科学技术主题关联分析研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

利用TensorFlow(1)提供的T-SNE算法对专利科学引文摘要向量进行聚类以及可视化展示,结果如图3所示。利用表示学习方法Doc2Vec得到科学专利引文内容的语义向量表示,将其映射在同一向量空间内,相似的主题集中分布在同一片区域,如图3所示的5个聚类主题,而相关的主题分布十分靠近。通过专利科学引文的摘要内容形成5个研究主题,选取每个主题中靠近中心的点作为各个聚类的代表,各聚类中心点附近的专利科学引文信息如表1所示。通过这5个中心点附近专利科学引文的标题和摘要,确定对应专利科学引文的研究方向,从而确定各聚类内的专利科学引文对应的研究方向。结果显示,纳米技术领域内的专利科学引文研究主要分布在纳米生物、纳米医学领域,在纳米材料领域也有一定的分布,表明纳米技术可能吸收借鉴并反作用于生物、医学、材料等基础研究,形成的纳米材料、纳米医学、纳米生物学等新兴研究领域在专利和科学论文中都有所体现,其中,纳米医学是将纳米科学与技术的原理、方法应用于医学,纳米生物学是用于研究生命现象的纳米技术,它是纳米技术和生物学的结合。节点数较多的两个聚类是聚类3和聚类4,且两者十分接近并具有交叉融合的趋势,可以认为这两个主题表示的纳米生物、医学领域的研究具有一定的代表性,是纳米技术领域的重要研究方向。