《表1 主要元素说明:面向资源建设的微信公众号学术文章特征框架构建与实证研究》

《表1 主要元素说明:面向资源建设的微信公众号学术文章特征框架构建与实证研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《面向资源建设的微信公众号学术文章特征框架构建与实证研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

微信公众号的文章一直是基于HTML页面的格式以纯网络资源的形式存在。要想对数量庞大的推文进行收录和标引,笔者认为应从原文件的描述方式出发寻找可以用作识别项的元素信息。因此,本框架的元素集是以便于网络爬虫抓取为前提,结合微信文章特性,参考DC元数据[11]15个基本项,对微信文章的HTML源代码标签项进行抽取和归纳,并对网页源代码中无法获取但对于实现检索需求所必需的元素进行自定义补充得出的。对本框架涉及的主要元素的选择与定义的简要说明见表1。