《Table 2 Comparative Analysis of Mainstream Intelligence Education Platforms and Applications表2主流智慧教

《Table 2 Comparative Analysis of Mainstream Intelligence Education Platforms and Applications表2主流智慧教   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《智慧教育研究现状与发展趋势》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

信息抽取从各种类型的数据源抽取构建知识图谱所需的各种候选实体(概念、知识主题)及节点间的关联关系(包括语义关系、认知关系等),形成一个个孤立的抽取图谱(extracted graphs).知识图谱主要来源于百科类网站和各种垂直站点的结构化数据,这类数据特点是质量较高、更新较慢.比如Google的知识图谱很大一部分来源于Freebase,Wikipedia和IMDB等网站.而另一方面,知识图谱通过从各种半结构化数据(如HTML表格)抽取相关实体的“属性-值”对来丰富实体的描述.通过信息抽取得到的知识数据更大,并能及时发现最新的实体或事实,但其质量相对较差,存在一定的错误.Cafarella等人[13-14]开发了WebTables系统,该系统使用分类技术从海量HTML页面的150亿表格中抽取了1.5亿条的高质量关系数据.该系统后来被Google收购用于构建Google的知识图谱.Venetis等人[15]开发了一个用于HTML中海量表格的语义标注系统.该系统首先从Web上抽取得到含有噪音的类标签及它们之间的关系形成一个数据库,基于该数据库及Web上观察到的实例标注表格的每个列,从而获得表格的语义.Mintz等人[16]提出一种Distant Supervision的方法从Web抽取各种关系,该方法假定,如果已知2个实体存在特定的语义关系,那么包含实体对的句子在某种程度上就存在表征二者语义关系的作用.这种方法充分利用了现有的知识库,如Wikipedia、本体或者人工标注的小规模实体对,将这些高质量关系实体对作为种子,从Web中挖掘包含已知实体对的大规模文本,作为自动标注的语料库,然后使用监督学习解决关系抽取问题.