《Table 2 Comparative Analysis of Mainstream Intelligence Education Platforms and Applications表2主流智慧教
信息抽取从各种类型的数据源抽取构建知识图谱所需的各种候选实体(概念、知识主题)及节点间的关联关系(包括语义关系、认知关系等),形成一个个孤立的抽取图谱(extracted graphs).知识图谱主要来源于百科类网站和各种垂直站点的结构化数据,这类数据特点是质量较高、更新较慢.比如Google的知识图谱很大一部分来源于Freebase,Wikipedia和IMDB等网站.而另一方面,知识图谱通过从各种半结构化数据(如HTML表格)抽取相关实体的“属性-值”对来丰富实体的描述.通过信息抽取得到的知识数据更大,并能及时发现最新的实体或事实,但其质量相对较差,存在一定的错误.Cafarella等人[13-14]开发了WebTables系统,该系统使用分类技术从海量HTML页面的150亿表格中抽取了1.5亿条的高质量关系数据.该系统后来被Google收购用于构建Google的知识图谱.Venetis等人[15]开发了一个用于HTML中海量表格的语义标注系统.该系统首先从Web上抽取得到含有噪音的类标签及它们之间的关系形成一个数据库,基于该数据库及Web上观察到的实例标注表格的每个列,从而获得表格的语义.Mintz等人[16]提出一种Distant Supervision的方法从Web抽取各种关系,该方法假定,如果已知2个实体存在特定的语义关系,那么包含实体对的句子在某种程度上就存在表征二者语义关系的作用.这种方法充分利用了现有的知识库,如Wikipedia、本体或者人工标注的小规模实体对,将这些高质量关系实体对作为种子,从Web中挖掘包含已知实体对的大规模文本,作为自动标注的语料库,然后使用监督学习解决关系抽取问题.
图表编号 | XD0034821300 严禁用于非法目的 |
---|---|
绘制时间 | 2019.01.01 |
作者 | 郑庆华、董博、钱步月、田锋、魏笔凡、张未展、刘均 |
绘制单位 | 西安交通大学电子与信息工程学院、大数据算法与分析技术国家工程实验室(西安交通大学)、西安交通大学继续教育学院、大数据算法与分析技术国家工程实验室(西安交通大学)、 西安交通大学电子与信息工程学院、大数据算法与分析技术国家工程实验室(西安交通大学)、 西安交通大学电子与信息工程学院、大数据算法与分析技术国家工程实验室(西安交通大学)、西安交通大学继续教育学院、大数据算法与分析技术国家工程实验室(西安交通大学)、西安交通大学电子与信息工程学院、大数据算法与分析技术国家工程实验室(西安交通大学)、 西安交通大学 |
更多格式 | 高清、无水印(增值服务) |
查看“Table 2 Comparative Analysis of Mainstream Intelligence Education Platforms and Applications表2主流智慧教育平台及应用对比分析”的人还看了
-
- 表2 两组Th1、Th2、Th1/Th2、Th9、Th17表达水平比较分析 (n=86, ±s) Table 2 Comparative analysis of the expression levels of Th1, Th2, Th1/