《表2 分词后文档内容:基于Elasticsearch的知识库和病案检索服务平台的设计与实现》

《表2 分词后文档内容:基于Elasticsearch的知识库和病案检索服务平台的设计与实现》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于Elasticsearch的知识库和病案检索服务平台的设计与实现》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

倒排索引也叫反向索引[8],假定有3个文档,见表1。中文和英文等语言不同,单词之间没有明确分隔符号,所以首先要用分词技术将文档自动切分成单词序列。这样每个文档就转换为由单词序列构成的数据流,为了系统后续处理方便,需要对每个不同的单词赋予唯一的单词编号,同时记录下哪些文档包含这个单词。分词后的文档见表2。由表2可建立最简单的倒排索引见表3。