《表3 最简单的倒排索引:基于Elasticsearch的知识库和病案检索服务平台的设计与实现》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于Elasticsearch的知识库和病案检索服务平台的设计与实现》
倒排索引也叫反向索引[8],假定有3个文档,见表1。中文和英文等语言不同,单词之间没有明确分隔符号,所以首先要用分词技术将文档自动切分成单词序列。这样每个文档就转换为由单词序列构成的数据流,为了系统后续处理方便,需要对每个不同的单词赋予唯一的单词编号,同时记录下哪些文档包含这个单词。分词后的文档见表2。由表2可建立最简单的倒排索引见表3。
图表编号 | XD00216013000 严禁用于非法目的 |
---|---|
绘制时间 | 2021.03.18 |
作者 | 程彪、张晓明、阮晨 |
绘制单位 | 中国科技大学附属第一医院(安徽省肿瘤医院)信息中心、中国科技大学附属第一医院(安徽省肿瘤医院)信息中心、中国科技大学附属第一医院(安徽省肿瘤医院)信息中心 |
更多格式 | 高清、无水印(增值服务) |