《表1 倒排索引结构:编码单位可变的倒排索引压缩算法研究》
倒排索引是一种从关键字(单词或数字)映射到文档的索引数据结构,主要由单词表(terms)和倒排列表(posting lists)两个部分组成。单词表是所有索引词组成的集合,倒排列表由每个索引词对应的倒排链组成,记录了每个索引词所在文档的文档标识符(DocID)以及索引词在该文档中出现的频率(TF)和位置(Position),这些信息都是由一系列非负整数组成,因此对倒排索引的压缩可以等价成对非负整数序列的压缩。倒排索引的结构如表1所示。
图表编号 | XD0090171000 严禁用于非法目的 |
---|---|
绘制时间 | 2019.08.01 |
作者 | 安兆翔、瞿有利 |
绘制单位 | 北京交通大学计算机与信息技术学院、北京交通大学计算机与信息技术学院 |
更多格式 | 高清、无水印(增值服务) |