《表1 倒排索引结构:编码单位可变的倒排索引压缩算法研究》

《表1 倒排索引结构:编码单位可变的倒排索引压缩算法研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《编码单位可变的倒排索引压缩算法研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

倒排索引是一种从关键字(单词或数字)映射到文档的索引数据结构,主要由单词表(terms)和倒排列表(posting lists)两个部分组成。单词表是所有索引词组成的集合,倒排列表由每个索引词对应的倒排链组成,记录了每个索引词所在文档的文档标识符(DocID)以及索引词在该文档中出现的频率(TF)和位置(Position),这些信息都是由一系列非负整数组成,因此对倒排索引的压缩可以等价成对非负整数序列的压缩。倒排索引的结构如表1所示。