《表1 IDF和TF-IDF计算示例》

《表1 IDF和TF-IDF计算示例》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于Stacking集成学习的水稻表型组学实体分类研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

以“半矮秆基因”URL网页(http:∥www.ricedata.cn/gene/list/30.htm)为例,该文有902个词,“水稻”、“半矮秆基因”分别出现13、2次,通过式(1)得出词频(TF)为0.014 4、0.002 2。网页总数为1 966,包含“水稻”的网页数为1 731个,包含“半矮秆基因”的网页数为16个。则它们的逆文本频率IDF和TF-IDF计算示例如表1所示。