《表2 同时被较低数量高校收藏的图书数量占比》

《表2 同时被较低数量高校收藏的图书数量占比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《高校图书馆用户群体的阅读偏好——对“热门图书”数据的考察》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为提取出能够反映不同高校阅读特点的图书并且避免“维数灾难”,需要过滤掉SN值过高和过低的图书。那么,如何确定过滤的阈值?为此,本文统计了低SN值对应的图书数量的占比。如表2所示,SN值小于4的图书数量占了图书总数量的94.82%(即:接近95%,在统计上具有足够的代表性),因此以4作为SN值的下限。图书被收藏的高校数量最大值(SN_max)为91,本文取SN_max的1/2(取整为46)作为上限,而SN值大于46的图书只占图书总数量0.05%。所以提取每个类别中的图书特征的做法如下:在每个类别中统计图书被收藏的高校数量,剔除SN小于4的图书,同时统计各类中SN的最大值,以最大值的1/2作为上限,剔除SN超出上限的图书。各类别提取到的特征数量如图5所示,22个类别的特征数量总和为6934。