《表3 1-10号二手房样本部分关键词tf-idf值》

《表3 1-10号二手房样本部分关键词tf-idf值》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于文本挖掘、GIS及Stacking框架的武汉市二手房评估模型》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

爬取的部分描述文本如表2所示。首先用jieba对二手房描述文本进行分词,为了实现更好的分词效果,添加使用小区名称等二手房描述常用词汇构建的用户词典,并去除停用词,之后对词频进行统计分析,本文选取tf-idf值前100的关键词加入模型,1-10号二手房样本部分关键词tf-idf值如表3所示,这些高频关键词的词云图如图7所示。通过分析发现,不仅“采光充足”、“老证”、“南北通透”等描述二手房优势的词频较高,“诚心出售”、“随时看房”等展现业主售房心态的词也会高频率出现。我们通常觉得二手房价不仅与房屋自身客观条件有关,还与售房者心态等主观因素有关,但传统评估方法难以客观量化这一影响因素,通过描述文本分析则可以将这一因素纳入估价模型,衡量其对二手房价的影响。