《表3 1-10号二手房样本部分关键词tf-idf值》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于文本挖掘、GIS及Stacking框架的武汉市二手房评估模型》
爬取的部分描述文本如表2所示。首先用jieba对二手房描述文本进行分词,为了实现更好的分词效果,添加使用小区名称等二手房描述常用词汇构建的用户词典,并去除停用词,之后对词频进行统计分析,本文选取tf-idf值前100的关键词加入模型,1-10号二手房样本部分关键词tf-idf值如表3所示,这些高频关键词的词云图如图7所示。通过分析发现,不仅“采光充足”、“老证”、“南北通透”等描述二手房优势的词频较高,“诚心出售”、“随时看房”等展现业主售房心态的词也会高频率出现。我们通常觉得二手房价不仅与房屋自身客观条件有关,还与售房者心态等主观因素有关,但传统评估方法难以客观量化这一影响因素,通过描述文本分析则可以将这一因素纳入估价模型,衡量其对二手房价的影响。
图表编号 | XD00142540100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.02.15 |
作者 | 徐璐琳、李忠武、朱冬元 |
绘制单位 | 中国地质大学(武汉)经济管理学院 |
更多格式 | 高清、无水印(增值服务) |