《表1 各社会支持类型帖子示例》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《在线健康社区中用户社会支持交换行为的跨文化比较研究》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

在之前的研究中[46]，我们基于帖子文本特征构建分类模型，在社会支持的识别训练上取得了良好的效果。考虑到近两年来深度学习方法在文本挖掘中的高效发展，本研究引入词袋模型（BOW）和Word2Vec（W2V）[47]构建新的文本特征集用于构建分类模型，见表2。本研究利用逻辑回归、支持向量机、朴素贝叶斯、K近邻、决策树、随机森林、Ada Boost多种算法和不同特征集进行组合，对训练集数据进行训练和评估，通过十折交叉验证并使用加权F1得分和加权AUC评估分类模型的性能。表3给出模型训练后精度最好的算法和特征集的组合，更多模型训练细节及结果对比方式可参考WANG et al.[46]的研究，最终选取分类效果最好的训练模型并应用于所有未标记的数据。表4给出分类运行结果，即社会支持内容在在线健康社区中的分布。值得注意的是，并不是所有帖子都包含社会支持，如一些广告帖、灌水帖等。在USOHC中，不包含社会支持内容的帖子有1 339 144个，在CNOHC中相应内容的帖子为49 800个。

图表编号	XD00162026500 严禁用于非法目的
绘制时间	2020.01.20
作者	王熙、佟星、郑博雯、朱渝珊、谭天一、曾钰琪、李惠
绘制单位	中央财经大学信息学院、乔治梅森大学人文与社会科学学院、清华大学经济管理学院、中央财经大学信息学院、中央财经大学信息学院、中央财经大学信息学院、中央财经大学信息学院
更多格式	高清、无水印（增值服务）