《表3 健康教育短文集的主题分布》
本文使用MALLET 2.0.8开源工具包[18]对健康教育文章进行主题分类。相关研究表明,MALLET能够高效实现基于抽样的潜在狄利克雷分配(LDA)[6]。LDA推荐模型建立中主题数K的参数设置至关重要。本文通过计算不同主题数模型的coherence值,反复进行试验后,将主题数定为10。健康教育短文集中的10个主题及主题对应的词汇(Top20)如表3所示。从表3可见,健康教育文章主要分布于主题9、主题1、主题2和主题10,内容分别涉及高血压药物、生活方式、不同年龄段血压信息、症状。
图表编号 | XD00215128800 严禁用于非法目的 |
---|---|
绘制时间 | 2020.10.01 |
作者 | 陈育新、安欣宇、刘春鹤、兰雪、张晗 |
绘制单位 | 中国医科大学医学信息学院、中国医科大学医学信息学院、中国医科大学医学信息学院、中国医科大学医学信息学院、中国医科大学医学信息学院 |
更多格式 | 高清、无水印(增值服务) |