《表3 经过主题N元语法模型分析后的科技报告实例》
其中nm(k)表示文档m中的词汇被分配给主题k的数量,nk(v)表示词汇v作为一元语法分配给主题k的数量,nk(,vv')表示给定前一定词汇v的条件下词汇v'作为二元语法的第二项被分配给主题k的数量,nk(x,v)表示给定前一定词汇v以及相应的主题k的条件下当前词汇的状态为x的数量。需要说明的是,如果事先知道某些词可以形成短语,那么通过设置状态变量xm,n可以引入相应的领域先验知识。比如:“分子”与“机制”可形成短语“分子机制”,则将与“机制”对应的二元语法状态变量xm,n设置为1即可。而且,具体几元语法由模型估计确定,比如表3就同时包含一元、二元、三元和四元语法结构。
图表编号 | XD0070465500 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.05 |
作者 | 安欣、徐硕 |
绘制单位 | 北京林业大学经济与管理学院、北京工业大学经济与管理学院北京现代制造业发展研究基地 |
更多格式 | 高清、无水印(增值服务) |