《表3 对话状态矩阵生成算法》
利用对话流文本段集合PDF生成文本段词链表(行1-3);行1-3的算法复杂度为O(N*M*O (Word segmentation)) ,其中,N为对话流文本段个数,M为对话流文本段中文本段个数最大值,乘上使用分词算法的复杂度.利用文本段词链表训练LDA模型(行4);行4的算法复杂度为O(N*M*K*L),其中,N为迭代数,M为文档个数,K为主题数,L为文档中词个数的均值.申明主题词集合,并将K个主题下的前M个高频词加入主题词集合,按顺序编号后形成主题词表TWT(行5-9);申明对话流状态矩阵集合M DF和成绩等级向量集合RV(行10-11);遍历对话流文本段PDFi生成对话流状态矩阵M DFi和成绩等级向量RVi并加入对应的集合(行12-16);
图表编号 | XD0060249000 严禁用于非法目的 |
---|---|
绘制时间 | 2019.02.01 |
作者 | 罗达雄、叶俊民、郭霄宇、王志锋、陈曙 |
绘制单位 | 华中师范大学计算机学院、华中师范大学计算机学院、华中师范大学计算机学院、华中师范大学教育信息技术学院、华中师范大学计算机学院 |
更多格式 | 高清、无水印(增值服务) |