《表1 5种标注类别:基于BiLSTM-CRF的MOOC课程评论抽取研究》

《表1 5种标注类别:基于BiLSTM-CRF的MOOC课程评论抽取研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于BiLSTM-CRF的MOOC课程评论抽取研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

假设MOOC课程评论集为S={s1,?,sN},N为MOOC课程评论集中的句子数。MOOC课程评论评价对象和评价词抽取任务就是从课程评论句si∈S中抽取评价对象集合Ai和评价词集合Oi。对于课程评论集S中的任意一个句子si∈S,存在若干个评价对象(MOOC课程的某个方面)集合Ai={ai1,?,sil},aij∈Ai可以是词,也可以是短语;存在若干个评价词集合Oi={oi1,?,oil},oir∈Oi可以是词,也可以是短语。这个任务可以用BIO表示方法形式化为一个序列标注问题。具体来说,就是si由一组词si={xi1,?,xTN}组成的序列构成。每一个词xi∈si被标注成如下5种类别中的一种:BA、IA、BO、IO和O,如表1所示。文中构建的基于Bi LSTM-CRF的MOOC课程评论评价对象和评价词抽取模型,如图1所示。这个Bi LSTM-CRF模型由4个部分组成: