《表4 生成对话示例2:基于近端策略优化与对抗学习的对话生成》

《表4 生成对话示例2:基于近端策略优化与对抗学习的对话生成》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于近端策略优化与对抗学习的对话生成》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在对话生成领域,对话的评估是困难的,目前没有一个好的评估指标能从整体上评估对话的好坏,最好的方式是通过人类主观来评估。表3~表5展示了与不同算法的随机对话得到的部分示例,其中表3对话示例1的输入为:we should finish the paper quickly。表4对话示例2的输入为:your dress is so beautiful。表5对话示例3的输入为:buy me a bottle of water。可以看出,PPO_GAN算法得到的回复一般拥有较好的文法结构,更重要的是,PPO_GAN算法得到的回复拥有更多的信息量,与对话的输入也有更强的上下文相关性,明显减少了无意义对话以及无关对话出现的情况。