《表1 检索式和生成式方法得到的回复示例》
注:当前语境为“我想送妈妈一件礼物,你有什么好的建议吗”
面向开放领域对话系统的构建方法主要分为检索式和生成式两大类。检索式对话系统[1,2]的主要思路是根据文本相似度从语料库中检索回复,通常这些回复是信息量丰富且语法正确的,但是它们往往并不符合当前的语境(如表1中R#1所示)。生成式对话系统[3~13]则是基于深度学习模型,从大量的语料中学习对话的特征,从而实现根据当前语境自动生成回复。与检索式模型相反的是,生成式模型得到的回复通常是更符合当前语境并且灵活的,但是它们可能会有一些语法错误(如表1中R#2所示)或者普适的回复(如表1中R#3所示)。在此基础上,一些研究将检索式和生成式以并行或串行的方式结合起来[14~17],力求联合模型能够既保留检索式有意义且流畅的优点,又继承生成式多样且相关度高的优势。这种联合方法使模型得到的回复在语法、信息量和上下文相关性上有了较大的提高。然而在实验过程中发现,在并行的联合模型中检索回复由于其包含的信息量多,往往能得到较高的匹配分数;在串行的联合模型中检索回复作为生成模型的改写原型会为生成结果引入无关信息。因此,目前已有的联合模型所得到的回复在内容上会更接近检索回复。实验结果还表明,以生成回复为最终结果的串行联合模型在遣词造句上还有进一步提高的空间。于是,针对联合模型的回复在内容上受检索语句影响较大的问题,本文提出利用语境信息对生成的回复进行把关,针对串行联合模型生成的回复语句不畅的问题,本文提出利用检索回复对已生成的句子进行二次打磨,这样可以减少无关信息的影响,同时又保证了生成回复的信息量和语法正确性。
图表编号 | XD00202095800 严禁用于非法目的 |
---|---|
绘制时间 | 2021.02.05 |
作者 | 张凉、杨燕、陈成才、贺樑 |
绘制单位 | 华东师范大学计算机科学与技术学院、华东师范大学计算机科学与技术学院、上海智臻智能网络科技股份有限公司小i机器人研究院、华东师范大学计算机科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |