[COLING 2022]: 29届国际计算机语言大会COLING 2022全文录用CCIIP实验室19级研究刘家邑同学论文!

来源: 浏览量: 日期:2022-08-20

 

CCIIP实验室2019级研究生刘家邑同学(2019年9月入学,导师:魏巍,已入职阿里)论文“Incorporating Casual Analysis into Diversifed and Logical Response Generation”被计算语言学国际顶级会议COLING 2022录取。第29届COLING 2022会议将会在2022年10月12号-17号在韩庆州市举行。COLING为自然语言处理领域最重要的国际会议之一,每两年举办一次。

 

论文标题:Incorporating Casual Analysis into Diversified and Logical Response Generation

作者:Jiayi Liu, Wei Wei*, zhixuan chu, Xing Gao, Ji Zhang, Tan Yan and Yulin Kang

 

论文简介:多样性对话生成(Diversified Response Generation)一直是对话领域一个亟待解决的重要问题,但该问题在学术界目前仍未得到有效解决。现有的方法主要利用条件变分自编码(Conditioned Variational Auto Encoder, CVAE)中的语义空间采样引入一定随机性,从而增加生成回复的多样性。但是,此类方法会显著降低上下文相关性。本文从因果推理方式出发,分析了现有CVAE模型当中可能存在的Confounder,导致其从Post到多样性ResponseMapping容易学到部分虚假线索,从而影响其相关性。基于以上因果分析,本文定义通用回复范式,即:直接回复+间接回复模式(只生成一部分可以看成是该范士的special case之一,输出时可以根据情况只输出一部分即可),比如:

  • :吃饭了吗?

  • 回答:还没有(直接回复)+今天中午太忙了,来不及吃(间接回复)

实际间接回复语义是多样的,比如没吃的原因还可能是“因为正在减肥所以不想吃”,或者是“晚上要吃大餐,所以中午先不吃了”等等,因此该问题的核心难点在于如何保证直接回复和间接回复语义一致性条件下增加间接回复的语义多样性,否则生成如:“还没吃啊”(直接回复)+“中午食堂饭菜太可口了,我都吃撑啦”这样前后语义矛盾的回复。

针对上述问题,本文一种基于动态条件的CVAE网络模型,该模型根据直接回复语义信息为代理(Proxy)生成直接回复语义Mediator,然后基于句子层级的自回归预测方法利用Mediator预测具有多样性的补充语义的间接回复语义信息。该模型包含一个Mediator预测网络和一个动态条件限制生成的CVAE网络。在真实大规模对话数据集上,本文提出的模型在自动指标和人工指标上超越了现有的State-of-the-Art模型。

1:对话多样性当中的因果分析


2:动态条件限制生成的CVAE网络(TGG-CVAE模型)


3:生成样例