[EMNLP 2022]: 华科大认知计算与智能信息处理实验室20级研究张睿晗和21级研究生温笑非同学论文被计算语言学和自然语言处理领域的顶级国际会议EMNLP 2022作为Findings长文全文录用!

来源: 浏览量: 日期:2022-10-07


CCIIP实验室2020级研究生张睿晗同学(20209月入学,导师:魏巍)论文“HCL-TAT: A Hybrid Contrastive Learning Method for Few-shot Event Detection with Task-Adaptive Threshold”CCIIP实验室2021级研究生温笑非同学(20219月入学,导师:魏巍)论文” Sequential Topic Selection Model with Latent Variable for Topic-Grounded Dialogue”被自然语言处理顶级国际会议EMNLP 2022Proceedings of the 2022 Conference on Empirical Methods in Natural Language Processing)作为Findings长文全文录用。EMNLP 2022计划于2022127-1211日在阿布扎比举行。EMNLP虽然是CCF推荐的B类国际学术会议,但是在自然语言处理领域享有很高的学术声誉,在国外学术界与ACL具有同等学术地位。


1. HCL-TAT: A Hybrid Contrastive Learning Method for Few-shot Event Detection with Task-Adaptive ThresholdProceedings of the 2022 Conference on Empirical Methods in Natural Language Processing (Findings of EMNLP'2022), Abu Dhabi.

作者:Ruihan Zhang, Wei Wei*, Xian-Ling Mao, Rui Fang and Dangyang Chen

内容简介:传统基于监督学习的事件检测模型无法泛化到开放域事件检测任务(即无法识别训练集中未出现过的新事件),以往方法主要依赖于“识别-分类”的两阶段识别模型,即首先利用监督学习模型识别出触发词,再通过小样本学习模型对触发词进行细粒度分类。然而,上述方法存在以下问题:(1)在低资源场景下难以学到可区分性的特征表示;(2)学习到的触发词与非触发词间的margin边界模糊易导致误分类。为了克服上述挑战,我们提出了一种新颖的基于自适应阈值的混合对比学习框架(HCL-TAT),模型首先从利用对比学习框架从support-supportprototype-query不同角度构建对比范式学习更具区分性的触发词表示,然后利用设计的易于迁移的自适应阈值模型有效解决触发词/非触发词间的识别错误问题。通过在小样本数据集FewEvent上进行了不同设置下实验显示我们的方法在所有设置下都明显优于现有SOTA基线模型。

1:基线模型PA-CRFHCL-TAT在触发词表示上的可视化对比

2HCL-TAT模型结构图


2. Sequential Topic Selection Model with Latent Variable for Topic-Grounded DialogueIn: Proceedings of the 2022 Conference on Empirical Methods in Natural Language Processing (Findings of EMNLP'2022), Abu Dhabi.

作者:Xiaofei Wen, Wei Wei*, Xian-Ling Mao

内容简介:近期,面向话题引导/可控的对话系统研究引起广大学者广泛关注,其主要思想是如何有效利用对话历史上下文以及给定主题序列生成对话回复。目前,现有话题预测研究主要基于已有对话与给定对话序列预测下一个对话主题,而忽略了全局对话主题转移关系。针对上述问题,我们提出了一种基于全局话题转移关系的对话主题预测模型(SGTA),即在话题隐空间信息建模方面,我们利用多变量斜正态分布(MSN)和混合核函数对全局话题转移关系以及话题序列关系建模,并利用采样预测话题,同时利用主题感知的先验-后验模型优化主题选择逻辑以提升预测性能。通过与已有模型在大量实验上进行对比实验显示,所提模型在预测和生成任务上均优于目前已有SOTA基线模型

1:话题预测任务建模示意图

2SGTA模型结构图