[IJCAI 2024]: 华科大认知计算与智能信息处理实验室22级研究生范士轩同学以及23级研究生丁卓君同学的论文被全文录用!

来源: 浏览量: 日期:2024-04-17

 

     2024年国际人工智能联合会议录用CCIIP实验室22级研究生范士轩同学以及23级研究生丁卓君同学(导师:魏巍)的论文“Position Debiasing Fine-Tuning for Causal Perception in Long-Term Dialogue”和“Improving Pseudo Labels with Global-Local Denoising Framework for Cross-lingual Named Entity Recognition”。2024年国际人工智能联合会议(IJCAI2024)计划于202483-89日在韩国召开。IJCAI是是中国计算机学会CCF推荐的A类国际学术会议,在人工智能领域享有较高学术声誉。

1)论文题目:Position Debiasing Fine-Tuning for Causal Perception in Long-Term Dialogue

论文作者:Shixuan Fan, Wei Wei*, Wendi Li, Xianling Mao, Wenfeng Xie, Dangyang Chen

内容简介:对话系统的核心是根据对话历史生成语义相关、情感丰富的类人反馈。近期大型语言模型(LLMs)的成功和卓越性能使其成为对话生成领域的基石,然而LLMs存在的天然缺陷,即固有位置偏差,导致其更多关注历史对话中起始和临近位置的语句,而忽略了语义的因果相关性,以至于多轮对话中经常产生万能回复/相关性低的回复。为了缓解上述问题,提出了一种因果感知多轮对话框架(CPD),其采用基于扰动的因果变量发现方法从历史对话中抽取因果相关性高的语句以增强模型因果感知能力。具体来说,提出了一种基于句间位置相关性评估的局部位置感知模型,利用句级扰动增量提升模型对历史相关语句的捕获能力,同时还提出了一种位置感知微调策略,通过添加扰动差异性地调整因果相关/非因果相关话语训练策略,以增加模型对因果不变性特征的学习能力。通过在多个数据集上实验显示,所提方法可有效缓解不同LLMs模型因位置偏差性导致的准确性下降问题,较现有基线模型性能有显著提升。


1 CPD整体框架图

 

2)论文题目:Improving Pseudo Labels with Global-Local Denoising Framework for Cross-lingual Named Entity Recognition

论文作者:Zhuojun Ding, Wei Wei*, Xiaoye Qu, Dangyang Chen

内容简介:跨语言命名实体识别(NER)主要是利用源语言数据来学习应用于目标语言NER模型,其困难在于缺乏目标语言上真实标签数据以训练模型。主流方法如翻译/标签映射等方法主要通过获取带伪标签的目标语言数据以训练模型,因此不可避免地引入噪声(错误标签)。针对该问题,提出了一种伪标签修正方法(GLoDe),该方法主要利用全局/局部语义空间信息逐步评估目标实例的潜在实体类型,进而指导其伪标签逐步修正以提高其准确性,同时考虑利用目标语言特定特征以提高模型泛化性。通过在两个基准数据集上实验显示,所提方法能够有效提高目标语言伪标签准确性,并且较现有基线模型相比性能有显著提升。


2 GLoDe整体框架图