CCIIP实验室24级硕士生潘向宸同学(导师:魏巍)的论文 “Curr-RLCER:Curriculum Reinforcement Learning For Coherence Explainable Recommendation”被数据库系统高级应用国际会议(DASFAA 2026)录用。第31届国际数据库高级应用会议(Dasfaa 2026),该会议将于2026年4月27日至4月30日举行!Dasfaa是中国计算机学会CCF推荐的B类国际学术会议,是全球著名数据库研究及其应用技术会议。

CCIIP实验室24级硕士生潘向宸同学(导师:魏巍)的论文 “Curr-RLCER:Curriculum Reinforcement Learning For Coherence Explainable Recommendation”被数据库系统高级应用国际会议(DASFAA 2026)录用。第31届国际数据库高级应用会议(Dasfaa 2026),该会议将于2026年4月27日至4月30日举行!Dasfaa是中国计算机学会CCF推荐的B类国际学术会议,是全球著名数据库研究及其应用技术会议。
论文标题:Curr-RLCER:Curriculum Reinforcement Learning For Coherence Explainable Recommendation
作者:Xiangchen Pan, Wei Wei*
内容简介:推荐系统长期存在黑盒问题,而可解释推荐系统(RSs)旨在推荐过程中给出对应推荐理由,从而提高RSs透明度和可信度。以往方法通常同时计算推荐分数并生成相应解释,但预测和生成任务之间目标存在不一致性。针对该问题,我们提出了一个基于动态评分对齐的强化学习推荐系统框架用于保证生成解释的一致性,其主要基于课程学习框架,从传统推荐预测(如点击率-CTR预测、评分预测等)上生成对应的开放域推荐解释,其中每个阶段单独设计奖励函数以逐步增强RSs的稳定性。同时,为增强生成解释与预测评分目标间的一致性,我们还额外提出了一种一致性驱动奖励机制。通过在多个可解释推荐数据集上充分实验表明,所提方法已显著超越目前已有基线模型。

Curr-RLCER框架图