华中科技大学“认知计算与智能信息处理实验室”依托于计算机学院,拥有自由开放的学术氛围,致力于认知科学与智能信息处理的前沿交叉研究。实验室聚焦人工智能领域核心理论与方法,重点探索自然语言处理、计算机视觉以及具身智能领域模型与算法设计、形式化方法与具体应用研究等。目前主要研究方向包括:信息检索与推荐、自然语言处理、图像与视频理解、机器学习(侧重深度学习与强化学习)、多模态大模型、大模型高效微调、大模型推理优化、具身智能&智能体等。实验室现有教授2名、副教授2名、讲师1名,在读硕博士研究生50余人,已形成结构合理、前沿探索与工程落地并重的一流科研团队。

图1:实验室师生合影
一、学术研究
2025年,华中科技大学认知计算与智能信息处理实验室紧密围绕人工智能前沿核心领域,在自然语言处理、计算机视觉、信息检索与智能决策等方向持续深耕,并积极拓展多模态学习及交叉学科研究。本年度,实验室在人工智能与数据科学领域的国际顶级会议与期刊上取得了丰硕成果,在CVPR、ICML、ACL、AAAI、WSDM等CCF-A/B类会议上共发表高水平论文25+篇,体现了研究团队在相关领域持续耕耘的研究潜力。
1. 自然语言处理与跨模理解
针对大语言模型内部注意力头间协作与竞争关系不明的问题,提出训练无关的博弈论注意力校准方法(GAC),通过引入哈萨尼股息量化注意力头间正向协同效应并优化注意力分布,以提升模型效能;针对大语言模型命名实体识别中不同源域数据对目标域微调导致模型次优问题,提出模型选择-融合框架,通过评估选择适配源模型并参数融合,提升目标域泛化性;针对复杂多跳问答中推理路径单一及标注人工依赖问题,提出GRAT方法,采用蒙特卡洛树搜索与过程奖励机制实现多路径探索与自我训练,无标注条件下提升推理性能;针对对话中情感四元组信息关联建模难问题,提出多层级关联优化网络(MARN),通过整体语义建模与跨话语句法解析强化情感关联。

大模型注意力分布: ACL 2025(Oral<=3%) |

大模型命名实体识别:发表于ACL 2025 |

复杂多跳问答: ACL 2025 |

对话中情感四元组抽取:ACL 2025 |
2. 计算机视觉与多模生成
针对文本驱动视频生成任务中运动范围受限与控制失准问题,提出“外推-解耦”运动建模框架,通过轻量适配器注入控制信号,并借运动外推与参数解耦来扩展动态范围、实现精准平衡;针对带噪学习中损失阈值选择困难问题,提出基于置信度趋势跟踪的方法(CT),通过检验模型置信度差距的单调增长趋势,实现更精准的样本选择;针对图文检索中文本语义与图像实例存在1:N问题,提出基于双曲空间的层次化嵌入增强方法,利用双曲几何显式建模层次语义,并通过动态对比增强跨模态特征可判别性;针对多模态大模型图文生成幻觉问题,提出无训练框架MVP,通过多视图信息建模图像全局信息,并利用多路径推理量化聚合不同答案确定性分数以降低描述文本生成不一致性。

运动视频生成:CVPR 2025(Highlight=13.5%) |

带噪学习:AAAI 2025 |
3. 信息检索与场景理解
针对大语言模型在推荐任务中存在的语义信息与协同信号对齐退化问题,提出语义增强异质超图网络(SEHHN),通过设计图自动编码器与异构超图,实现LLM语义与用户-物品协同关系的双向对齐与融合;针对捆绑推荐中新捆绑包冷启动问题,提出面向冷启动的物品关系增强双场景对比学习框架方法,通过多视角图对比学习与物品相对流行度建模,融合冷热场景信息以挖掘潜在关系,提升模型在低资源下泛化性。

基于LLM推荐:AAAI 2025 |

捆绑推荐冷启动:WSDM 2026 |
4. 大模型高效微调与模型优化
针对传统LoRA存在初始化次优、梯度未对齐等问题,提出一种大模型自适应的优化方法,通过自适应奇异值分解与梯度对齐策略,动态挖掘预训练知识,从而有效提升大模型高效微调性能;针对大模型知识编辑中存在局部性与泛化性难平衡的问题,提出基于数据增强的目标神经元编辑方法(TNF-DA),通过因果分析精准定位关键神经元,并利用关系表征的数据增强构建高效训练集,实现精确可控的模型编辑。

大模型高效微调:ICML 2025 |

模型编辑:AAAI 2025 |
二、人才培养与获奖
1. 人才培养:
(1)实验室学生(含研究生及本科实习生)在2025年全年在CVPR、ICML、ACL、AAAI、EMNLP、WSDM等CCF A/B类顶级会议上发表论文20余篇,充分体现了实验室学生培养成果;
(2) 暑期实习: 实验室2023级硕士生共9名同学分别前往新加坡国立大学、字节跳动(seed/titok)、腾讯、快手、阿里巴巴等顶级学术机构与企业实习,深度参与前沿研发与业务项目(如扩散模型优化、智能体开发、大规模模型训练等)。
(3)2025年5-11月: 魏巍教授指导的本科生王笔梓等同学的项目“大模型参数高效微调与推理加速”荣获第十九届“挑战杯”揭榜挂帅专项赛道全国一等奖。

(4)2025年8月: 实验室师生受邀前往奥地利维也纳参与自然语言处理顶级国际顶会ACL 2025,并进行现场学术交流。

(5)2025年9-10月: 实验室范城豪、丁卓君等9位(9/24)同学荣获研究生国家奖学金,实现实验室获奖人数新的突破,这是对实验室学生培养质量与学生学习科研成果的最高认可。

2. 获奖
(1)2025年5-9月: 魏巍教授参与的“跨时空多源数据挖掘与态势认知关键技术及应用”项目,荣获2025年度中国指挥与控制学会科学技术奖(技术发明类)一等奖。

3、专著:
由实验室主任魏巍教授编著的教材《自然语言处理(微课版)——基于深度学习与大语言模型》历时3年多,于2025年12月由人民邮电出版社正式出版,该书同时也获得了中国工信学术出版基金支持,其系统性地融合了深度学习、大语言模型等前沿技术与自然语言处理核心任务,内容涵盖从理论奠基(预训练模型)到多项核心任务(如文本摘要、信息抽取、机器翻译等)的实战剖析,并配有丰富的微课视频、案例代码等教学资源。

三、社会公益与服务
1. 组织学术论坛:
(1)2025年7月: 成功主办华中科技大学“喻园·家”系列高端学术讲座,特邀新加坡管理大学朱飞达教授主讲《协同智能与通证化经济:综述与前沿探索》。该活动为师生搭建了与国际前沿学者深度对话的跨学科学术平台,有效组织了高水平的学术论坛。

2. 学术报告:
2025年,实验室魏巍教授多次应邀参与公益科普活动,面向地方青年人才、人大代表等群体,围绕人工智能的技术原理、应用与发展趋势进行义务宣讲
(1)2025年3月: 受潜江组织部邀请,在“AI赋能·智领未来”主题沙龙上,面向地方青年人才作人工智能发展与前沿应用报告。
(2)2025年5月: 受襄阳市人大邀请,为省、市人大代表作“大数据与AI驱动的管理变革与创新”专题辅导报告。
(3)2025年11月: 受硚口区团委邀请,为武汉市团市委书记及与会青年科学家及企业家作 “基于多模态大模型的应用探索”人工智能专场主题报告,分享AI技术在产业中的应用实践。
(4)2025年10-12月:指导武汉消防参加全国消防数字孪生大赛,助力团队获特等奖等多项大奖,体现了实验室以技术专长服务公共安全的社会责任。
四、行业应用落地
认知计算与智能信息处理实验室积极承接前沿科研项目,并与行业领先企业及重点单位建立深度合作,全力推动科研成果的转化与应用。实验室紧密围绕国家战略与产业智能化需求,在数字电网、智慧物流、智能金融、能源运维及智能推荐等多个关键领域开展系统性布局,以持续的技术创新支撑社会经济高质量发展,深入推进产教融合,实现科研、教育与社会服务的协同提升。
1. 智能运维:聚焦数据中心设备安全运维核心需求,基于知识图谱技术构建数据中心运维知识体系,研发出设备劣化预警与故障归因模型,开发了监测预警平台。在广西电网数据中心试点中,实现了10万+三元组、秒级评估及90%+准确率的核心指标,有效提升了运维精准度与效率,为数字电网设备安全与智能化升级提供了关键技术支撑。
2. 智能客服: 围绕货运司机高频咨询与情绪波动等核心服务场景,改进现有AI智能客服系统,融合RAG与情感分析等技术,实现问题智能解答与情绪识别干预,有效提升了服务自动化水平,降低了人工负荷,为改善司机体验、优化物流平台运营提供了有效支撑。
3. 智慧金融:面向金融保险数字化需求,聚焦多模态大模型在复杂金融证件/文档处理领域的应用落地,实现复杂医疗票据表格识别、非标保单信息提取、理赔通用图片分类及清单自动录入等核心技术攻关,有效降低人工成本,提升理赔流程自动化与智能化水平,同时相关成果也发表了多篇高水平学术论文。
4. 具身智能:针对电网“人工替代”与“数据活化”需求,基于大语言模型与智能体技术以及宇树智能机器人,实现了异构数据融合与复杂故障语义研判难题攻关,构建了集智能处置、日志填报与报表检索于一体的监控分析体系,依托国产数据库实现故障毫秒级识别至决策辅助的全流程闭环,显著提升集控系统应急响应与智能化水平,助力电网向“人机协同”转型。
5. 智慧编程:基于text diffusion技术,在seed-coder基础上提出diffusion-based代码模型。其在多项任务上超越原AR baseline(seed-coder),并在约8B参数规模的相关代码评测中表现优于Qwen3、Qwen2.5-Coder、Deepseek-Coder-v2等强力的自回归模型。
6. 智慧造价:项目针对工程造价精细化管理与标准归口的关键需求,实现自然语言智能检索与指标智能审核等核心技术攻关,基于大模型提升专业场景鲁棒性。相关成果应用于平台智能问答与业务辅助功能落地,有效降低人工成本,提升造价管理的自动化与智能化水平。