2025年4月18日下午2点,在15栋310办公室召开了学院2025年教师科研小组第三次科研例会。会议主题为“多模态行人重识别”的交流与研究。学院教师科研小组全体成员参会,会议由科研副院长彭敏主持。
一、会议概述
本次例会由学院科研副院长彭敏教授主持,旨在聚焦当前人工智能研究热点“多模态行人重识别”(Multimodal Person Re-identification),交流研究动态,探讨我院在该领域的研究方向、潜在挑战及合作机遇,并部署下一阶段工作重点。
二、主题研讨与交流
1、主题阐述:
彭敏副院长首先强调了多模态行人重识别技术在城市安防、智慧交通、人机交互等领域的重大应用价值与发展前景。指出融合可见光、红外、文本描述、步态特征等多模态信息是突破单一模态识别瓶颈、提升复杂场景下鲁棒性与准确性的关键方向,是我院应重点布局的科研领域之一。
2、研究动态分享:
与会教师代表分享了近期国内外在多模态行人重识别领域的研究进展,重点讨论了:
模态融合机制:如何有效对齐和融合异构模态(如图像、文本、红外)信息,探索注意力机制、图神经网络、跨模态对比学习等前沿方法的应用潜力。
标注数据稀缺性:针对多模态标注数据获取成本高的问题,探讨利用弱监督、半监督、自监督学习策略的可能性。
实际场景挑战:深入分析了跨摄像头视角差异、光照变化、遮挡、姿态变化等实际应用场景中的难点及其解决方案。
新兴方向:探讨了结合大语言模型(LLM)进行语义理解与关联、利用生成式模型(如Diffusion Models)增强数据多样性等前沿交叉研究方向。
3、院内研究基础与规划讨论:
与会教师介绍了各自团队在相关方向(如计算机视觉、模式识别、机器学习、多模态学习等)已有的研究基础和技术积累。会议就如何整合院内优势资源、凝练特色研究方向、组建跨团队联合攻关小组进行了初步研讨,并提出了潜在的合作切入点。
三、会议决议与后续工作安排
1、成立院级研究兴趣小组:
会议责成由彭敏副院长牵头,于一周内协调成立“多模态智能感知”(或类似名称)院级研究兴趣小组,吸纳对此方向有研究兴趣和基础的教师加入,作为深入推动该领域研究的核心平台。
2、梳理资源与规划项目:
会议要求兴趣小组在成立后一个月内,系统梳理院内相关实验室设备、数据集、计算资源及现有技术储备。调研国家及地方重点研发计划、自然科学基金等在该领域的重点资助方向。形成一份初步的《多模态行人重识别研究发展规划与项目申报建议书》。
3、组织专题研讨会/Workshop:
会议决定在2025年第二季度(具体时间待定),由科研工作小组和拟成立的研究兴趣小组联合策划组织一次“多模态智能感知与行人重识别”专题学术研讨会或小型Workshop,邀请校外专家交流,并展示院内初步研究成果。
4、加强对外合作:
会议鼓励教师积极与相关领域领先的科研院所、企业建立联系,探索数据共享、联合攻关、技术转化等合作模式。
四、会议总结
彭敏副院长作总结发言,充分肯定了本次例会对聚焦研究方向、凝聚共识、促进合作的重要意义。她强调,“多模态行人重识别”是AI落地应用的关键技术之一,我院具备良好的研究基础和发展潜力。全体成员应把握机遇,依托即将成立的研究兴趣小组,整合力量,协同创新,力争在该领域形成有影响力的研究成果,提升学院整体科研竞争力。会议责成科研秘书协助推进后续工作落实。