2025年3月6日,在15栋310办公室召开了学院2025年教师科研小组第二次科研例会。会议主题为DDPM的探索与应用。学院教师科研小组全体成员参会,会议由科研副院长彭敏主持。
一、会议主题
围绕“Diffusion Models的探索与应用”主题,汇报阶段性研究成果,讨论技术瓶颈与突破方向,规划下一阶段合作方向。
二、研究进展汇报
1、理论优化方向:
提出动态噪声调度算法,通过自适应调整前向过程的噪声强度,提升模型收敛速度30%,实验数据已在CVPR 2025 Workshop预印本发布。
初步验证低秩自适应(LoRA)微调框架在Diffusion Models中的可行性,显著降低大规模模型微调的算力需求。
2、应用拓展方向(陈副教授团队)
医疗影像生成:与附属医院合作,基于Monarch Diffusion架构实现CT影像超分辨率重建,在肺结节检测任务中F1-score提升8%。
跨模态生成:构建文本-图像-视频联合生成框架,初步实验显示多模态一致性指标(CLIP Score)达行业领先水平。
3、学生创新项目(赵同学、周同学)
提出轻量化Diffusion模型,通过知识蒸馏与参数共享,将模型推理时间压缩至原始模型的1/5,适合移动端部署。
探索可控生成机制,引入条件编码器实现对生成内容的细粒度控制(如颜色、风格迁移)。
三、技术难点讨论
1、收敛效率与计算资源矛盾
问题:现有Diffusion Models训练周期长(通常需数千GPU小时),限制大规模应用。
解决方案:讨论引入渐进式训练策略(如课程学习)与混合精度计算优化。
2、生成结果多样性不足
问题:模型倾向生成“平均化”结果,缺乏创新性。
解决方案:提议结合对抗训练(GAN)与Diffusion Models,或引入隐空间解耦表征学习。
3、跨学科数据适配挑战
医疗、材料科学等领域数据分布差异大,需定制化预处理流程。建议建立领域自适应数据增强管道。
四、下一步行动计划
1、4月15日前:各团队提交技术路线细化方案,明确资源需求清单。
2、6月1日:举办“Diffusion Models前沿技术”内部讲座,邀请领域国际专家线上分享。
3、8月30日前:完成医疗影像生成平台原型开发,提交伦理审查申请。
五、彭敏副院长总结:
彭敏副院长强调,Diffusion Models作为生成式AI的核心技术,需兼顾学术创新与产业落地。下一步重点突破方向为效率提升、可控性增强与跨学科融合,鼓励团队间形成“理论-算法-应用”闭环协作模式。