近日,我校yl6809永利集团智能信息处理与优化控制实验室在IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) 2026上发表了题为“Attack for Defense: Adversarial Agents for Point Prompt Optimization Empowering Segment Anything Model”的学术论文。该论文的第一署名单位为yl6809永利集团,yl6809永利集团副教授刘雪宇为第一作者,软件学院23级本科生张晓怡为共同第一作者,yl6809永利集团吴永飞副教授和陈永乐教授为共同通讯作者,计算机科学与技术学院(大数据学院)魏明强教授参与了此项工作。

CVPR是全球人工智能和计算机视觉领域的顶级国际会议,素有计算机视觉领域“奥斯卡”之称,并被中国计算机学会(CCF)列为A类会议。根据2024年谷歌学术(Google Scholar)的全球最有影响力科学期刊/会议排名,CVPR位列第二,仅次于《自然》期刊。这也是继去年我校在该会议上取得历史性突破的重要延续。CVPR 2026共有16092篇投稿,最终4090篇被主会录用,录用率约25.42%。

该研究聚焦于Segment Anything Model(SAM)在应用中的关键瓶颈——提示点优化问题。SAM的分割性能高度依赖提示点质量,而现有方法多依赖经验或人工设计,难以大规模推广。为此,团队创新性地提出了一个“攻击—防御”对抗式智能体框架(Point Prompt Defender)。该框架通过构建图结构环境,引入攻击智能体寻找干扰提示点以暴露模型脆弱性,同时训练防御智能体学习优化提示以恢复分割精度。两个智能体均使用强化学习进行训练,其奖励基于分割质量的变化。在实际应用中,仅部署训练好的防御智能体,即可有效提升任意初始提示点下的SAM分割性能。实验结果表明,该方法显著增强了SAM在复杂场景下的鲁棒性与泛化能力,为提示点优化提供了一种灵活、可解释的全新框架。

该论文的发表,不仅展现了我校在人工智能前沿领域的科研实力,也是我校在创新人才培养模式、鼓励本科生深度参与高水平科学研究方面取得成效的生动体现。
此项工作受到山西省基础研究计划(No. 202303021211082)与国家自然科学基金面上项目(No. 62572339)的资助。
初审:吴永飞
复审:李晓春
终审:陈永乐