近日,我校数据科学与人工智能学院刘明哲教授团队在数据科学权威期刊Cell子刊《Patterns》发表了题为“A label masked autoencoder for image-guided segmentation label completion”的研究论文,并入选当期封面文章(图1)。
图1 相关成果入选Cell旗下Patterns期刊封面文章
现有的深度学习模型通常依赖于大规模、高质量的人工标注数据 。在实际应用中,获取精细的像素级标注不仅耗时耗力,而且现有的公开数据集往往存在标注缺失、噪声或错误等问题 。如何利用不完美的、甚至破损的标签数据来训练高精度的模型,成为了该领域亟待解决的难题之一。针对上述挑战,刘明哲团队提出了一种全新的自监督学习框架——标签掩码自编码器(Label Masked Autoencoder, L-MAE) 。该研究并未沿用传统的半监督学习范式,而是开创性地引入了“掩码分割标签建模”(Masked Segmentation Label Modeling, MSLM)任务 (图2)。
图2 标签掩码自编码器结构图
实验数据表明,L-MAE在处理不完整标签方面表现优秀,在各项指标上优于目前的SOTA(State-of-the-Art)监督及半监督分割模型 。特别是在数据退化实验中,经L-MAE增强后的数据集使分割模型的平均交并比(mIoU)提升了13.5% ,充分证明了该方法在提升数据集质量和降低人工标注成本方面的巨大潜力 (图3)。
图3 不同掩码率下的标签补全性能对比
该研究为解决人工智能落地过程中面临的“数据标注瓶颈”提供了一种简单、可扩展的解决方案,对于构建更高效、低成本的视觉智能系统具有重要的理论意义和应用价值。
关于发表期刊与团队
《Patterns》是世界顶级学术出版机构Cell Press(细胞出版社)旗下的数据科学期刊,致力于发表数据科学领域的突破性原创研究,在学界具有广泛影响力。此次入选封面文章,标志着温州理工学院在人工智能和数据科学理论研究领域获得了国际同行的认可。该论文的通讯作者为温州理工学院数据科学与人工智能学院刘明哲(Mingzhe Liu)教授,第一作者为贾佳儒(Jiaru Jia)。温州理工学院为论文第一完成单位。
论文链接:
https://doi.org/10.1016/j.patter.2025.101455

搜索