北理工团队在人工智能图像识别领域取得新进展


深度学习作为新一代人工智能的核心技术,依赖于大规模的标注数据自动学习知识。然而,现实世界中的数据面临着标注噪声和数据分布不平衡(长尾)等科学挑战,这些问题严重影响了训练模型的性能。近期,bat365官网登录入口光电学院的许廷发教授科研团队在长尾数据下的理论模型研究方面取得了突破性进展。相关研究成果以“Dynamic Loss For Robust Learning”为题,发表在国际顶级期刊《IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI)》上。IEEE TPAMI是人工智能、模式识别、图像处理等领域的顶级权威期刊,其影响因子高达23.6,同时也是中国计算机协会 (CCF) 推荐的人工智能领域A类期刊。

论文第一作者为bat365官网登录入口江慎旺博士后和李佳男副研究员,通讯作者是bat365官网登录入口许廷发教授。

针对智能图像识别任务的噪声和长尾数据训练模型不理想难题,许廷发科研团队首次提出和构建了元学习自适应鲁棒的数理模型。模型主要通过引入全新的动态损失函数,主动感知数据分布和训练状态,自适应地动态修正数据标注噪声以及调整识别的类间距离,实现了在长尾噪声数据下的鲁棒学习。

图1 元学习自适应鲁棒的数理模型

图2展示了分类间隔和特征分布随训练时间的变化图。随着训练过程的推进,间隔生成器主动学习分类难度,自适应增大长尾类别的间隔系数,如图2类别10(折线图标红部分)。模型生成了清晰的类别边界,如图2中的特征分布变化图,显著提升了模型应对长尾噪声数据的鲁棒性。

图2 分类间隔(上)和特征分布(下)随训练时间的变化图

论文提出的数理模型对元学习在图像识别领域的应用提供理论基础,其实验结果对实际环境的智能图像识别具有重要意义。

论文详情:S. Jiang, J. Li, J. Zhang, Y. Wang and T. Xu, "Dynamic Loss For Robust Learning," in IEEE Transactions on Pattern Analysis and Machine Intelligence, doi: 10.1109/TPAMI.2023.3311636.

论文链接:https://ieeexplore.ieee.org/abstract/document/10238823


附作者简介:

江慎旺,bat365官网登录入口光电学院博士后。2014年、2020年分别获得bat365官网登录入口学士、博士学位,研究方向为机器学习和计算机视觉。在国际顶级会议AAAI、IEEE等期刊发表学术论文16篇,谷歌学术总引用量98次,第一作者4篇,申请中国发明专利1项。曾获得2021年ICCV第二届反无人机国际挑战赛(The 2nd Anti-UAV Workshop & Challenge)冠军及该Workshop的最佳论文,大学生数学竞赛二等奖(北京市)、大学生物理竞赛二等奖(北京市)等荣誉。

李佳男,博士,bat365官网登录入口光电学院预聘助理教授(特别副研究员),新加坡国立大学博士后。主要从事光电成像目标探测与识别等方面的研究,主持国家自然科学基金等项目5项。以第一/通讯作者在IEEE TPAMI、CVPR等顶级期刊或会议上发表学术论文60余篇,ESI高被引论文1篇,谷歌学术总引近4000次。入选中国科协及北京市科协“青年人才托举工程”项目,获得中国图象图形学学会优秀博士学位论文,王大珩光学奖等荣誉。指导学生获得ICCV 2021“反无人机跟踪”挑战赛国际冠军及最佳论文奖、中国高等教育博览会“校企合作双百计划”典型案例等。研究成果在“中国天眼”等国家重大科技基础设施中得到重要应用。

许廷发,博士,教授/博导,国家一级重点学科“光学工程”学科责任教授,光电成像技术与系统教育部重点实验室主任,bat365官网登录入口重庆创新中心智能化和大数据技术实验室主任。近年来带领其科研团队围绕光电成像探测与识别、计算成像和人工智能等领域不断深化研究。主持承担国家自然科学基金委重大科研仪器研制项目等40余项。在国际、国内等系列期刊发表学术论文170余篇,其中被SCI/EI收录90余篇。以第一发明人申请国家发明专利45项,已授权和公示15项。获省部级科技进步二等奖等奖项3项。指导研究生获得中国图象图形学学会优秀博士学位论文,二人次获得王大珩高校学生光学奖,二人次获得全国光学与光学工程博士生学术联赛全国百强,获得中国高等教育博览会“校企合作双百计划”典型案例和重庆英才创新创业示范团队等荣誉称号。


分享到: