分享好友 最新动态首页 最新动态分类 切换频道
更通用、有效,蚂蚁自研优化器WSAM入选KDD Oral
2024-12-29 21:54

机器之心专栏

机器之心编辑部


深度神经网络(DNNs)的泛化能力与极值点的平坦程度密切相关,因此出现了 Sharpness-Aware Minimization (SAM) 算法来寻找更平坦的极值点以提高泛化能力。本文重新审视 SAM 的损失函数,提出了一种更通用、有效的方法 WSAM,通过将平坦程度作为正则化项来改善训练极值点的平坦度。通过在各种公开数据集上的实验表明,与原始优化器、SAM 及其变体相比,WSAM 在绝大多数情形都实现了更好的泛化性能。WSAM 在蚂蚁内部数字支付、数字金融等多个场景也被普遍采用并取得了显著效果。该文被 KDD '23 接收为 Oral Paper。




随着深度学习技术的发展,高度过参数化的 DNNs 在 CV 和 NLP 等各种机器学习场景下取得了巨大的成功。虽然过度参数化的模型容易过拟合训练数据,但它们通常具有良好的泛化能力。泛化的奥秘受到越来越多的关注,已成为深度学习领域的热门研究课题。


最近的研究表明,泛化能力与极值点的平坦程度密切相关,即损失函数“地貌”中平坦的极值点可以实现更小的泛化误差。Sharpness-Aware Minimization (SAM) [1] 是一种用于寻找更平坦极值点的技术,是当前最有前途的技术方向之一。它广泛应用于各个领域,如 CV、NLP 和 bi-level learning,并在这些领域明显优于原先最先进的方法。


为了探索更平坦的最小值,SAM 定义损失函数 在 w 处的平坦程度如下:










WSAM 的设计细节





2分钟版本

13分钟版本

[1] Pierre Foret et al. Sharpness-aware Minimization for Efficiently Improving Generalization. ICLR '21.
[2] Juntang Zhuang et al. Surrogate Gap Minimization Improves Sharpness-Aware Training. ICLR '22.
[3] Jiawei Du et al. Efficient Sharpness-aware Minimization for Improved Training of Neural Networks. ICLR '22.
[4] Jungmin Kwon et al. ASAM: Adaptive Sharpness-Aware Minimization for Scale-Invariant Learning of Deep Neural Networks. ICML '21.
[5] Minyoung Kim et al. Fisher SAM: Information Geometry and Sharpness Aware Minimisation. ICML '22.

© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

最新文章
ai机器人下载 ai怎么下载?
在当今信息爆炸的时代,写作成为了人们日常生活和工作中不可或缺的一环。无论是写报告、写论文、写作业,还是写日记、写博客、写微博,都需要大量的时间和精力。如何提高写作效率,成为了每个写手都面临的一个重大问题。现在,我们向大家推
APS智能排程 技术架构 aps高级排程厂商排名
APS系统哪家好?APS系统不论是从技术角度还是市场角度已经逐步走向成熟。下面从APS属性的角度,分析了鼎捷APS的一些特性,仅作为参考。一、如何选择APS1、通过PK的方式APS系统是一个优化的排程调度工具,追求的是企业生产效率的提升。对于A
BT服在游戏中是什么概念
在当今的游戏市场中,BT服(变态服)作为一个特殊的存在,吸引了众多玩家的目光。那么,BT服在游戏中到底是一个什么样的概念呢?本文将从BT服的定义、特点、市场应用以及玩家体验等多个方面进行深入探讨。图片来自其他网站,如有侵权,请联
Ai人工智能助手安卓版APP v1.6.2 中文破解版
Chat-AI安卓版(智能助手)是一款AI人工智能软件APP,AI智能助手app破解版采用AI人工智能模型API提供支持,通过Chatbot AI聊天助手提出任何问题并获得即时聊天对话答复.ai智能助手安卓版最新破解版.新版变化AI Chatbot Assistant – Google Pla
AI 面试流行,求职者开始讨好算法
疫情刺激下,越来越多的企业采用 AI 面试来对求职者进行初筛。AI 面试的优点显著 —— 低成本、高效率、无接触。不过对于求职者而言,如何才能在面试中获得人工智能的青睐,正成为求职者一门需要掌握的新技能。“过去半年里,请举例说明你
AI入侵播客圈!比真人配音还逼真?实测爆火的微软AI语音角色“晓晓”
作者 | 石濑‍‍编辑 | 松露AI语音再进化,人耳还能听出AI和真人的差别吗?以上两段音频demo来自微软最近更新的AI语音角色“晓晓”。逼真、情绪到位、语气自然、断句近乎完美,是绝大多数网友听到“晓晓”声音时给出的评价。在播客App小宇
ai音频生成工具哪里找及如何使用教程
在数字化时代的浪潮中人工智能技术的飞速发展为咱们带来了多便利。其中音频生成工具的出现让音频制作变得更加高效和便捷。无论是内容创作者、播客还是音乐制作人都能通过这些工具轻松地生成高品质的音频内容。本文将为您详细介绍怎样寻找音
Appium 移动端自动化测试,触摸(TouchAction) 与多点触控(MultiAction)(3)
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。 需要这份系统化的资料的朋友,可以戳这里获取 一个人可以走的很快,但一群人才
AI人工智能软件的优化与设计推动各行业的变革
在当今迅速发展的科技环境中,软件的优化与设计正在引领各行各业的变革。根据最近的一项调查,超过70%的企业表示,AI技术的引入极大提升了他们的运营效率。例如,一家知名的金融机构通过实施深度学习算法,大幅提高了风险评估的准确性,从
2024 年微信收入和使用情况统计
微信搜索关注公众号:网络研究观,了解更多信息。  微信于 2011 年推出微消息,现已成为著名的社交媒体平台。它最初是作为一个简单的消息应用程序开始的。这是 WhatsApp 的中文版。    微信是由中国科技巨头腾讯开发
相关文章
推荐文章
发表评论
0评