分享好友 最新动态首页 最新动态分类 切换频道
深度学习:基于MindSpore的极简风大模型微调
2024-12-27 09:47

PEFT(Parameter Efficient Fine-Tuning)是一系列让大规模预训练模型高效适应于新任务或新数据集的技术。

深度学习:基于MindSpore的极简风大模型微调

PEFT在保持大部分模型权重冻结,只修改或添加一小部份参数。这种方法极大得减少了计算量和存储开销,但保证了大模型在多个任务上的复用性。

扩展性挑战

大规模预训练模型如GPT、BERT或ViT拥有大量参数。为每个具体任务全参微调这些模型不仅耗费大量计算量,同时需要巨大的存储资源,这些资源往往难以承担。

提升迁移学习效率

PEFT很好地利用了预训练模型在通用任务上的能力,同时提升了模型在具体任务上的表现。同时PEFT能减少过拟合并提供更好的通用型。

1. 冻结大部人预训练模型的参数

2. 修改或添加小部份参数

3. 模型训练时,只修改小部份参数即可

Additive PEFT(加性微调:在模型特定位置添加可学习的模块或参数。如Adapters、Prompt-Tuning 

Selective PEFT(选择性微调:在微调过程只更新模型中的一部份参数,保持其余参数固定。如BitFit、HyperNetworks

Reparameterization PEFT(重参数化微调:构建原始模型参数的低秩表示,在训练过程中增加可学习参数以实现高效微调。如LoRA (Low-Rank Adaptation)、Prefix-Tuning

Prefix Tuning

Prefix Tuning在每个Transformer Block层加入Prefix Learnable Parameter(Embedding层,这些前缀作为特定任务的上下文,预训练模型的参数保持冻结。相当于在seq_len维度中,加上特定个数的token。

 

但Prefix Tuning在需要更深层次模型调整的任务上表现较差。

Adapters 

Adapters是较小的,可训练的,插入在预训练模型层之间的模块。每个Adapter由一个下采样模块,一个非线性激活和一个上采样模块组层。预训练模型参数保持冻结,adapters用于捕捉具体任务的知识。 

环境需求:2.3.0-cann 8.0.rc1-py 3.9-euler 2.10.7-aarch64-snt9b-20240525100222-259922e

Prefix-Tuning 

 安装mindNLP

 

加载依赖

 

 通过mindnlp.peft库加载模型并进行prefix配置

 

加载、预处理数据集

 

进行微调训练 

 

模型评估

 

模型保存

 

加载模型进行推理

 

 BitFit

BitFit需要冻结除Bias外的所有参数,只训练Bias参数。

 

其余数据预处理代码和训练代码与上述相同。 

LoRA

LoRA(Low Rank Adaptation)专注于学习一个低秩矩阵。通过在冻结的预训练权重中添加可学习的低秩矩阵。在前向传递过程中,冻结的权重和新的低秩矩阵参与计算。

低秩矩阵指的是相较于原矩阵,秩更低的矩阵。加入一个矩阵的形状为m x n,矩阵的秩最多为min(m, n),低秩矩阵的秩数远远小于原本的m和n。

LoRA微调不更新原本m x n的权重矩阵,转而更新更小的低秩矩阵A(m, r), B(r, n)。假设W0为512x512,低秩矩阵的r则可以为16,这样需要更新的数据只需要(512x16+16x512=16384,相较于原来的512x512=262144,少了93.75%。

LoRA实现的基本思路代码

 
 

LoRA的MindSpore实现 

 

其余数据预处理代码和训练代码与上述相同。 

更多内容可以参考mindspore的官方视频

最新文章
如何优化关键词百度排名?怎么快速优化到百度首页?
网站关键词优化要快速优化到百度首页,网站应选择合理的关键字进行优化。除了**的关键字外,您还可以适当地制定一些长尾关键字。当然,如果可以结合热门事件,将更容易优化到百度首页。对于企业来说,网络营销不仅可以降低企业的运营成本,
深度解析几款国内主流的磁力搜索引擎
如今在互联网浩瀚的资源海洋里,无论是最新上映的电影还是最流行的音乐专辑,都能通过磁力搜索引擎迅速找到。现在,让我们一起来了解一下目前国内主流的老牌磁力搜索引擎。磁狐搜索:这款搜索引擎基于DHT协议的资源搜索应用,整合了多种磁
美国签证系统更新后更复杂了?!美区申请人注意了!
12月7日美国签证新系统全面启用!很多小伙伴都慌了!各种问题层出不穷!给大家梳理一下新美签系统变化及申请流程!往下看!一篇全搞定!01新美签系统主要变化02新美签系统申请攻略实操申请,大家可以根据如下的步骤一一进行操作,这份保姆级
高效建设攻略,搭建与优化关键步骤解析
搭建与优化是打造高效的关键。选择合适的和,确保稳定运行。设计简洁、直观的界面,提高用户体验。优化结构和内容,提高搜索引擎排名。定期并修复漏洞,保障安全。这些步骤将有助于打造一个高效、安全的。搭建优化在互联网迅猛发展的今天,
香港资料大全正版资料2024年免费|综合解答落实完美版220.300
香港资料大全正版资料2024年免费——综合解答完美版随着信息技术的快速发展,人们对于各类资料的需求也日益增长,香港作为一个国际化大都市,其资料种类繁多,涵盖了历史、文化、经济、教育等多个领域,本文将围绕香港资料大全正版资料展开
私域roi分析,告诉你怎么样的私域才能是合格的私域
市场营销获客工具【爱短链】全域跳转工具,打通私域引流关键一步:轻松将公域流量,引导至私域,通过链接点击直达,方便快捷,无风险提示跳转,助力企业/商家高速获客。》》点此获取链接我们关心如何如何来,如何保留,如何转化;也关心成
神经网络轻量化及硬件加速技术与应用
报告地点:吉林大学中心校区唐敖庆楼B521报告介绍1.神经网络轻量化及硬件加速技术与应用报告人简介姚美宝,吉林大学人工智能学院副教授,博士生导师,担任智能机器人实验室负责人。从事智能机器人,计算机视觉,控制理论及应用等研究,主要
谈谈“推荐系统”和“搜索引擎”两者间的关系、和异同点
原标题:产品经理需要了解:推荐系统和搜索引擎的关系注:本文作者结合自己的实践经验来为大家阐述推荐系统和搜索引擎两者之间的关系、分享自己的体会。从信息获取的角度来看,搜索和推荐是用户获取信息的两种主要手段。无论在互联网上,还
阿亮网创72计第2计:0基础1小时精通SEO,免费流量取之不尽(价值20万)
第2计:0基础1小时精通SEO,免费流量取之不尽(价值20万)在网赚圈有一个绝对真理:流量就等于钱,精准流量就等于很多钱。如何才能在完全免费的情况下, 源源不断的获取海量的精准流量? 纵观整个互联网,唯独seo能够做到。什么是seo?seo就
相关文章
推荐文章
发表评论
0评