分享好友 最新动态首页 最新动态分类 切换频道
AIGC承载网优化设计方案(下)
2024-12-26 21:17

通信时长的考虑

带宽:与单机不同,多机之间的网络带宽是比单机内部的带宽要低很多的,

AIGC承载网优化设计方案(下)

多机之间的网络通信往往会受到网络拓扑、物理连接和网络设备等因素的限制,导致实际的带宽较单机内部的带宽低很多。如单机内部NVLink3.0带宽高达600GB/s;而多机之间的网络一般是400Gb/s或200Gb/s(且是Gb/s)
在AIGC承载网络中,多机之间的通信是必要的,尤其是在分布式计算环境下,不同计算节点之间需要进行数据传输、模型同步和参数更新等操作。这些通信过程可能影响到整体的网络性能和计算效率。

设备转发时延:IB交换机或低时延交换机

性能提升

(1)提升单机网络宽带

提升单机网卡带宽,同时需要匹配主机PCIe带宽和网络交换机的带宽

增加网卡的数量,初期业务量少,可以考虑CPU和GPU共用,后期给CPU准备单独的1到2张网卡,给GPU准备4或8张网卡。

(2)应用RDMA网络(IB或RoCE)

借助RDMA技术,减少了GPU通信过程中的数据复制次数,优化通信路径,降低通信时延。

(3)减少网络拥塞

胖树结构:通过多路径的布线和聚合链路的利用,可以提供高带宽、低延迟和高可靠性的通信。
1:1收敛比

双网分流:通过同时连接到两个不同的网络,将流量分流到两个路径上,从而减轻单一网络的负载和拥塞情况。这里, CPU的流量与GPU流量彻底分离开。

(4)通信算法优化

单机优化

多级优化

  • 利用NVLink高带宽优势在单机内部的GPU之间完成数据同步
  • 多机之间的GPU利用多网卡建立多个环,对不同分段数据进行同步
  • 最后单机内部的GPU再同步一次,最终完成全部GPU的数据同步

大规模网络扩展问题

算力昂贵是大家普遍的共识,由于GPU资源本身稀缺的特性,尽可能多的把GPU资源集中在一个统一的资源池里面,将有利于任务的灵活调度,减少AI任务的排队、减少资源碎片的产生、提升GPU的利用率。

要组成大规模GPU集群,网络的组网方式需要进行优化。

(1)网络架构横向扩展

ToR交换机用于和GPU Server直接连接,构成一个Block。

ToR交换机向上一层是Leaf交换机,一组ToR交换机和一组Leaf交换机之间实现无阻塞全连接架构,构成一个Pod
不同Pod之间使用Spine交换机连接。

接入能力分析

  • Block是最小单元,包括256个GPU
  • Pod是典型集群规模,包括8个Block,2048个GPU
  • 超过2048个GPU,通过Fabric-Pod模式进行扩展

GPU网卡的连接建议

以某厂家的技术实现为例:基于异构网络自适应通信技术,不同服务器上相同位置的GPU,在同一轨道平面,仍然走机间网络通信。

要去往不同位置的GPU(比如host1上的GPU1,需要向其它host上的GPU8 送数据),则先通过机内网络,转发到host1上的GPU8上,然后通过机间网络,来完成通信。机间网络的流量,大部分都聚合在轨道内传输(只经过一级ToR)。机间网络的流量大幅减少,冲击概率也明显下降,从而提供了整网性能。根据实测,异构网络通信在大规模All-to-All场景下,对中小数据包的传输性能提升在30%左右。

(2) 计算与存储网络分离

网络可用性问题

可用性问题在GPU集群中要求不高

因为大规模分布式的AI任务基本都是离线的训练任务,网络中断不会对主业务造成直接影响。

但是也需要关注,因为一个AI训练持续的时间可能会很长,如果没有中间状态保存的话,网络中断就意味着前面花费时间训练出来的成果全部失效,所使用的GPU资源也全部被浪费掉。

AI训练任务对网络拓扑的高度敏感性

某一处网络的中断,会导致其他节点网络的非对称,无限增加上层处理的复杂度,因此,在设计集群的时候需要考虑中断容忍的网络架构。

(1)存储双上联

由于网络中断,导致一个存储节点下线,可能会在网络内触发大量数据恢复流量,增加网络负载,因此,建议采用双上联设计,确保某个交换机或上联链路中断不会影响存储节点的可用性。

(2) 计算网单上行

由于AI训练的特殊性,综合性能与成本考虑,暂不考虑双上联设计。

(3)采用GPU网卡连接方式

同一个GPU Server上的8块卡连接到8个ToR,可以节省机间网络的流量,大部分都聚合在轨道内传输(只经过一级ToR),机间网络的流量大幅减少,冲击概率也明显下降,从而提供了整网性能

但是,上面的方案,GPU Server上任何一个网卡或链接中断都会导致网络的非对称,整个GPU Server都会受到影响。所以,干脆让所有网卡共享同一个交换机,好处是,如果ToR交换机故障,影响到的GPU Server会尽可能少,从整个系统的角度出发,可用性反而提高了

计算网络设计—-方案1(整网1:1无收敛)

不考虑GPU的8个接口的接入方式,8个接口接入1台或多台ToR

  • 交换机 10 Leaf + 20 ToR= 30 台,提供640个接入端口(20*32=640),每台GPU服务器8端口,可以最大可接入GPU服务器 80台
  • 接入侧和Fabric内部互联均可以使用200G的AOC(含两端的200G光模块),其中接入侧600条,Fabric侧600条,合计1200条

基于该架构,最多可以接入64台ToR,最大可以扩展到2048个200G接口接入,满足1280接口接入的扩展性要求

计算网络设计—-方案2(整网1:1无收敛)

考虑GPU的8个接口的接入方式,8个接口接入到8台Leaf,每8台Leaf作为一个分组

  • 交换机 13 Leaf + 24 ToR = 37 台,按600个接入端口(75台GPU服务器),每组8个ToR接入25台GPU服务器,3组ToR接入75台
  • 每组ToR接入25台GPU服务器,下行接入带宽为200*200GE,因此,上行也需要至少是200*200GE带宽,每台ToR到每台Leaf为2条200G,总上行带宽为2*13*8*200GE,满足1:1收敛要求
  • 接入侧和Fabric内部互联均可以使用200G的AOC(含两端的200G光模块),其中接入侧600条,Fabric侧624条,合计1224条
方案2扩展性
  • 基于该架构,最多可以接入8组ToR ,每组8个ToR接入32台GPU服务器,8组ToR接入256台
  • 最大可以扩展到2048个200G接口接入,满足1280接口接入的扩展性要求

存储网络设计(整网3:1收敛)

  • 交换机 2 Leaf + 3 ToR = 5 台,提供最大144个接入端口(满足100个接入需求)
  • 如果不考虑Leaf高可靠部署,也可以单Leaf接入
  • 接入侧和Fabric内部互联均可以使用200G的AOC(含两端的200G光模块),其中接入侧100条,Fabric侧36条,合计136条
存储网络设计的扩展性
  • 交换机 2 Leaf + 5 ToR = 7 台,提供最大240个接入端口(满足240个接入的扩展需求)
  1. 超低TCO、超高性价比:相较于IB方案,大幅度降低用户的网络TCO,同时确保高性能
  2. 横向平滑扩容、1:1收敛无阻塞:无收敛的网络设计确保无阻塞的大容量网络,按需横向扩展
  3. 整网RoCEv2:基于CEE/DCB能力,提供可与IB媲美的性能和同样无损的网络服务
  4. 开放网络操作系统:星融元网络操作系统AsterNOS,SONiC企业级发行版,支持灵活的功能扩展、在线升级
  5. 无缝对接云管:AsterNOS 利用简单易用的REST API,可轻松让第三方的云平台/控制器快速纳管
  6. 专家级服务:专业、全面、可靠的研发、方案与服务团队,为客户提供小时级的快速响应服务
最新文章
苹果怎么关闭自动调节亮度
在日常使用中,许多苹果用户可能会遇到屏幕亮度自动调节的情况,这一功能虽然方便,但在某些特定环境下却可能带来不便。例如,在光线强烈的环境下,屏幕可能过于暗淡,而在夜间使用时,又可能过于刺眼。因此,了解如何关闭苹果的自动调节亮
零基础搭建网站设计教程,入门必读
从零开始搭建网站设计,首先确定网站类型和功能,选择合适的建站平台和工具,如WordPress、Wix等。设计网站布局和风格,包括导航栏、页脚、侧边栏等。制作网站内容,包括文字、图片、视频等。进行测试和优化,确保网站运行流畅。确立网站定
音乐外链资源宝库!全网音乐下载一网打尽
一、网站外链建设规划目标:提升网站在搜索引擎中的排名,增加网站流量。策略:1. 高质量内容2. 外部链接建设3. 社交媒体推广实施方案:1. 高质量内容* 定期更新网站内容,提供有价值的信息,如音乐评论、播放列表和独特的访谈。* 优化标题
特仑苏牛奶加盟
    特仑苏公司在蒙语中是"人气牛奶"之意,也是蒙牛的一个牛奶品牌。它的产地--乳都核心区和林格尔,依托北纬40度左右、中温带暖湿季风性气候、世界公认的新鲜奶源带等一系列得天独厚的优势自然条件,提供了市场稀缺的高品质奶源。这里有
微信小游戏开发具体要多少费用才能开始?
随着移动互联网的迅猛发展,微信小游戏作为一种新兴的娱乐方式,受到了越来越多开发者和企业的关注。开发一款微信小游戏的费用构成是多方面的,主要可以分为以下几个部分:1. 前期市场调研与策划在开发之前,进行市场调研是非常重要的。这
用AI生成超逼真美女写真,教你轻松实践!
5. Sohu Simple AI 最后,我们不得不提的就是搜狐简单AI工具。这是一个功能丰富且操作简单的平台,专为新手用户设计的生成工具。用户界面友好,容易上手,最重要的是,工具完全免费,能够为大多数人提供便利。总结与推荐 经过上述评测,虽
究竟哪些行业适合在神马搜索上进行投放,相应的广告又应当如何去做
电商行业堪称是神马搜索广告的理想之选。伴随愈来愈多的消费者将线上购物视作主要的购物方式,电商平台需要凭借广告投放来提升自身的曝光度,并吸引更多的潜在客户。借助具有针对性的关键词广告投放,能够切实地触及到目标受众,进而提升转
武安谷歌SEO营销公司揭秘,企业腾飞的秘密武器大公开
武安谷歌SEO营销公司凭借独特策略,助力企业快速提升在线曝光度。通过深度优化关键词、内容营销和数据分析,助力企业实现全球化市场拓展,成为企业腾飞的秘密武器。随着互联网的飞速发展,越来越多的企业开始重视,其中谷歌SEO营销成为众多
美国公司怎么开对公账户?需要什么条件?
美国公司怎么开对公账户?需要什么条件?美国银行账户有什么好处1.方便在美国实地经营;2.入驻美国亚马逊店铺需要;3.方便收款,提供公司知名度和可信度。美国银行开户的条件1.需要有美国公司(除了加州的LLC公司可以开外,其他州LLC公司都
图片 EXIF 信息查看工具有很多,其中一些常见的包括:
是一种图像文件格式,用于在数字相机、智能手机和其他数码设备中存储图像的元数据信息。这些元数据包含了有关图像的各种信息,如拍摄时间、相机型号、焦距、光圈、曝光时间、ISO 感光度、拍摄地点等等。EXIF 的主要有以下几点:记录拍摄信
相关文章
推荐文章
发表评论
0评