分享好友 最新动态首页 最新动态分类 切换频道
DeepSeek-VL2 开源:AI视觉模型迈入 MoE 时代
2024-12-26 21:34

IT之家 12 月 14 日消息,DeepSeek 官方公众号昨日(12 月 13 日)发布博文,宣布开源 DeepSeek-VL2 模型,在各项评测指标上均取得了极具优势的成绩,官方称其视觉模型正式迈入混合专家模型(Mixture of Experts,简称 MoE)时代。

DeepSeek-VL2 开源:AI视觉模型迈入 MoE 时代

IT之家援引官方新闻稿,附上 DeepSeek-VL2 亮点如下:

  • 数据:比一代 DeepSeek-VL 多一倍优质训练数据,引入梗图理解、视觉定位、视觉故事生成等新能力

  • 架构:视觉部分使用切图策略支持动态分辨率图像,语言部分采用 MoE 架构低成本高性能

  • 训练:继承 DeepSeek-VL 的三阶段训练流程,同时通过负载均衡适配图像切片数量不定的困难,对图像和文本数据使用不同流水并行策略,对 MoE 语言模型引入专家并行,实现高效训练

DeepSeek-VL2 模型支持动态分辨率,仅使用一个 SigLIP-SO400M 作为图像编码器,通过将图像切分为多张子图和一张全局缩略图来实现动态分辨率图像支持。这一策略让 DeepSeek-VL2 最多支持 1152x1152 的分辨率和 1:9 或 9:1 的极端长宽比,适配更多应用场景。

DeepSeek-VL2 模型还得益于更多科研文档数据的学习,可以轻松理解各种科研图表,并通过 Plot2Code,根据图像生成 Python 代码。

模型和论文均已发布:

模型下载:https://huggingface.co/deepseek-ai

最新文章
高德地图商家标注,免费操作指南
本文将详细介绍高德地图商家如何免费标注自己的店铺位置,包括准备步骤、具体操作流程以及常见问题解答。通过本文的指导,您将能够轻松将自己的店铺添加到高德地图中,提高店铺的曝光率,吸引更多潜在客户。一、标题:高德地图商家标注,轻
高清美女写真生成:你也能用AI技术轻松打造自己的绝美写真!
在这个数字化迅猛发展的时代,人工智能(AI)正在悄然改变人们的生活方式。尤其是在艺术领域,AI绘画工具愈发显示出强大的潜力,比如最近在网络上热议的美女写真生成器。这些工具不仅能为我们带来极致的视觉享受,还能轻松地为我们的生活增
淘宝天猫SEO从入门到精通
    《天猫SEO从门到精通》手把手地教有需要的朋友掌握天猫SEO的本领,更是为了帮助大家释放天猫SEO的惊人作用,帮助大家将店铺造为“有排名、有流量、有口碑”的明星店铺,真正实现畅销加长销,帮助大家在天猫平台上纵横驰骋、步步攀升
关于Content-Type的配置
分片上传步骤较多,包括初始化、文件切片、各个分片上传、完成上传。为了简化分片上传,可以使用AWS.S3.ManagedUpload接口进行分片上传。Content-Type用于标识文件的资源类型,比如,是图片类型,, 是视频类型,, 是文本类型, 浏览器针
迪丽热巴 AI 人脸替换造梦——让你的想象成真
在当今的数字时代,人工智能技术的发展让我们的想象不再受限于现实。迪丽热巴是一位备受欢迎的女演员,她拥有着独特的魅力和美丽的面容。现在,通过 AI 人脸替换技术,我们可以将迪丽热巴的脸替换到任何我们想要的场景中,创造出属于我们自
智慧消防
​​消防栓是火情灾害时消防部门用于取水灭火的必要装置,而平时多处于闲置且需要维护的状态,数量巨大并且安装分散,不易监管,经常出现消防水压不足、抢修停水、消防栓损坏等现象。01现实消防栓管理的问题1.非法盗用消防栓免费水,例如,
薯条漫画在线登录入口下载安装
薯条漫画在线登录入口下载安装一款能够让你全天24小时享受耽美漫画乐趣的手机平台。这里涵盖了丰富类型的漫画内容,通过筛选的方式或是精准的关键字搜索就可以找到自己喜欢的漫画内容,平台每天都会更新海量漫画,只要你能够想到就可以在这
中国最具争议的UFO悬案:“绝密档案”被揭开,外星人真的存在?
{{if !data.isVip && data.isActText}}{{else if !data.isVip && !data.isActText}}{{else}}{{if !data.isNormalVip}}{{if data.expiredVip && data.isActText}}{{else if data.expiredVip && !data.isActText}}{{else}}{{/if}}{{else if d
相关文章
推荐文章
发表评论
0评