分享好友 最新动态首页 最新动态分类 切换频道
Openai 、 Google 、阿里巴巴、腾讯集中发布最新大模型
2024-12-26 12:26

https://haitang.app/ 海棠诗社:每一首诗都有简介、注释、翻译、评价

周刊关注 Python、机器学习、深度学习、大模型等硬核技术

本期目录:

  • 大模型

    • OpenAI发布了最新大模型GPT-4o

    • 腾讯开源旗下混元文生图大模型

    • 直接在浏览器本地运行Phi-3模型

    • DeepSeek-V2:尖端开源 MoE 模型!

    • 阿里云发布通义千问 2.5

    • 通义千问Qwen1.5-110B 超1000亿参数

    • 零一万物开源了 yi-1.5 模型

    • gemma 2b - 10m context 模型的代码实现

  • 小工具

    • lgm:生成高质量3d模型

    • 手绘风 svg 的 react 渲染器

    • 一个免费的开源插画网站

    • v2ex 被丑头像包围了,丑头像生成器

    • 如何下载视频号视频

    • 高性能的大数据无代码平台:teable

    • 嵌套网页展示搜索结果的产品globe

    • 一个微信聊天记录导出工具

  • 知识库

    • 推荐阅读:《你好 gpt-4o》

    • awesome 中文大模型@GitHub

    • Gemini API Cookbook

  • 随便看看

    • openai 是如何连续三次羞辱 google 的?

unsetunset大模型unset unset OpenAI发布了最新大模型GPT-4o

OpenAI直接开放GPT-4o,能力横跨语音、文本和视觉,免费用户也可以直接用!https://chatgpt.com/

在API方面,GPT-4o的价格是GPT-4-turbo的一半,速度却是GPT-4-turbo的两倍,速率限制也高5倍。

最惊艳的是OpenAI在现场的展示,在与GPT-4o语音对话过程中,三人随意打断,GPT-4o反应极快,并且语气相当丰富,像极了在跟人类聊天

腾讯开源旗下混元文生图大模型

腾讯正式公布,旗下混元文生图大模型已完成升级,并对外开源。此次升级的模型采用了与sora相同的dit架构,不仅能够支持文生图,也能作为视频等多模态视觉生成的基础。这是业界首个中文原生的dit架构文生图开源模型,支持中英双语输入及理解,15亿参数。

项目地址:https://dit.hunyuan.tencent.com

官网排队:https://image.hunyuan.tencent.com

github:https://github.com/tencent/hunyuandit

试玩:https://huggingface.co/spaces/Xenova/experimental-phi3-webgpu

Phi3-WebGPU正是为在浏览器端本地运行模型的探索:

️ 模型下载约2.3GB(下载一次并缓存) 加载模型时间:50秒 推理速度:中文约1.9 tokens/s,英文1.7 tokens/s ⏳ 首token返回延迟:20秒

DeepSeek-V2:尖端开源 MoE 模型!

体验:https://chat.deepseek.com/coder 模型下载:https://huggingface.co/deepseek-ai

亮点:

在 AlignBench 中排名前 3,超过 GPT-4,接近 GPT-4-Turbo。在 MT-Bench 中排名顶级,可与 LLaMA3-70B 相媲美,并优于 Mixtral 8x22B。专攻数学、代码和推理。支持 128K 上下文窗口。

✨ 特点:

deepseek 较快的速度+ 不错的质量+ 超便宜的价格,这才是大模型作为新一代的基础设施该有的样子~

官方还开了一个仓库,专门收集集成deepseek的应用,大家也可以关注下:https://github.com/deepseek-ai/awesome-deepseek-integration

阿里云发布通义千问 2.5

通义千问Qwen1.5-110B 超1000亿参数

Qwen1.5-110B是Qwen1.5系列中的新成员,也是该系列首个拥有超过1000亿参数的模型。

该模型在基础模型评估中表现出色,与Meta-Llama3-70B相媲美,并在聊天模型评估(包括MT-Bench和AlpacaEval 2.0)中表现出色。

模型支持多语言,包括英语、中文、法语、西班牙语等,上下文长度可达32K令牌。

模型特性:

•架构:采用Transformer解码器架构,具有分组查询注意力(GQA)。•性能:在标准评估和聊天模型评估中均展现卓越性能。•多语言支持:支持多种语言,上下文长度可达32K令牌。

根据官方公布的评测结果

Qwen1.5-110B模型的评测结果略略超过Llama-3-70B和Mixtral-8×22B。

Qwen1.5-110B模型在综合理解(MMLU)、数学推理(GSM8K和MATH)方面得分比Llama-3-70B略高一点点,是几个模型中最强的。而在复杂推理任务ARC-C上则略低于Mixtral-8×22B模型。在编程测试HumanEval得分则是远超另几个模型,而MBPP编程测试上则低于Mixtral-8×22B模型。

详细:https://qwenlm.github.io/blog/qwen1.5-110b/

yi-1.5 有 6b、9b、34b三个型号,都采用apache 2.0许可证。

  • 模型在 4.1万亿 token 上训练的

  • 在 300万个指令调优样本上进行了精细调整

  • 34b 型号一些指标超过了 qwen 的 72b

  • 6b 和 9b 型号也成功超越了 mistral 的 7b v0.2 版和 gemma 的 7b 型号

模型下载:https://huggingface.co/collections/01-ai/yi-15-2024-05-663f3ecab5f815a3eaca7ca8

infiniattention 论文地址:https://arxiv.org/abs/2404.07143

transformer-xl 论文地址:https://arxiv.org/abs/1901.02860

模型下载地址:https://huggingface.co/mustafaaljadery/gemma-10m-safetensor

github repo: https://github.com/mustafaaljadery/gemma-2b-10m

对大模型上下文能达到 8k => 10m 大幅提升的技术说明:大型语言模型(llms)在内存方面的最大瓶颈是键值(kv)缓存。在传统的多头注意力机制中,它呈二次方增长,因此限制了序列长度的大小。本文的方法按照 infiniattention 所概述的,将注意力分割到局部注意力块中。采用这些局部注意力块,并对局部注意力块应用递归,以获得最终的 10m 上下文全局注意力的结果。许多想法灵感来自于 transformer-xl 论文。

支持文字生成模型、图片生成模型,分辨率512*512,5秒内即可生成。

在线体验:https://huggingface.co/spaces/ashawkey/lgm

项目地址:https://me.kiui.moe/lgm/

github:https://github.com/3dtopia/lgm

想做手绘风格的ui几乎没有门槛了推荐用这个渲染手绘风 svg 的 react 渲染器:https://github.com/bowen7/react-rough-fiber

用法很简单,只要把svg图片用 组件包裹,就能把svg转成手绘风格。详细使用文档:https://react-rough-fiber.amind.app

网址:http://opendoodles.com

1.免费丰富的插画,支持在线编辑 2.支持导出svg、png等矢量图 3.如果需要更进一步的设计,支持定制服务

很有意思的地方是,作者分享了他做这个产品的初衷,在他刚开始做设计师的时候,周围没有人教,而且没钱买软件,因此不得不盗版软件、偷科技杂志里的光盘,学到了很多酷的平面设计。

现在做了open doodles,这些插画资源遵循开放设计的理念,允许用户自由地复制、编辑、重新混合、分享或重新绘制,而不受版权或数据库法的限制。

生成:https://txstc55.github.io/ugly-avatar/

  • 项目:https://github.com/txstc55/ugly-avatar

    方式一:https://www.runningcheese.com/wechat-video-download

    方式三:https://github.com/putyy/res-downloader

    网络资源嗅探资源下载器,支持: 微信视频号下载、网页抖音无水印下载、网页快手无水印视频下载、酷狗音乐下载等网络资源拦截下载!

    高性能的大数据无代码平台:teable

    主要特点包括:

    表格界面:类似电子表格的操作方式,支持单元格编辑、公式、条件格式、图表等功能。
    ️ 丰富视图:除了表格视图,还提供看板、日历、画廊、表单、甘特图等多种数据展现方式。
    卓越性能:可以轻松处理数百万数据,支持批量操作,有自动索引优化。‍ 原生 #SQL 支持:可以使用 SQL 直接查询,兼容 #Metabase、#PowerBI 等 #BI 工具。
    AI Copilot:通过 AI 对话来辅助开发应用、生成图表、调整视图、设置自动化等。
    数据安全:支持数据本地存储,有完善的权限管理。
    ⚡️ 实时协作:数据可实时更新,支持协作成员管理。
    可扩展:基于 #React,可以低成本定制和扩展应用。
    流程自动化:可通过 #AI 或可视化方式设计自动化流程。
    ️ 多数据库支持:兼容 #Sqlite、#PostgreSQL、#MySQL 等数据库。

    可以将 Teable 视为 Airtable 的大数据替代品,在保留电子表格式的易用性的同时,还兼具传统数据库的高性能和稳定性,非常适合企业级的数据管理应用开发。

    链接:https://github.com/teableio/teable
    一键部署:https://bja.sealos.run/?openapp=system-template%3FtemplateName%3Dteable

    嵌套网页展示搜索结果的产品globe

    Globe:https://explorer.globe.engineer/

    globe,已经接入了Gorq,速度真的快的离谱。一秒钟展示一个概念的所有内容,加载的速度赶不上生成的速度。

    https://github.com/LC044/WeChatMsg

    提取微信聊天记录,将其导出成HTML、Word、CSV文档永久保存,对聊天记录进行分析生成年度聊天报告,还能1:1还原聊天界面!

    unsetunset知识库unset unset 推荐阅读:《你好 gpt-4o》

    想了解 gpt-4o 的技术细节,推荐阅读官方的 hello gpt-4o

    原文:https://openai.com/index/hello-gpt-4o/

    awesome 中文大模型@GitHub

    awesome chinese llm 旨在收集和梳理中文 llm 相关的开源模型、应用、数据集及教程等资料,目前收录的资源已达100+个!

    github repo: https://github.com/hqwu-hitcs/awesome-chinese-llm

    Gemini API Cookbook

    Logan 大佬发布的 Gemini API 指南和示例的集合,包括用于编写提示和使用 API 不同功能的快速入门教程,以及可以构建的示例。从账号申请开通、Gemini API 能力了解到实际接入过程,对接入测试工作帮助很大!

    https://github.com/google-gemini/cookbook

    unsetunset随便看看unset unset openai 是如何连续三次羞辱 google 的:

    1. chatgpt 在 2022/12 发布,导致 google 整个推翻 2023 年的计划

    2. gpt-4 选在了 palm api (谁还记得它) 同一天发布

    3. 最近的一次,gpt-4o 在 google i/o 之前一天发布

  • 最新文章
    绵羊漫画app免费版下载
    绝对好看的漫画都在这里。《绵羊漫画 免费版》是一款非常不错的漫画阅读软件。在绵羊漫画软件内,拥有着海量的漫画资源,各种类型的漫画,超全的漫画种类,只要是你想看的漫画,都能轻松的在这里搜索的到,而且所有的漫画,免费任你尽情的
    给排水CAD入门学习之排水斜弯的绘制技巧
    有些刚开始进行的小伙伴在使用正版CAD软件绘制图纸的过程中,有些时候会需要绘制排水斜弯,那么浩辰软件中怎么绘制排水斜弯呢?接下来的给排水CAD入门学习教程就让小编来给大家介绍一下正版CAD软件——浩辰CAD给排水软件中绘制排水斜弯的相
    高清美女写真生成神器:AI画出你心中的完美女神!
    限时免费,点击体验最近超火的AI生图神器,坐拥3000美女的大男主就是你! https://ai.sohu.com/pc/generate/textToImg?_trans_=030001_yljdaimn 在这个科技飞速发展的时代,AI技术已经渗透到我们生活的各个角落。想像一下,宝子们,今天你
    闲置8年后更名,沈阳一大型商场将重新开业!
    来自中国房地产报消息,闲置8年之久,沈阳市北于洪地区最大的社区商业综合体——恒大都市广场B馆终于有了新动作。业内人士透露,该商业项目已经全权委托柏利城商业管理(苏州)有限公司展开全面升级改造与招商工作,与此同时,该商业体也已
    直播软件搭建要求有哪些-从技术到硬件配置全方位解析!
    直播软件搭建的要求是一个多方面的问题,涵盖了技术、硬件、软件以及网络等多个领域。搭建直播平台不仅需要考虑到用户体验的流畅性,还要确保平台的安全性和可扩展性。为了确保直播软件的成功搭建,开发者需要满足一定的技术要求,合理配置
    科技早报|谷歌深夜发布最新大模型;马斯克成身家超4000亿美元“第一人”
    12月11日,据媒体援引知情人士消息报道,苹果正在研发专门为人工智能设计的服务器芯片,并正与博通合作开发该芯片的网络技术。新芯片的内部代号为Baltra,预计到2026年可量产。这也标志着苹果芯片团队一个新的里程碑,该团队最初为iPhone设
    日常TikToK达人邀约,第三方工具靠不靠谱?
    目前做的卖家在经历过1-3个月以后都会面临瓶颈期,手动达人逐个邀约每天大约也就50个左右已经无法满足经营需求,所以卖家朋友会选择第三方达人建联工具实现突破,相比于手动建联,确实极大的提高了建联效率,但是是不是使用了第三方建联工
    笔记本电脑功率详解:影响因素、计算方式与应用场景
    一、笔记本电脑功率概述笔记本电脑功率是指笔记本在运行过程中所需的能量,通常以瓦(W)为单位表示。功率是影响笔记本电脑性能的重要因素之一,了解笔记本功率可以帮助我们更好地选择适合自己需求的电脑。二、影响笔记本电脑功率的因素1.
    运营干货|| 亚马逊广告关键词匹配方式及使用场景,让你的流量更精准 Keyboards 2
    一谈到广告,关键词就是一个绕不开的话题,也是我们在广告运营中的重中之重。所以,我打算将亚马逊上关键词的内容,分成8篇的更新,从0-1带你全方位的了解亚马逊关键词的基础概念到高阶运营中的用法。在之前的文章中已经更新了亚马逊关键词
    郑州企业专属网络名片定制专家,助力品牌飞跃
    郑州专业网站搭建团队,专注于为企业量身定制专属网络名片,助力品牌形象提升与市场拓展,推动企业腾飞。郑州专业网站搭建团队的核心优势挑选郑州专业网站搭建团队的策略塑造企业独特的网络形象在互联网迅猛发展的今天,网络营销日益成为企
    相关文章
    推荐文章
    发表评论
    0评