分享好友 最新动态首页 最新动态分类 切换频道
AI鲜测 | Claude 3全面升级:多模态+100万Token上下文长度,OpenAI也拦不住了
2024-12-25 13:05

刚刚,Anthropic发布了其新一代大语言模型Claude 3系列,包括Claude 3 Opus、Sonnet和Haiku三种规模,分别代表了超大杯、大杯和中杯。其中Sonnet版本在官网可以免费体验:https://claude.ai

而最强的Opus版本,则需要付费订阅,价格为20美元/月。

Anthropic声称,其中最强大的Claude 3 Opus模型在行业基准测试中超越了OpenAI的GPT-4和谷歌的Gemini Ultra,表现出了出色的知识理解和推理能力。

官方给出了一份42页的文档,感兴趣的可以去看一看:

https://www-cdn.anthropic.com/de8ba9b01c9ab7cbabf5c33b80b7bbc618857627/Model_Card_Claude_3.pdf

抛开官方演示,Claude 3是首次提供多模态支持功能。用户可以上传照片、图表、文档等非结构化数据,由AI模型进行分析和回答。我们自然要来试一试。

比如给他一张图片,让他描述一下:

或是给他一道菜,让它给出这道菜的做法:

这个案例充分的证明了Claude 3并不理解中餐的魅力,这么一道西红柿炒鸡蛋愣是做成了米其林式的番茄鸡蛋汤,不仅用上了黄油橄榄油,还需要香草的点缀。

或是给他一个手写的笔记,让他转录,似乎也还可以:

但是当笔记稍微潦草一点,就搞不定了:

这次在多模态中也加入了代码生成能力,比如我给他一个页面,让他帮我生成实现这个页面的代码:

但是目前Claude 3 对于图片中复杂逻辑题的处理依然不理想,比如图片内容是一道物理题:

Claude 3 出现了幻觉,回答了一些并不存在的问题。

同样的问题GPT-4虽然也没能完全回答问题,但比Claude要强一些。

虽然这次更新减少了拒绝回答的次数,但他的道德感依然要比GPT-4要强不少。

比如让他做一张Web页面的UI代码,因为道德的原因被拒绝了。

案例来自@RubenHssd

除了多模态能力,这次更新后的长文本能力。目前支持200K Token上下文,未来可能会支持到1M的规模。

通过QuALITY测试,Claude 3 Opus在1-shot(一次提示)设置下达到了90.5%的准确率,在0-shot(无提示)设置下达到了89.2%的准确率。

据说当时GPT-3发布就是OpenAI听说Anthropic要发布Claude;在Claude2发布的时候,OpenAI用被称作GPT-4.5的Code Interpreter作为反击;在Anthropic宣布获得亚马逊40亿美元融资的时候,OpenAI为ChatGPT开放了语音和图像能力。

可以说Claude的进展就是OpenAI要有新动作的预告片。

在临近截稿的时候,OpenA宣布ChatGPT增加了一个新功能——阅读回答。

网友对这个动作十分不满意,包括我:

甚至连嘲讽的梗图都出来了:

最新文章
外卖一份面收入5块5:代运营治不了小餐饮的窘迫
  外卖代运营可能是伪商业模式。   王先生觉得,外卖平台并没有让生意变得好做一点。   2019年10月,他和家里人在深圳开了家主营粉面的快餐店。店铺还在装修的时候,美团外卖运营人员就找上门来谈合作,他接入了美团外卖。可只把店铺
共享汽车的使用费用如何计算?
共享汽车的使用费用计算方式挺多的。像一度,无需押金,按分钟和公里付费,2 块 1 公里,2 毛一分钟,结束后从信用卡扣钱。有车也是无需押金,1.5 元/公里加 0.15 元/分钟。驾呗同样无需押金,6 小时内 0.25 元/分钟,6 小时后 0.1 元/分钟
好视通云会议
  使用好视通云会议时大家听主会场发言,其他人都能听到,我听不到是怎么回事?  请您根据提示进行排查,请您在我们客户端主界面点击一下“音频”,然后请点击弹框里第一项“测试扬声器”,请您听一下,是否可以听到一段音乐声呢?  
排列五开奖结果第2021160期 一等奖中出53注
  今天是2021年06月19日,中国体育彩票排列五迎来了第2021160开奖时刻,小编昨天花了100块大洋买了直选大复式号,能否搏个1000万。我一直在想,如果中了1000万,怎么办?  彩种:体彩排列五(排列五)  期号:2021160期  开奖日期
香港特马资料免费大全赢钱买什么,关于香港特马资料免费大全赢钱买什么的问题,我必须首先指出,任何涉及赌博的行为都是违法的,并且存在极高的风险。赌博不仅可能导致财务损失,还可能对个人的心理、家庭和社会关系
摘要:关于香港特马资料免费大全赢钱买什么的问题,提醒广大市民,任何涉及赌博的行为都是违法的,存在巨大风险并可能导致严重后果。赌博不仅损害个人财务,更可能破坏心理、家庭和社会关系。强烈建议远离赌博,遵守法律法规,保护自身安全
数据结构实验四在线等价类排序输出
使用模拟指针实现本实验。输入一个1-9的正整数n,代表要创建n个元素,例如输入5,则代表创建一个1,2,3,4,5组成的元素表。再输入一个大于0正整数r,代表后面要输入r个等价关系。分行输入r个等价关系,格式如(
Python爬虫系列-获取每天黄金价格(编写爬虫的过程和编写代码思路详细解析)
        最近因为经济形势不好,黄金这样的硬通货价格持续走高,而且现在已经到了相当之高的程度。介于理财投资的低迷,黄金的长期投资说不定可以跑赢通胀。对于我们新手的投资,本着低买高卖的原则,总不会亏太多
【夜读】提升自己最好的方式
高度专注生活中,不管是哪个领域的高手,往往都是非常专注的人。做事总是东一榔头西一棒槌,或是频繁被琐事牵绊住心神,很难把一件事做好。把有限的精力放在重要的事情上,才有可能充分发挥自己的潜能。拥有专注力,是一个人走向优秀的开始
全球十大搜索引擎,很多人都只用过第三名
全球排名前11的搜索引擎#1 谷歌谷歌占据了超过85%的搜索市场份额,无疑是最受欢迎的搜索引擎。此外,谷歌还占据了近95%的移动流量。巨大的流量潜力使谷歌成为捕获有机或付费搜索流量的可行选择。当然,缺点是几乎每个人都在争夺相同的流量
相关文章
推荐文章
发表评论
0评