AI鲜测 | Claude 3全面升级:多模态+100万Token上下文长度,OpenAI也拦不住了

   日期:2024-12-25    作者:b20191008 移动:http://oml01z.riyuangf.com/mobile/quote/12629.html

刚刚,Anthropic发布了其新一代大语言模型Claude 3系列,包括Claude 3 Opus、Sonnet和Haiku三种规模,分别代表了超大杯、大杯和中杯。其中Sonnet版本在官网可以免费体验:https://claude.ai

而最强的Opus版本,则需要付费订阅,价格为20美元/月。

Anthropic声称,其中最强大的Claude 3 Opus模型在行业基准测试中超越了OpenAI的GPT-4和谷歌的Gemini Ultra,表现出了出色的知识理解和推理能力。

官方给出了一份42页的文档,感兴趣的可以去看一看:

https://www-cdn.anthropic.com/de8ba9b01c9ab7cbabf5c33b80b7bbc618857627/Model_Card_Claude_3.pdf

抛开官方演示,Claude 3是首次提供多模态支持功能。用户可以上传照片、图表、文档等非结构化数据,由AI模型进行分析和回答。我们自然要来试一试。

比如给他一张图片,让他描述一下:

或是给他一道菜,让它给出这道菜的做法:

这个案例充分的证明了Claude 3并不理解中餐的魅力,这么一道西红柿炒鸡蛋愣是做成了米其林式的番茄鸡蛋汤,不仅用上了黄油橄榄油,还需要香草的点缀。

或是给他一个手写的笔记,让他转录,似乎也还可以:

但是当笔记稍微潦草一点,就搞不定了:

这次在多模态中也加入了代码生成能力,比如我给他一个页面,让他帮我生成实现这个页面的代码:

但是目前Claude 3 对于图片中复杂逻辑题的处理依然不理想,比如图片内容是一道物理题:

Claude 3 出现了幻觉,回答了一些并不存在的问题。

同样的问题GPT-4虽然也没能完全回答问题,但比Claude要强一些。

虽然这次更新减少了拒绝回答的次数,但他的道德感依然要比GPT-4要强不少。

比如让他做一张Web页面的UI代码,因为道德的原因被拒绝了。

案例来自@RubenHssd

除了多模态能力,这次更新后的长文本能力。目前支持200K Token上下文,未来可能会支持到1M的规模。

通过QuALITY测试,Claude 3 Opus在1-shot(一次提示)设置下达到了90.5%的准确率,在0-shot(无提示)设置下达到了89.2%的准确率。

据说当时GPT-3发布就是OpenAI听说Anthropic要发布Claude;在Claude2发布的时候,OpenAI用被称作GPT-4.5的Code Interpreter作为反击;在Anthropic宣布获得亚马逊40亿美元融资的时候,OpenAI为ChatGPT开放了语音和图像能力。

可以说Claude的进展就是OpenAI要有新动作的预告片。

在临近截稿的时候,OpenA宣布ChatGPT增加了一个新功能——阅读回答。

网友对这个动作十分不满意,包括我:

甚至连嘲讽的梗图都出来了:


特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


举报收藏 0评论 0
0相关评论
相关最新动态
推荐最新动态
点击排行
{
网站首页  |  关于我们  |  联系方式  |  使用协议  |  隐私政策  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号