当前位置:主页 > 科技 > 互联网 > OpenAI的劲敌发了一款新模型,Claude 3.5 Sonnet多模态能力超过GPT-4o

OpenAI的劲敌发了一款新模型,Claude 3.5 Sonnet多模态能力超过GPT-4o

2024-06-21 21:41:49来源:界面新闻

文章导读
在GPT-4o炸场一个月后,OpenAI最大的竞争对手 Anthropic放出了一款颇有竞争力的新模型。 北京时间6月21日,Anthropic正式发布 Claude 3.5 Sonnet,这是其 Claude系列的最新AI模型。从Anthropic透露的信息来...

在GPT-4o炸场一个月后,OpenAI最大的竞争对手Anthropic放出了一款颇有竞争力的新模型。 

北京时间6月21日,Anthropic正式发布Claude 3.5 Sonnet,这是其Claude系列的最新AI模型。从Anthropic透露的信息来看,在阅读、编码、数学和视觉等几个主要AI基准测试中,新模型能力不仅超过了Claude 3 Sonnet,还超越了Anthropic此前最强版本的旗舰模型Claude 3 Opus。

按照惯例,Anthropic也释出了一系列与行业竞争对手的测试结果榜单,融易新媒体消息,令人瞩目的是,Claude 3.5 Sonnet的大部分成绩优于OpenAI、Google、Meta的旗舰模型,其中自然也包括刚推出不久还处于风口的GPT-4o。 

细致来看,Claude 3.5 Sonnet在研究生水平推理 (GPQA)、编码能力 (HumanEval) 、文本推理(DROP)等方面的成绩均好于GPT-4o,但在数学问题解决能力上稍逊于后者。

Claude 3.5 Sonnet强调了自己在创意写作方面的突出表现,公司表示它能够更好理解prompt(指令)之间的细微差别以及有更强的幽默能力。

而作为一款多模态大模型,Claude 3.5 Sonnet与GPT-4o相比,没有将重点放在实时音频交互能力上,而是暂时着重突出了图像处理能力的提升。

Claude 3.5 Sonnet在大多数视觉基准测试中比Claude 3 Opus平均表现高出10%。公司称,Claude 3.5 Sonnet可以更准确地解释图表和图形,在带有扭曲和视觉伪像的这类“不完美”图像中,它也能顺利完成文本转录任务。

据TechCrunch报道,Anthropic的产品主管Michael Gerstenhaber表示,这些技术改进的来源是架构调整和新训练数据(包括人工智能生成的数据),但他并未透露究竟数据内容。

性能提高、成本降低的规律也体现在这款最新模型上。根据公司分享的信息,Claude 3.5 Sonnet比Opus速度更快(以聊天机器人为例其速度大约是Opus的两倍),但价格仅为后者的五分之一。

在定价上,该模型的输入价格为3美元/百万Tokens,输出价格为15美元/百万Tokens,上下文窗口长度达200K Tokens。

除了大模型产品,Anthropic此次还推出了一款应用产品Artifacts预览版。这是一个可供用户添加和编辑其模型生成内容的工作空间,例如用其生成的代码、文档、图像、网站设计等内容创建作品。

这款产品会在Claude的web客户端设置一个专用窗口,产品形态类似于将大模型接入工作流。Anthropic表示,Artifacts后续还可能会与其他团队合作以接入新功能。

此外,Anthropic透露,公司将在今年晚些时候陆续更新其余两款大模型Claude 3.5 Haiku和Claude 3.5 Opus。

作为Anthropic背后的科技巨头,亚马逊云科技也随即宣布,Claude 3.5 Sonnet已正式接入其Amazon Bedrock。


免责声明
融易新媒体转载此文目的在于传递更多信息,不代表本网的观点和立场。文章内容仅供参考,不构成投资建议。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。
热门文章
日榜 周榜
1 十年铸剑,破茧成蝶:余承东在开发者大会宣布原生鸿蒙应用开

6月21日,一年一度的华为开发者大会正式开幕,大会围绕鸿蒙生态的核心理念、技术创新、生...

2 平台焦虑、商家逃离,“最卷618”的尽头是否只能是低价?

历经两个月的漫长拉锯后,外界公认的 “史上最卷618”即将落下帷幕。 6月19日,各大电商平台...

3 OpenAI的劲敌发了一款新模型,Claude 3.5 Sonnet多模态能力超过GPT-

在GPT-4o炸场一个月后,OpenAI最大的竞争对手 Anthropic放出了一款颇有竞争力的新模型。 北京时间...

4 东方甄选越来越像线上超市

6月20日,界面新闻从东方甄选方面获悉,2024下半财年(2023年12月至2024年5月),东方甄选公司...

5 不拼低价的小红书电商拿什么求增长?

不拼低价,也不拼超级头部主播,小红书电商的618有些不太一样。 6月19日,小红书电商公布...

6 视频号拟禁止虚拟直播,数字人带货还有未来吗?

平台开始限制虚拟直播了。 近日,界面新闻注意到,微信视频号宣布对《视频号橱窗达人“发...

7 美ONE自有品牌姗姗来迟,李佳琦直播间能否迎来新突破?

当自有品牌成为各超头主播及直播MCN机构的必争之地时,今年618,李佳琦及其公司美ONE也带着...

8 分拆“懂车帝",字节跳动或将收获首个IPO

近日, 据The Information援引知情人士报道,字节跳动计划为懂车帝筹集7亿至8亿美元资金,这笔...

9 理想华莱:让全世界爱上安化黑茶

【直报网北京6月17日讯】(中国质量报) 来呦,qia茶呦...qia,是湖南安化的本土方言,意思里,...

10 葆婴 | 体重管理,到底看数字还是看镜子?

【直报网北京6月18日讯】(葆婴) 今年春节档一部爆火的电影,掀起了一股强大的减肥热潮。不...

1 十年铸剑,破茧成蝶:余承东在开发者大会宣布原生鸿蒙应用开

6月21日,一年一度的华为开发者大会正式开幕,大会围绕鸿蒙生态的核心理念、技术创新、生...

2 平台焦虑、商家逃离,“最卷618”的尽头是否只能是低价?

历经两个月的漫长拉锯后,外界公认的 “史上最卷618”即将落下帷幕。 6月19日,各大电商平台...

3 OpenAI的劲敌发了一款新模型,Claude 3.5 Sonnet多模态能力超过GPT-

在GPT-4o炸场一个月后,OpenAI最大的竞争对手 Anthropic放出了一款颇有竞争力的新模型。 北京时间...

4 东方甄选越来越像线上超市

6月20日,界面新闻从东方甄选方面获悉,2024下半财年(2023年12月至2024年5月),东方甄选公司...

5 不拼低价的小红书电商拿什么求增长?

不拼低价,也不拼超级头部主播,小红书电商的618有些不太一样。 6月19日,小红书电商公布...

6 视频号拟禁止虚拟直播,数字人带货还有未来吗?

平台开始限制虚拟直播了。 近日,界面新闻注意到,微信视频号宣布对《视频号橱窗达人“发...

7 美ONE自有品牌姗姗来迟,李佳琦直播间能否迎来新突破?

当自有品牌成为各超头主播及直播MCN机构的必争之地时,今年618,李佳琦及其公司美ONE也带着...

8 分拆“懂车帝",字节跳动或将收获首个IPO

近日, 据The Information援引知情人士报道,字节跳动计划为懂车帝筹集7亿至8亿美元资金,这笔...

9 理想华莱:让全世界爱上安化黑茶

【直报网北京6月17日讯】(中国质量报) 来呦,qia茶呦...qia,是湖南安化的本土方言,意思里,...

10 葆婴 | 体重管理,到底看数字还是看镜子?

【直报网北京6月18日讯】(葆婴) 今年春节档一部爆火的电影,掀起了一股强大的减肥热潮。不...

备案号:鄂ICP备2022006215号 Copyright © 2002-2024 关于我们 网站地图