当前位置:主页 > 财经 > 重大发布!阿里云宣布:完整赶超GPT-4!

重大发布!阿里云宣布:完整赶超GPT-4!

2024-05-13 00:08:08来源:互联网

文章导读
通义大模型发布一周年之际,迎来重要的历史性时刻! 5月9日,阿里云召开峰会,正式发布通义千问2.5,模型性能完整赶超GPT-4-Turbo,成为“地表最强”中文大模型。同时,通义千问1100亿参数...

  通义大模型发布一周年之际,迎来重要的历史性时刻!

  5月9日,阿里云召开峰会,正式发布通义千问2.5,模型性能完整赶超GPT-4-Turbo,成为“地表最强”中文大模型。同时,通义千问1100亿参数开源模型在多个基准测评收获最佳成绩,超越Meta的Llama-3-70B,成为开源领域最强大模型。

  在峰会当日,原通义千问APP宣布更名为“通义APP”,融易新媒体消息,将通义大模型全套能力集于一身,致力于成为“通情达义”的AI助手。

  最强中文大模型来了

  历经一年多追赶,国产大模型终于进入大模型核心竞技场,可与国外一流大模型企业一较高下。

  从现实情况来看,大模型技术爆发一年多,行业竞争态势激烈而又多变。通义千问走了一条最“卷”的路,自2023年4月问世以来,始终专注于基础模型的技术研发,从初代模型升级至2.5版本。

  相比上一版本,2.5版模型的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%,中文能力更是持续领先业界。根据权威基准Open Compass的测评结果,通义千问2.5得分追平GPT-4-Turbo,是该基准首次录得国产大模型取得如此出色的成绩。

  同时,通义还发布了1100亿参数开源模型Qwen1.5-110B,该模型在MMLU、Theorem QA、GPQA等基准测评中超越了Meta的Llama-3-70B模型;在Hugging Face推出的开源大模型排行榜Open LLM Leaderboard上,Qwen1.5-110B冲上榜首,再度证明通义开源系列业界竞争力领先。

  此外,通义在多模态模型和专有能力模型也具备业界顶尖影响力。在多个多模态标准测试中,通义千问视觉理解模型Qwen-VL-Max得分超越Gemini Ultra和GPT-4V,这款模型已在多家企业落地应用;通义千问代码大模型Code Qwen1.5-7B则是Hugging Face代码模型榜单Big Code的头号选手,这款模型是国内用户规模第一的智能编码助手通义灵码的底座。

  从曾经的追赶者到如今的并行者,一年间,通义发展出了业界领先的文生图、智能编码、文档解析、音视频理解等能力,企业客户和开发者可以通过API调用、模型下载等方式接入通义,个人用户可从APP、官网和小程序免费使用通义。

  始终坚定开源路线

  据了解,通义是大模型开源最积极的推动者和实践者。去年8月,通义宣布加入开源行列,随之启动马不停蹄的开源狂飙,沿着“全模态、全尺寸”开源的路线,陆续推出十多款开源模型。目前,通义开源模型下载量已经超过700万。

  “开发者的反馈和开源社区的生态支持,是通义大模型技术进步的重要助力。”阿里云CTO周靖人透露,未来通义大模型还会持续开源。

阿里云首席技术官周靖人宣布重磅发布

  从现实情况来看,大模型的训练和迭代成本极高,绝大部分的AI开发者和中小企业都无法负担。Meta、阿里云等推动的大模型开源风潮,让开发者们不必从头训练模型,还把模型选型的主动权交给了开发者,大大加速了大模型的应用落地进程。

  为顺应不同场景用户的需求,通义推出参数规模横跨5亿到1100亿的八款大语言模型,小尺寸模型如0.5B、1.8B、4B、7B、14B,可便捷地在手机、PC等端侧设备部署;大尺寸模型如72B、110B,能支持企业级和科研级的应用;中等尺寸如32B,试图在性能、效率和内存占用之间找到最具性价比的平衡点。此外,通义还开源了视觉理解模型Qwen-VL、音频理解模型Qwen-Audio、代码模型CodeQwen1.5-7B、混合专家模型Qwen1.5-MoE。

  通义72B、110B开源模型都曾登顶OpenLLMLeaderboard榜首。在开放研究机构LMSYSOrg推出的基准测试平台Chatbot Arena上,通义72B模型多次进入“盲测”结果全球Top 10,创造了国产大模型的先例。

  根据最新数据,通义通过阿里云服务企业超过9万、通过钉钉服务企业超过220万,目前已应用于PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等行业。

  就在5月9日,小米旗下的智能助手“小爱同学”宣布与阿里云通义大模型达成合作,强化其在图片生成、图片理解等方面的多模态AI生成能力;新浪、众安保险完美世界游戏、中国一汽等企业也宣布接入通义大模型,将大模型应用于社交媒体、保险游戏等领域。


免责声明
融易新媒体转载此文目的在于传递更多信息,不代表本网的观点和立场。文章内容仅供参考,不构成投资建议。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。
热门文章
日榜 周榜
1 IPO“备考生”迎新规 谁将离场?

伴随IPO新规落地,A股拟上市企业迎来“新考卷”。 4月30日,为贯彻落实新“国九条”,中国证...

2 科凯电子终止创业板IPO 原拟募资10.01亿元

据深交所官网消息,深交所决定终止青岛科凯电子研究所股份有限公司(以下简称“科凯电子”...

3 重大发布!阿里云宣布:完整赶超GPT-4!

通义大模型发布一周年之际,迎来重要的历史性时刻! 5月9日,阿里云召开峰会,正式发布通...

4 万亿巨头宣布:全球下架!曾承认“或引发罕见副作用” 有人接

当地时间5月8日,英国制药公司阿斯利康宣布, 公司已开始在全球范围内下架新冠疫苗 。该公...

5 价格大跳水!机票低至8元 有人立省1万元

“五一”假期过后,多个热门航线机票价格大幅下降,部分低至一折左右,甚至一张机票不到...

6 100万投资什么项目好 这几个项目可以试试

随着经济水平的的发展,很多人越来越意识到投资的重要性。现在市场上可以投资的项目越来...

7 个人征信会显示什么内容 主要包括了这些

都知道在如今这个时代,个人征信良好的状态办理什么事情都比较顺利。很多人是第一次了解...

8 按揭贷款和抵押贷款哪个利率低些 按揭贷款和抵押贷款的区别是

按揭贷款和抵押贷款 相比 通常按揭贷款的利率更低。按揭贷款的利率执行的是央行公布的基准...

9 花呗无法使用怎么回事 无法使用花呗多久恢复

花呗不能使用可能是因为花呗逾期或者遭风控了,也有可能是支付宝账户的综合评分不足。不...

10 房贷逾期一天计入征信有影响吗 房贷还不了怎么办

房贷逾期一天的时候是有可能上征信的。住房贷款一般没有还款缓冲期,在还款日当天没有还...

1 IPO“备考生”迎新规 谁将离场?

伴随IPO新规落地,A股拟上市企业迎来“新考卷”。 4月30日,为贯彻落实新“国九条”,中国证...

2 科凯电子终止创业板IPO 原拟募资10.01亿元

据深交所官网消息,深交所决定终止青岛科凯电子研究所股份有限公司(以下简称“科凯电子”...

3 重大发布!阿里云宣布:完整赶超GPT-4!

通义大模型发布一周年之际,迎来重要的历史性时刻! 5月9日,阿里云召开峰会,正式发布通...

4 万亿巨头宣布:全球下架!曾承认“或引发罕见副作用” 有人接

当地时间5月8日,英国制药公司阿斯利康宣布, 公司已开始在全球范围内下架新冠疫苗 。该公...

5 价格大跳水!机票低至8元 有人立省1万元

“五一”假期过后,多个热门航线机票价格大幅下降,部分低至一折左右,甚至一张机票不到...

6 100万投资什么项目好 这几个项目可以试试

随着经济水平的的发展,很多人越来越意识到投资的重要性。现在市场上可以投资的项目越来...

7 个人征信会显示什么内容 主要包括了这些

都知道在如今这个时代,个人征信良好的状态办理什么事情都比较顺利。很多人是第一次了解...

8 按揭贷款和抵押贷款哪个利率低些 按揭贷款和抵押贷款的区别是

按揭贷款和抵押贷款 相比 通常按揭贷款的利率更低。按揭贷款的利率执行的是央行公布的基准...

9 花呗无法使用怎么回事 无法使用花呗多久恢复

花呗不能使用可能是因为花呗逾期或者遭风控了,也有可能是支付宝账户的综合评分不足。不...

10 房贷逾期一天计入征信有影响吗 房贷还不了怎么办

房贷逾期一天的时候是有可能上征信的。住房贷款一般没有还款缓冲期,在还款日当天没有还...

备案号:鄂ICP备2022006215号 Copyright © 2002-2022 关于我们 网站地图