当前位置:主页 > 科技 > IT业界 > 通义千问首次落地天玑9300移动平台!阿里云携手MediaTek探索端侧AI智能体

通义千问首次落地天玑9300移动平台!阿里云携手MediaTek探索端侧AI智能体

2024-04-04 18:39:38来源:中国网科技

文章导读
3月28日,阿里云与知名半导体公司MediaTek联合宣布,通义千问18亿、40亿参数大模型已成功部署进天玑9300移动平台,可离线流畅运行即时且精准的多轮AI对话应用,连续推理功耗增量不到3W,实...

  3月28日,融易新媒体消息,阿里云与知名半导体公司MediaTek联合宣布,通义千问18亿、40亿参数大模型已成功部署进天玑9300移动平台,可离线流畅运行即时且精准的多轮AI对话应用,连续推理功耗增量不到3W,实现手机AI体验的大幅提升。这是通义大模型首次完成芯片级的软硬适配,仅依靠终端算力便能拥有极佳的推理性能及功耗表现,标志着Model-on-Chip的探索正式从验证走向商业化落地新阶段。


  端侧AI是大模型落地的极具潜力的场景之一。利用终端算力进行AI推理,可大幅降低推理成本、保证数据安全并提升AI响应速度,让大模型可以更好地为用户提供个性化体验。然而,要将大模型部署并运行在终端,需完成从底层芯片到上层操作系统及应用开发的软硬一体深度适配,存在技术未打通、算子不支持、开发待完善等诸多挑战。

  据了解,通义千问18亿参数开源大模型,在多个权威测试集上性能表现远超此前SOTA模型,且推理2048 token最低仅用1.8G内存,是一款低成本、易于部署、商业化友好的小尺寸模型。天玑9300集成MediaTek第七代AI处理器APU790,生成式AI处理速度是上一代AI处理器的8倍。

  阿里巴巴通义实验室业务负责人徐栋介绍称,阿里云与MediaTek在模型瘦身、工具链优化、推理优化、内存优化、算子优化等多个维度展开合作,实现了基于AI处理器的高效异构加速,真正把大模型“装进”并运行在手机芯片中,给业界成功打样端侧AI的Model-on-Chip部署新模式。


图:在天玑9300设备上,可离线完成基于通义千问大模型的AI多轮会话

  基于天玑9300芯片,通义千问18亿参数大模型在推理方面表现出了极佳的性能与功耗表现,推理时CPU占有率仅为30%左右,RAM占用少于2GB,推理速度超过20tokens/秒,系列指标均达到业界领先水平,可在离线环境下流畅实现多轮AI对话。据了解,相关成果将以SDK的形式提供给手机厂商和开发者。

  此外,双方团队也已完成了通义千问40亿参数大模型与天玑9300的适配,未来还将基于天玑适配70亿等更多尺寸大模型,“打样”并支持开发更多AI智能体及应用。

  MediaTek无线通信事业部副总经理李彦辑博士表示:“阿里云的通义系列大模型是AI领域的佼佼者,我们期待通过双方的合作可以为应用开发者和终端客户提供更强大的硬件和软件解决方案,同时促进生成式AI的端侧部署以及AI应用、AI智能体生态的快速发展,为用户带来更多令人兴奋的AI产品体验。”

  当天,阿里云与MediaTek宣布启动联合探索AI智能体解决方案计划,整合MediaTek天玑移动平台的AI算力及阿里云通义千问的大模型能力,为开发者和企业提供更完善的软硬联合开发平台,以更好支持智能终端在端侧高能效地实现自然语言理解、复杂决策制定以及个性化服务生成,探索打造真正具备情境感知、自主学习和实时交互功能的下一代智能终端应用生态。

  通义大模型已在各行业广泛落地,包括钉钉、淘宝、一汽红旗、央视网、浙江大学等众多应用、企业及机构。“淘宝问问”基于通义千问实现了全新的交互体验以及更精准的推荐;阿里云与中国一汽联合打造的大模型应用GPT-BI已率先落地,可结合企业数据自动生成分析图表。


免责声明
融易新媒体转载此文目的在于传递更多信息,不代表本网的观点和立场。文章内容仅供参考,不构成投资建议。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。
热门文章
日榜 周榜
1 加码求职安全守护 智联招聘联合北京反诈中心共筑安全防线

“金三银四”期间,求职者纷纷登录线上招聘平台,期待找到一份理想的工作。然而,一些非...

2 通义千问首次落地天玑9300移动平台!阿里云携手MediaTek探索端侧

3月28日,阿里云与知名半导体公司MediaTek联合宣布,通义千问18亿、40亿参数大模型已成功部署...

3 神州租车与华住集团深化区域合作 助推江西全域旅游提质升级

神州租车继续夯实文旅出行基座。近日,神州租车华北华中大区宣布与华住集团华中公司继续...

4 如何看懂孩子的“若无其事”?世界孤独症日知乎上线儿童心理

4月2日,是第十七个世界孤独症关注日。由知乎、壹心理和新世相联合发起的“养育心理知多少...

5 智能锁也能用上GPT 德施曼落地生成式AI应用场景

在AI技术影响各行各业的当下,ChatGPT现象级地推动了生成式AI的应用场景落地。4月2日,2024德施...

6 2024春季搜狐视频播主大会举办在即 张朝阳开启每日跑步直播

朝阳公园跑个步,满园春色关不住。4月2日,搜狐创始人、董事局主席兼首席执行官、物理学博...

7 PingPong同行者联盟打造一站式生态服务 助力商家快速掘金TikTok

3月28日,由PingPong与TikTok Shop携手举办的“2024 TikTok Shop 跨境招商大会”在厦门召开。会上,P...

1 加码求职安全守护 智联招聘联合北京反诈中心共筑安全防线

“金三银四”期间,求职者纷纷登录线上招聘平台,期待找到一份理想的工作。然而,一些非...

2 通义千问首次落地天玑9300移动平台!阿里云携手MediaTek探索端侧

3月28日,阿里云与知名半导体公司MediaTek联合宣布,通义千问18亿、40亿参数大模型已成功部署...

3 神州租车与华住集团深化区域合作 助推江西全域旅游提质升级

神州租车继续夯实文旅出行基座。近日,神州租车华北华中大区宣布与华住集团华中公司继续...

4 如何看懂孩子的“若无其事”?世界孤独症日知乎上线儿童心理

4月2日,是第十七个世界孤独症关注日。由知乎、壹心理和新世相联合发起的“养育心理知多少...

5 智能锁也能用上GPT 德施曼落地生成式AI应用场景

在AI技术影响各行各业的当下,ChatGPT现象级地推动了生成式AI的应用场景落地。4月2日,2024德施...

6 2024春季搜狐视频播主大会举办在即 张朝阳开启每日跑步直播

朝阳公园跑个步,满园春色关不住。4月2日,搜狐创始人、董事局主席兼首席执行官、物理学博...

7 PingPong同行者联盟打造一站式生态服务 助力商家快速掘金TikTok

3月28日,由PingPong与TikTok Shop携手举办的“2024 TikTok Shop 跨境招商大会”在厦门召开。会上,P...

8 滕州鼎泰网络科技公司流量卡虚标,且不退款

我在这家公司买的流量卡,虚标,让他们退款,他们不退,跟他们说了好多遍,他们说可以给...

9 端到端模型落地量产,自动驾驶企业争抢上车

3月18日,特斯拉开始在北美地区完整推送FSD(全自动驾驶)V12.3版本,这是去年公布V12以来,其...

10 苹果又发大模型论文,Siri未来也许能“看懂”屏幕了

苹果近日发布的一篇语言模型相关的论文,预示了未来的Siri可能拥有读懂屏幕的能力,这意味...

备案号:鄂ICP备2022006215号 Copyright © 2002-2022 关于我们 网站地图