当前位置:主页 > 科技 > 互联网 > 大模型烧钱不止,“小模型”能否率先盈利?

大模型烧钱不止,“小模型”能否率先盈利?

2024-02-07 01:48:15来源:界面新闻

文章导读
马斯克的Neuralink想把芯片植入完全健康的人类大脑,但一些大模型公司想最先“征服”智能手机。 近日,国内大语言模型创业公司面壁智能推出了只有20亿参数量级的端侧语言模型面壁MiniCPM,希望“以小博大”。参数量级是衡量模型规模和潜在学习能力的一项关键指标。 虽然目前大模型评测难以形成统一标准,且缺少公开的提示词和测试代码,但 面壁智能研究团队发表论文称,其小模型MiniCPM的性能超越或与市面上大部分70亿规模大模型持平,超越了...

马斯克的Neuralink想把芯片植入完全健康的人类大脑,但一些大模型公司想最先“征服”智能手机。

近日,国内大语言模型创业公司面壁智能推出了只有20亿参数量级的端侧语言模型面壁MiniCPM,希望“以小博大”。参数量级是衡量模型规模和潜在学习能力的一项关键指标。

虽然目前大模型评测难以形成统一标准,且缺少公开的提示词和测试代码,但面壁智能研究团队发表论文称,其小模型MiniCPM的性能超越或与市面上大部分70亿规模大模型持平,超越了部分百亿参数以上大模型。

这与全行业正在给予小模型的高关注度相吻合,尤其是小模型在智能手机、嵌入式系统等边缘设备上展现出天然应用优势之后。

大模型烧钱不止,“小模型”能否率先盈利?

图源:面壁智能
面壁智能联合创始人刘知远表示,在Mistral-6B的同一模型水平下,面壁智能团队的模型参数量是最小的。这或许意味着模型的效率遭提升到了最高水平。

边缘设备通常只有有限的计算能力和存储空间,无法有效地运行大型语言模型。当手机厂商仅靠硬件难以实现差异化时,他们希望把大模型塞进手机,成为移动设备的又一卖点。更重要的是,这些大模型主要依托于云计算,例如OpenAI的ChatGPT使用了微软的云服务。

大模型烧钱不止,“小模型”能否率先盈利?

为摆脱对OpenAI的依赖,去年6月,微软便发布论文证明,13亿参数的模型也能具备非常良好的性能,此后这家公司集中开发了Phi系列小模型。同样看到小模型在降本和提高业务效益方面潜力的还有谷歌和Stability AI,他们纷纷在小模型上发力。

急需找到新增长曲线的手机厂商如华为、OPPO和vivo,已经在去年下半年开始部署端侧模型,只是模型适配尺寸暂不统一,如荣耀是把端侧模型参数局限在70亿之上,小米则是13亿。

据面壁智能团队透露,MiniCPM已经跑通了国际主流手机品牌和终端CPU芯片,目前正与多家终端厂商沟通,探讨将MiniCPM落地的各种可能。该团队还表示,将完全开源MiniCPM-2B的模型参数供学术研究和有限商用。

大模型烧钱不止,“小模型”能否率先盈利?

面壁智能此番新增一项功能——将多模态能力集中在MiniCPM里面,也算开创了行业另一先河。 图源:面壁智能 

更小的参数意味着更低的部署门槛和使用成本,某种程度上有助于解决云侧模型耗能、算力等成本居高不下的问题。

面壁智能CEO李大海介绍,MiniCPM的单个模型成本较低,原因是足够小的参数能够实现推理成本的断崖式下跌,甚至可以实现CPU推理,只需一台机器持续参数训练,一张显卡进行参数微调,同时也有持续改进的成本空间。

不过,业界对大模型端侧部署还有些重要问题尚未达成共识,比如手机上跑大模型到底有什么用?到底能跑多大的模型?

为探究大模型在手机上的真实使用场景,阿里前副总裁、人工智能科学家贾扬清的整体感受是,做信息提取跟信息摘要效果较好,而涉及创作、展示创造的东西,则需要更大的模型承载,“大家会觉得在云端跑更好”。

对前述问题,力推端侧模型的面壁智能也不能给出明确谜底。在李大海看来,贾扬清的观点属于某个究竟时点看到的特定现象,但伴随着大模型的快速发展,端侧模型能力边界有了极大提升,这些论断就有可能不成立。

“我们不会对手机大模型的应用场景设限,因为其本身就是通用人工智能。”清华大学长聘副教授、面壁智能联合创始人刘知远表示,在为系统提供稳定接口之后,会解锁很多新玩法,比如订餐与旅游。像苹果Siri能做的事情,都可以作为端侧大语言模型驱动的应用。

他判断端侧大模型有极大可用潜力,因为其不像云端模型一样要跟隐私数据进行交互,可以高度保护个人隐私。未来大模型会是云端共存、云端协同的模式,而他们希望探索模型性能的天花板。

这家创立于2022年的公司,创始成员全部来自清华大学自然语言处理NLP实验室


免责声明
融易新媒体转载此文目的在于传递更多信息,不代表本网的观点和立场。文章内容仅供参考,不构成投资建议。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。
热门文章
日榜 周榜
1 一批中国公司已经在为Vision Pro开发应用

距离苹果 Vision Pro正式发售不到一星期, 已有一系列来自中国互联网公司的应用宣布加入visi...

2 大模型烧钱不止,“小模型”能否率先盈利?

马斯克的Neuralink想把芯片植入完全健康的人类大脑,但一些大模型公司想最先“征服”智能手...

3 科技早报 | 华为手机重回中国市场第一;英伟达对华“特供”芯

界面新闻记者 | 李京亚 英伟达对华“特供”H20芯片已可接受预订 2月4日,界面新闻从多位经销...

4 关于山东省莱西市人民法院限制本人微信支付限制使用

一、本人在 2024 年 1月 20日 接到微信支付通知“依据法律规定及有权机关:山东省莱西市人民...

5 举报广州市金鑫文化用品有限公司员工

2023年12月31日有一台豫R·149U5的黑色比亚迪SUV车停下来一女的跟我推销文具。她从车上拿出些笔...

6 无人直播短视频带货课程遭骗2950,要求退还学费

2024年1月10号我在我抖音后台抖音创作者中心里面的变现任务里面浏览,不一会儿我抖音上就有...

7 QQ遭盗多次申诉不成功,遭封了申诉才成功还不给解决

尊敬的尊敬的工信部领导,您好!在2023年2月27日,我的QQ账号遭腾讯公司以“涉嫌传播违法违...

8 武汉育远国信教育收费1499元失联

事情发生在2022年9月1日,武汉育远国信教育于2022年9月1日交付武汉育远国信教育1499元,说证下...

9 采购物料付款后失联

我公司与“广西自贸区韵创商贸有限责任公司“于2023年12月5日签订采购合同,订购魏德米勒电...

10 杨梅红国际私立美校不给一次性全额退款

2023.12.7日 杨梅红的任课老师在学生还有13次课的原因下,让家长续费96个课时的费用,共计12...

1 一批中国公司已经在为Vision Pro开发应用

距离苹果 Vision Pro正式发售不到一星期, 已有一系列来自中国互联网公司的应用宣布加入visi...

2 大模型烧钱不止,“小模型”能否率先盈利?

马斯克的Neuralink想把芯片植入完全健康的人类大脑,但一些大模型公司想最先“征服”智能手...

3 科技早报 | 华为手机重回中国市场第一;英伟达对华“特供”芯

界面新闻记者 | 李京亚 英伟达对华“特供”H20芯片已可接受预订 2月4日,界面新闻从多位经销...

4 关于山东省莱西市人民法院限制本人微信支付限制使用

一、本人在 2024 年 1月 20日 接到微信支付通知“依据法律规定及有权机关:山东省莱西市人民...

5 举报广州市金鑫文化用品有限公司员工

2023年12月31日有一台豫R·149U5的黑色比亚迪SUV车停下来一女的跟我推销文具。她从车上拿出些笔...

6 无人直播短视频带货课程遭骗2950,要求退还学费

2024年1月10号我在我抖音后台抖音创作者中心里面的变现任务里面浏览,不一会儿我抖音上就有...

7 QQ遭盗多次申诉不成功,遭封了申诉才成功还不给解决

尊敬的尊敬的工信部领导,您好!在2023年2月27日,我的QQ账号遭腾讯公司以“涉嫌传播违法违...

8 武汉育远国信教育收费1499元失联

事情发生在2022年9月1日,武汉育远国信教育于2022年9月1日交付武汉育远国信教育1499元,说证下...

9 采购物料付款后失联

我公司与“广西自贸区韵创商贸有限责任公司“于2023年12月5日签订采购合同,订购魏德米勒电...

10 杨梅红国际私立美校不给一次性全额退款

2023.12.7日 杨梅红的任课老师在学生还有13次课的原因下,让家长续费96个课时的费用,共计12...

备案号:鄂ICP备2022006215号 Copyright © 2002-2022 关于我们 融易新媒体