马斯克的Neuralink想把芯片植入完全健康的人类大脑,但一些大模型公司想最先“征服”智能手机。
近日,国内大语言模型创业公司面壁智能推出了只有20亿参数量级的端侧语言模型面壁MiniCPM,希望“以小博大”。参数量级是衡量模型规模和潜在学习能力的一项关键指标。
虽然目前大模型评测难以形成统一标准,且缺少公开的提示词和测试代码,但面壁智能研究团队发表论文称,其小模型MiniCPM的性能超越或与市面上大部分70亿规模大模型持平,超越了部分百亿参数以上大模型。
这与全行业正在给予小模型的高关注度相吻合,尤其是小模型在智能手机、嵌入式系统等边缘设备上展现出天然应用优势之后。
图源:面壁智能边缘设备通常只有有限的计算能力和存储空间,无法有效地运行大型语言模型。当手机厂商仅靠硬件难以实现差异化时,他们希望把大模型塞进手机,成为移动设备的又一卖点。更重要的是,这些大模型主要依托于云计算,例如OpenAI的ChatGPT使用了微软的云服务。
为摆脱对OpenAI的依赖,去年6月,微软便发布论文证明,13亿参数的模型也能具备非常良好的性能,此后这家公司集中开发了Phi系列小模型。同样看到小模型在降本和提高业务效益方面潜力的还有谷歌和Stability AI,他们纷纷在小模型上发力。
急需找到新增长曲线的手机厂商如华为、OPPO和vivo,已经在去年下半年开始部署端侧模型,只是模型适配尺寸暂不统一,如荣耀是把端侧模型参数局限在70亿之上,小米则是13亿。
据面壁智能团队透露,MiniCPM已经跑通了国际主流手机品牌和终端CPU芯片,目前正与多家终端厂商沟通,探讨将MiniCPM落地的各种可能。该团队还表示,将完全开源MiniCPM-2B的模型参数供学术研究和有限商用。
面壁智能此番新增一项功能——将多模态能力集中在MiniCPM里面,也算开创了行业另一先河。 图源:面壁智能更小的参数意味着更低的部署门槛和使用成本,某种程度上有助于解决云侧模型耗能、算力等成本居高不下的问题。
据面壁智能CEO李大海介绍,MiniCPM的单个模型成本较低,原因是足够小的参数能够实现推理成本的断崖式下跌,甚至可以实现CPU推理,只需一台机器持续参数训练,一张显卡进行参数微调,同时也有持续改进的成本空间。
不过,业界对大模型端侧部署还有些重要问题尚未达成共识,比如手机上跑大模型到底有什么用?到底能跑多大的模型?
为探究大模型在手机上的真实使用场景,阿里前副总裁、人工智能科学家贾扬清的整体感受是,做信息提取跟信息摘要效果较好,而涉及创作、展示创造的东西,则需要更大的模型承载,“大家会觉得在云端跑更好”。
对前述问题,力推端侧模型的面壁智能也不能给出明确谜底。在李大海看来,贾扬清的观点属于某个究竟时点看到的特定现象,但伴随着大模型的快速发展,端侧模型能力边界有了极大提升,这些论断就有可能不成立。
“我们不会对手机大模型的应用场景设限,因为其本身就是通用人工智能。”清华大学长聘副教授、面壁智能联合创始人刘知远表示,在为系统提供稳定接口之后,会解锁很多新玩法,比如订餐与旅游。像苹果Siri能做的事情,都可以作为端侧大语言模型驱动的应用。
他判断端侧大模型有极大可用潜力,因为其不像云端模型一样要跟隐私数据进行交互,可以高度保护个人隐私。未来大模型会是云端共存、云端协同的模式,而他们希望探索模型性能的天花板。
这家创立于2022年的公司,创始成员全部来自清华大学自然语言处理NLP实验室。
距离苹果 Vision Pro正式发售不到一星期, 已有一系列来自中国互联网公司的应用宣布加入visi...
2 大模型烧钱不止,“小模型”能否率先盈利?马斯克的Neuralink想把芯片植入完全健康的人类大脑,但一些大模型公司想最先“征服”智能手...
3 科技早报 | 华为手机重回中国市场第一;英伟达对华“特供”芯界面新闻记者 | 李京亚 英伟达对华“特供”H20芯片已可接受预订 2月4日,界面新闻从多位经销...
4 关于山东省莱西市人民法院限制本人微信支付限制使用一、本人在 2024 年 1月 20日 接到微信支付通知“依据法律规定及有权机关:山东省莱西市人民...
5 举报广州市金鑫文化用品有限公司员工2023年12月31日有一台豫R·149U5的黑色比亚迪SUV车停下来一女的跟我推销文具。她从车上拿出些笔...
6 无人直播短视频带货课程遭骗2950,要求退还学费2024年1月10号我在我抖音后台抖音创作者中心里面的变现任务里面浏览,不一会儿我抖音上就有...
7 QQ遭盗多次申诉不成功,遭封了申诉才成功还不给解决尊敬的尊敬的工信部领导,您好!在2023年2月27日,我的QQ账号遭腾讯公司以“涉嫌传播违法违...
8 武汉育远国信教育收费1499元失联事情发生在2022年9月1日,武汉育远国信教育于2022年9月1日交付武汉育远国信教育1499元,说证下...
9 采购物料付款后失联我公司与“广西自贸区韵创商贸有限责任公司“于2023年12月5日签订采购合同,订购魏德米勒电...
10 杨梅红国际私立美校不给一次性全额退款2023.12.7日 杨梅红的任课老师在学生还有13次课的原因下,让家长续费96个课时的费用,共计12...
距离苹果 Vision Pro正式发售不到一星期, 已有一系列来自中国互联网公司的应用宣布加入visi...
2 大模型烧钱不止,“小模型”能否率先盈利?马斯克的Neuralink想把芯片植入完全健康的人类大脑,但一些大模型公司想最先“征服”智能手...
3 科技早报 | 华为手机重回中国市场第一;英伟达对华“特供”芯界面新闻记者 | 李京亚 英伟达对华“特供”H20芯片已可接受预订 2月4日,界面新闻从多位经销...
4 关于山东省莱西市人民法院限制本人微信支付限制使用一、本人在 2024 年 1月 20日 接到微信支付通知“依据法律规定及有权机关:山东省莱西市人民...
5 举报广州市金鑫文化用品有限公司员工2023年12月31日有一台豫R·149U5的黑色比亚迪SUV车停下来一女的跟我推销文具。她从车上拿出些笔...
6 无人直播短视频带货课程遭骗2950,要求退还学费2024年1月10号我在我抖音后台抖音创作者中心里面的变现任务里面浏览,不一会儿我抖音上就有...
7 QQ遭盗多次申诉不成功,遭封了申诉才成功还不给解决尊敬的尊敬的工信部领导,您好!在2023年2月27日,我的QQ账号遭腾讯公司以“涉嫌传播违法违...
8 武汉育远国信教育收费1499元失联事情发生在2022年9月1日,武汉育远国信教育于2022年9月1日交付武汉育远国信教育1499元,说证下...
9 采购物料付款后失联我公司与“广西自贸区韵创商贸有限责任公司“于2023年12月5日签订采购合同,订购魏德米勒电...
10 杨梅红国际私立美校不给一次性全额退款2023.12.7日 杨梅红的任课老师在学生还有13次课的原因下,让家长续费96个课时的费用,共计12...
备案号:鄂ICP备2022006215号 Copyright © 2002-2022 关于我们 融易新媒体