当前位置:主页 > 科技 > IT业界 > 专访阶跃星辰姜大昕:Scaling Law是通往AGI的必要非充分条件

专访阶跃星辰姜大昕:Scaling Law是通往AGI的必要非充分条件

2024-05-05 23:39:43来源:界面新闻

文章导读
中国通用大模型领域如今已跑出了六家独角兽公司——其中只有一家,搜不到任何公开估值,甚至没有融资新闻,就已经遭市场默认列入“独角兽”队伍。这家公司就是阶跃星辰。 喧嚣沸腾...

中国通用大模型领域如今已跑出了六家独角兽公司——其中只有一家,搜不到任何公开估值,甚至没有融资新闻,就已经遭市场默认列入“独角兽”队伍。这家公司就是阶跃星辰。

喧嚣沸腾的“百模大战”中,阶跃星辰以近乎沉寂的状态低调了一年,直到今年3月才浮出水面。

其发布的Step系列大模型是一套全面的“组合拳”:Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型,以及Step-2万亿参数MoE(混合专家架构)语言大模型预览版。

Step-1V一经发布便登上了OpenCompass多模态大模型3月榜榜首,二三名分别是阿里的QWen-VL-Max以及谷歌的GeminiProVision,OpenAI的GPT-4V位列第四。

Step-2预览版则是国内大模型初创公司首次公开万亿参数MoE语言大模型。理论上而言,这是逼近GPT-4发布初始水平的关键节点。

不多言不多语,融易新媒体消息,但一登台就炸场的姿态,大概足以形容阶跃星辰的行事风格。

在幕后掌控这家公司行为调性的人是姜大昕。2023年创业之前,姜大昕是微软全球副总裁、微软亚洲互联网工程研究院(STCA)的首席科学家,主导过微软搜索引擎Bing,以及智能语音助手Cortana、微软云Azure、办公全家桶Microsoft 365等一系列微软当家产品的自然语言理解系统

深厚的技术背景使其习惯于严谨和客观地表达。谈及技术细节,他会给出明确的判断:“如果大语言模型要上万亿参数,MoE架构几乎是必然选择。”

他信仰Scaling Law(规模法则),认为在肉眼可见的未来,至少还有十万亿和百万亿两个数量级,但并不排除脑神经科学领域有朝一日能够在Scaling Law和多模态之外找到通往AGI(通用人工智能)的可能。 

一些公司合作方会用“实在”来形容他。这种描述矛盾而统一,因为他既会扬言“我们的多模理解国内第一”,也会承认“还在追赶去年发布的GPT-4”。背后所依托的逻辑是他所掌握和相信的技术现实。

在微软16年,姜大昕说自己形成最坚不可摧的认知是开放心态和“growth mindset”(成长型思维)——这是老东家微软的文化之一,也是他决定创业的心境来源。 

他判断“上一代搜索已经做到头了”。从“Boosting Tree”(提升树)到神经网络兴起,从CNN(卷积神经网络)、RNN(循环神经网络)、LSTM(长短期记忆网络)再到BERT(谷歌团队提出的一种自然语言处理预训练技术),姜大昕曾把每一代技术都用进搜索,使其实现从“马车”到“汽车”的转变。

直到2022年ChatGPT横空出世,他意识到,这是从“地上跑”到“天上飞”的质变。

因此,如果你不知道对这家新出现的公司究竟期待什么,不妨期待它会如何定义下一代搜索,毕竟它拥有传统搜索引擎时代最有话语权的团队之一。

阶跃星辰会如何用大模型来定义下一代搜索?又如何追上与GPT-4的差距?姜大昕给出了自己的谜底。

以下为姜大昕采访实录(界面新闻略作编辑): 

技术只是窗口期,不是护城河

界面新闻:你们算是国内第一个公布万亿参数MoE大模型的公司,之前一直保持低调,现在希望在行业里树立一个什么样的认知?

姜大昕:去年国内开始提“百模大战”,但很多公司是针对行业或者应用场景发布了大模型,真正从头开始做通用大模型的满打满算十几二十家,相当于已经做完第一轮分化。

我们认为通用大模型还会走得更远,往后发展有两个维度:一个是Scaling Law,从千亿到万亿参数,甚至到百万亿;另外光做语言模型是不够的,要想达到所谓的通用人工智能,就要做多模态理解和生成的融合,首先要做一个多模态理解的模型。


免责声明
融易新媒体转载此文目的在于传递更多信息,不代表本网的观点和立场。文章内容仅供参考,不构成投资建议。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。
热门文章
日榜 周榜
1 高端手机完整回归效果显著,华为一季度净利大增5倍

4月30日,华为投资控股有限公司公布2024年一季度经营业绩。期内公司实现营业收入约1784.5亿元...

2 专访阶跃星辰姜大昕:Scaling Law是通往AGI的必要非充分条件

中国通用大模型领域如今已跑出了六家独角兽公司——其中只有一家,搜不到任何公开估值,...

3 中国移动发布国内领先的大云磐石DPU芯片,速率达400Gbps

4月28日,中国移动在其2024算力网络大会上正式发布大云磐石DPU,该芯片带宽达到400Gbps,为国内...

4 通义千问开源千亿级参数模型

4月28日消息,通义千问开源1100亿参数模型Qwen1.5-110B,成为全系列首个千亿级参数开源模型。...

5 中国移动建成全球运营商最大单体智算中心

中国移动正式对外发布全球运营商最大单体智算中心——中国移动智算中心(呼和浩特),目...

6 爱彼迎发布新特色分类及11个特色房源

根据今年第一个季度的用户搜索数据,今年夏天,爱彼迎中国用户出境游热度同比增长近2倍。...

7 中国移动董事长杨杰:中国移动已初步建成业界领先算力网络

在2024中国移动算力网络大会上,中国移动董事长杨杰在演讲中表示,中国移动已初步建成了基...

8 TikTok与环球音乐达成新授权协议

TikTok 与环球音乐集团共同宣布,双方达成新的版权许可协议。阔别三个月后,环球音乐旗下的...

1 高端手机完整回归效果显著,华为一季度净利大增5倍

4月30日,华为投资控股有限公司公布2024年一季度经营业绩。期内公司实现营业收入约1784.5亿元...

2 专访阶跃星辰姜大昕:Scaling Law是通往AGI的必要非充分条件

中国通用大模型领域如今已跑出了六家独角兽公司——其中只有一家,搜不到任何公开估值,...

3 中国移动发布国内领先的大云磐石DPU芯片,速率达400Gbps

4月28日,中国移动在其2024算力网络大会上正式发布大云磐石DPU,该芯片带宽达到400Gbps,为国内...

4 通义千问开源千亿级参数模型

4月28日消息,通义千问开源1100亿参数模型Qwen1.5-110B,成为全系列首个千亿级参数开源模型。...

5 中国移动建成全球运营商最大单体智算中心

中国移动正式对外发布全球运营商最大单体智算中心——中国移动智算中心(呼和浩特),目...

6 爱彼迎发布新特色分类及11个特色房源

根据今年第一个季度的用户搜索数据,今年夏天,爱彼迎中国用户出境游热度同比增长近2倍。...

7 中国移动董事长杨杰:中国移动已初步建成业界领先算力网络

在2024中国移动算力网络大会上,中国移动董事长杨杰在演讲中表示,中国移动已初步建成了基...

8 TikTok与环球音乐达成新授权协议

TikTok 与环球音乐集团共同宣布,双方达成新的版权许可协议。阔别三个月后,环球音乐旗下的...

9 最新中文大模型测评:百川、智谱、通义领跑国内

4月30日,国内权威大模型评测机构SuperCLUE发布了《中文大模型基准测评2024年度4月报告》,报告...

10 勾画全场景招聘蓝图,智联招聘助力更多用户高效求职

全场景时代的到来,彻底改变了人类的生活方式、工作方式和社交方式,人力资源行业也打开...

备案号:鄂ICP备2022006215号 Copyright © 2002-2022 关于我们 网站地图