当前位置:主页 > 科技 > IT业界 > 专访阶跃星辰姜大昕:Scaling Law是通往AGI的必要非充分条件(4)

专访阶跃星辰姜大昕:Scaling Law是通往AGI的必要非充分条件(4)

2024-05-05 23:39:43来源:界面新闻

文章导读
中国通用大模型领域如今已跑出了六家独角兽公司——其中只有一家,搜不到任何公开估值,甚至没有融资新闻,就已经遭市场默认列入“独角兽”队伍。这家公司就是阶跃星辰。 喧嚣沸腾...

界面新闻:感觉你在融资信息的发布上挺谨慎的,但其他家都宣传得很热闹。为什么阶跃不怎么去提融资的事情?

姜大昕:我觉得没有必要。我们最终的目标是把模型训出来,那我们知道自己的融资节奏和方式就好。

界面新闻:如果有高融资或者高估值,应该容易在市场上建立头部印象?

姜大昕:现在的好处是,人工智能领域确实有一批投资人是非常懂的,他们知道这是一个长期且比较耗钱的项目,也愿意相信我们的技术实力。

通往AGI之路,十万亿不是尽头

界面新闻:你所信仰的AGI可以怎样概括?

姜大昕:AGI目前确实没有一个准确的定义,我也不想给它一个(定义),只能非常概括地说,达到人的智能就叫AGI 。而且我觉得这里面最重要的一个字就是“G”(general),通用。

界面新闻:你给公司规划了“单模态-多模态-多模理解和生成的统一-世界模型-AGI”的路径,每个阶段要走多长时间是可估算的吗?

姜大昕:不好预测。就像我看到ChatGPT之前,都还会说自然语言处理这件事,常识和推理需要十年二十年来解决,结果一夜之间就解决了。所以有的科学突破可能在积累上早就发生了,但有点像大家说的“涌现”,只看到“砰”地一下上去了,是一种跳变。但这个朝着目标迈进的过程,只要没有达到那个点,它就是0。

界面新闻:阶跃对于明年有什么究竟的目标?

姜大昕:朝着GPT-4.5/5去努力,一个是规模扩大到10万亿参数,第二个是从能力上,我希望明年对多模理解和生成的统一有突破,能够同时理解和生成。

整条线我们都看得很清楚了,包括我们处在什么阶段、什么是落实性的,接下来肯定是在现有的落实性基础上再往前走。 

界面新闻:达到万亿参数模型之后,推进Scaling Law最难的事情是什么? 

姜大昕:最难的不是一件,是四件事情,就是我们说的算力、系统、数据、算法。

界面新闻:感觉你是一个非常坚信Scaling Law的人,这个定律有到头的时候吗?

姜大昕:这是个很好的问题。在肉眼可见的未来,我觉得至少还有两个数量级。我们到年中应该才算真正攀上去万亿,那么10万亿是个落实性事件,一定会攀。

界面新闻:10万亿对应的是GPT-5?

姜大昕:不知道是GPT-4.5还是GPT-5,就看OpenAI下一个模型出来的是个什么。其实 GPT-4是2022年10月份就训完了,去年4月份发布是因为它后来打磨又用了6个月时间,跟我们现在状态差不多。

虽然OpenAI年初发布了Sora,但最新一代大模型到底叫GPT-4.5还是GPT-5,多大参数规模,都不知道。我们基于它的能力、路线,包括它用的卡做一个推测的话,至少是个10万亿级别。 

界面新闻:那第二个数量级就要到百万亿。

姜大昕:这里有一个参考,就是人脑的神经元连接是200万亿,但我觉得不是一个特别有效的参考,因为人和机器现在没有任何可直接对比的关系,可能只是给人一个目标。

界面新闻:除了这个路径之外,还存在别的可能弯道超车的技术路线吗?

姜大昕: 除了刚才的两条路线,还有第三条路径是解读人脑到底是怎么工作的,即脑神经科学。


免责声明
融易新媒体转载此文目的在于传递更多信息,不代表本网的观点和立场。文章内容仅供参考,不构成投资建议。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。
热门文章
日榜 周榜
1 高端手机完整回归效果显著,华为一季度净利大增5倍

4月30日,华为投资控股有限公司公布2024年一季度经营业绩。期内公司实现营业收入约1784.5亿元...

2 专访阶跃星辰姜大昕:Scaling Law是通往AGI的必要非充分条件

中国通用大模型领域如今已跑出了六家独角兽公司——其中只有一家,搜不到任何公开估值,...

3 中国移动发布国内领先的大云磐石DPU芯片,速率达400Gbps

4月28日,中国移动在其2024算力网络大会上正式发布大云磐石DPU,该芯片带宽达到400Gbps,为国内...

4 通义千问开源千亿级参数模型

4月28日消息,通义千问开源1100亿参数模型Qwen1.5-110B,成为全系列首个千亿级参数开源模型。...

5 中国移动建成全球运营商最大单体智算中心

中国移动正式对外发布全球运营商最大单体智算中心——中国移动智算中心(呼和浩特),目...

6 爱彼迎发布新特色分类及11个特色房源

根据今年第一个季度的用户搜索数据,今年夏天,爱彼迎中国用户出境游热度同比增长近2倍。...

7 中国移动董事长杨杰:中国移动已初步建成业界领先算力网络

在2024中国移动算力网络大会上,中国移动董事长杨杰在演讲中表示,中国移动已初步建成了基...

8 TikTok与环球音乐达成新授权协议

TikTok 与环球音乐集团共同宣布,双方达成新的版权许可协议。阔别三个月后,环球音乐旗下的...

1 高端手机完整回归效果显著,华为一季度净利大增5倍

4月30日,华为投资控股有限公司公布2024年一季度经营业绩。期内公司实现营业收入约1784.5亿元...

2 专访阶跃星辰姜大昕:Scaling Law是通往AGI的必要非充分条件

中国通用大模型领域如今已跑出了六家独角兽公司——其中只有一家,搜不到任何公开估值,...

3 中国移动发布国内领先的大云磐石DPU芯片,速率达400Gbps

4月28日,中国移动在其2024算力网络大会上正式发布大云磐石DPU,该芯片带宽达到400Gbps,为国内...

4 通义千问开源千亿级参数模型

4月28日消息,通义千问开源1100亿参数模型Qwen1.5-110B,成为全系列首个千亿级参数开源模型。...

5 中国移动建成全球运营商最大单体智算中心

中国移动正式对外发布全球运营商最大单体智算中心——中国移动智算中心(呼和浩特),目...

6 爱彼迎发布新特色分类及11个特色房源

根据今年第一个季度的用户搜索数据,今年夏天,爱彼迎中国用户出境游热度同比增长近2倍。...

7 中国移动董事长杨杰:中国移动已初步建成业界领先算力网络

在2024中国移动算力网络大会上,中国移动董事长杨杰在演讲中表示,中国移动已初步建成了基...

8 TikTok与环球音乐达成新授权协议

TikTok 与环球音乐集团共同宣布,双方达成新的版权许可协议。阔别三个月后,环球音乐旗下的...

9 最新中文大模型测评:百川、智谱、通义领跑国内

4月30日,国内权威大模型评测机构SuperCLUE发布了《中文大模型基准测评2024年度4月报告》,报告...

10 勾画全场景招聘蓝图,智联招聘助力更多用户高效求职

全场景时代的到来,彻底改变了人类的生活方式、工作方式和社交方式,人力资源行业也打开...

备案号:鄂ICP备2022006215号 Copyright © 2002-2022 关于我们 网站地图