界面新闻:感觉你在融资信息的发布上挺谨慎的,但其他家都宣传得很热闹。为什么阶跃不怎么去提融资的事情?
姜大昕:我觉得没有必要。我们最终的目标是把模型训出来,那我们知道自己的融资节奏和方式就好。
界面新闻:但如果有高融资或者高估值,应该也更容易在市场上建立头部印象?
姜大昕:现在的好处是,人工智能领域确实有一批投资人是非常懂的,他们知道这是一个长期且比较耗钱的项目,也愿意相信我们的技术实力。
通往AGI之路,十万亿不是尽头界面新闻:你所信仰的AGI可以怎样概括?
姜大昕:AGI目前确实没有一个准确的定义,我也不想给它一个(定义),只能非常概括地说,达到人的智能就叫AGI 。而且我觉得这里面最重要的一个字就是“G”(general),通用。
界面新闻:你给公司规划了“单模态-多模态-多模理解和生成的统一-世界模型-AGI”的路径,每个阶段要走多长时间是可估算的吗?
姜大昕:不好预测。就像我看到ChatGPT之前,都还会说自然语言处理这件事,常识和推理需要十年二十年来解决,结果一夜之间就解决了。所以有的科学突破可能在积累上早就发生了,但有点像大家说的“涌现”,只看到“砰”地一下上去了,是一种跳变。但这个朝着目标迈进的过程,只要没有达到那个点,它就是0。
界面新闻:阶跃对于明年有什么究竟的目标?
姜大昕:朝着GPT-4.5/5去努力,一个是规模扩大到10万亿参数,第二个是从能力上,我希望明年对多模理解和生成的统一有突破,能够同时理解和生成。
整条线我们都看得很清楚了,包括我们处在什么阶段、什么是落实性的,接下来肯定是在现有的落实性基础上再往前走。
界面新闻:达到万亿参数模型之后,推进Scaling Law最难的事情是什么?
姜大昕:最难的不是一件,是四件事情,就是我们说的算力、系统、数据、算法。
界面新闻:感觉你是一个非常坚信Scaling Law的人,这个定律有到头的时候吗?
姜大昕:这是个很好的问题。在肉眼可见的未来,我觉得至少还有两个数量级。我们到年中应该才算真正攀上去万亿,那么10万亿是个落实性事件,一定会攀。
界面新闻:10万亿对应的是GPT-5?
姜大昕:不知道是GPT-4.5还是GPT-5,就看OpenAI下一个模型出来的是个什么。其实 GPT-4是2022年10月份就训完了,去年4月份发布是因为它后来打磨又用了6个月时间,跟我们现在状态差不多。
虽然OpenAI年初发布了Sora,但最新一代大模型到底叫GPT-4.5还是GPT-5,多大参数规模,都不知道。我们基于它的能力、路线,包括它用的卡做一个推测的话,至少是个10万亿级别。
界面新闻:那第二个数量级就要到百万亿。
姜大昕:这里有一个参考,就是人脑的神经元连接是200万亿,但我觉得不是一个特别有效的参考,因为人和机器现在没有任何可直接对比的关系,可能只是给人一个目标。
界面新闻:除了这个路径之外,还存在别的可能弯道超车的技术路线吗?
姜大昕: 除了刚才的两条路线,还有第三条路径是解读人脑到底是怎么工作的,即脑神经科学。
4月30日,华为投资控股有限公司公布2024年一季度经营业绩。期内公司实现营业收入约1784.5亿元...
2 专访阶跃星辰姜大昕:Scaling Law是通往AGI的必要非充分条件中国通用大模型领域如今已跑出了六家独角兽公司——其中只有一家,搜不到任何公开估值,...
3 中国移动发布国内领先的大云磐石DPU芯片,速率达400Gbps4月28日,中国移动在其2024算力网络大会上正式发布大云磐石DPU,该芯片带宽达到400Gbps,为国内...
4 通义千问开源千亿级参数模型4月28日消息,通义千问开源1100亿参数模型Qwen1.5-110B,成为全系列首个千亿级参数开源模型。...
5 中国移动建成全球运营商最大单体智算中心中国移动正式对外发布全球运营商最大单体智算中心——中国移动智算中心(呼和浩特),目...
6 爱彼迎发布新特色分类及11个特色房源根据今年第一个季度的用户搜索数据,今年夏天,爱彼迎中国用户出境游热度同比增长近2倍。...
7 中国移动董事长杨杰:中国移动已初步建成业界领先算力网络在2024中国移动算力网络大会上,中国移动董事长杨杰在演讲中表示,中国移动已初步建成了基...
8 TikTok与环球音乐达成新授权协议TikTok 与环球音乐集团共同宣布,双方达成新的版权许可协议。阔别三个月后,环球音乐旗下的...
4月30日,华为投资控股有限公司公布2024年一季度经营业绩。期内公司实现营业收入约1784.5亿元...
2 专访阶跃星辰姜大昕:Scaling Law是通往AGI的必要非充分条件中国通用大模型领域如今已跑出了六家独角兽公司——其中只有一家,搜不到任何公开估值,...
3 中国移动发布国内领先的大云磐石DPU芯片,速率达400Gbps4月28日,中国移动在其2024算力网络大会上正式发布大云磐石DPU,该芯片带宽达到400Gbps,为国内...
4 通义千问开源千亿级参数模型4月28日消息,通义千问开源1100亿参数模型Qwen1.5-110B,成为全系列首个千亿级参数开源模型。...
5 中国移动建成全球运营商最大单体智算中心中国移动正式对外发布全球运营商最大单体智算中心——中国移动智算中心(呼和浩特),目...
6 爱彼迎发布新特色分类及11个特色房源根据今年第一个季度的用户搜索数据,今年夏天,爱彼迎中国用户出境游热度同比增长近2倍。...
7 中国移动董事长杨杰:中国移动已初步建成业界领先算力网络在2024中国移动算力网络大会上,中国移动董事长杨杰在演讲中表示,中国移动已初步建成了基...
8 TikTok与环球音乐达成新授权协议TikTok 与环球音乐集团共同宣布,双方达成新的版权许可协议。阔别三个月后,环球音乐旗下的...
9 最新中文大模型测评:百川、智谱、通义领跑国内4月30日,国内权威大模型评测机构SuperCLUE发布了《中文大模型基准测评2024年度4月报告》,报告...
10 勾画全场景招聘蓝图,智联招聘助力更多用户高效求职全场景时代的到来,彻底改变了人类的生活方式、工作方式和社交方式,人力资源行业也打开...
备案号:鄂ICP备2022006215号 Copyright © 2002-2022 关于我们 网站地图