当前位置:主页 > 财经 > 经济 > “百模大战”打响,我们具体需要什么样的大模型

“百模大战”打响,我们具体需要什么样的大模型

2023-09-28 22:13:24来源:科技日报

文章导读
大模型展现出的通用智能能力具有重要的现实意义和影响力,是人工智能发展中里程碑式的进展。大模型带来的智能革命,将媲美工业革命和电力革命,深刻改变人类社会的生产生活方式。大模型,或许正是开启智能时代的那一台“蒸汽机”。 要问今年最热的科技热点是什么,许多人会脱口而出——大模型。从年初ChatGPT引发的大模型浪潮,到相关科技企业上线自家大模型产品,“百模大战”不断升级,它所引发的人工智能“地震”还在持续。 进入9月...

  大模型展现出的通用智能能力具有重要的现实意义和影响力,是人工智能发展中里程碑式的进展。大模型带来的智能革命,将媲美工业革命和电力革命,深刻改变人类社会的生产生活方式。大模型,或许正是开启智能时代的那一台“蒸汽机”。

  要问今年最热的科技热点是什么,许多人会脱口而出——大模型。从年初ChatGPT引发的大模型浪潮,到相关科技企业上线自家大模型产品,“百模大战”不断升级,它所引发的人工智能“地震”还在持续。

  进入9月,国内科技厂商在大模型领域动作频频。9月初,此前一直处于内测阶段的多款大模型产品完成备案,正式上线,面向公众开放。9月21日,在华为全联接大会2023上,因在众多领域展示了大模型发展的更多可能,盘古大模型成为当之无愧的主角。

  “百模大战”也好,“群模起舞”也罢,技术进步和创新喷涌的热潮中,人们关注的焦点集中于,我们具体需要什么样的大模型?何种大模型是通向人工智能的最终答案?

  智能时代的“蒸汽机”

  现在到底有多少个大模型产品?似乎没有人能给出准确的答案。

  赛迪顾问发布的《2023大模型现状侦查报告》显示,截至2023年7月底,国外累计发布大模型138个,中国则累计有130个大模型问世。

  但这股浪潮的源头很清楚,正是ChatGPT。

  2022年末,由名不见经传的人工智能公司Open AI打造的大语言模型ChatGPT横空出世,人们可以使用最日常的语言与其对话,让它回答各种问题、完成各类书面任务,聊天、画图、敲代码……人们第一次如此近距离地感受到人工智能带来的震撼,也让“大模型”这个此前只为少数人工智能领域从业者所知的专业概念,成为了遭人们挂在嘴边、反复提及的词汇。

  输入内容、进行计算、产出结果,这是人工智能模型的本质,但大模型的与众不同之处正在于其足够“大”。

  巨大的参数数量、庞大复杂的算法结构、海量的训练数据以及强大的算力支撑,决定了大模型不同于普通的人工智能模型,其拥有强大的通用智能。

  以ChatGPT为例,其早期3.0版本的参数数量已达到1750亿个,4.0版本的参数量更是指数级增加,达到1.8万亿个,训练数据的单位数量更是达到惊人的13万亿。相比之下,早期如围棋机器人AlphaGo等专用人工智能模型,其参数量往往仅为百万级,与大模型相去甚远。

  海量的参数、复杂的算法、强大的训练能力,让大模型成为具备横跨多领域学习能力的通用人工智能,实现了所谓的“智能涌现”,即拥有触类旁通、举一反三的学习能力。如果说此前的人工智能模型还只是经过训练后可以完成某些特殊任务的“马戏团猴子”,那大模型则可以说已经是一个接受完义务教育的“中学毕业生”。

  在北京智源人工智能研究院院长、北京大学计算机学院教授黄铁军看来,大模型展现出的通用智能能力具有重要的现实意义和影响力,是人工智能发展中里程碑式的进展,放眼人类历史、展望人类未来,大模型带来的智能革命,将媲美工业革命和电力革命,深刻改变人类社会的生产生活方式。大模型,或许正是开启智能时代的那一台“蒸汽机”。

  哪条赛道通“罗马”

  ChatGPT引发的大模型热潮让许多科技巨头坐不住了,纷纷将自家“压箱底”的大模型成果公之于众。

  谷歌紧随ChatGPT脚步,发布了基于自家大语言模型的聊天机器人“Bard”,互动媒体与服务公司Meta也不甘落后,发布了同类大模型“Llama”。国内同样热闹非凡,3月份,百度率先发布研发十余年的知识增强大语言模型“文心一言”。随后,360发布“360智脑”,阿里巴巴上线“通义千问”,科大讯飞推出“讯飞星火”,腾讯推出“混元”,华为推出“盘古”……一众科技公司不甘落后地推出了各自的大模型产品。

  彼时,面向公众发布的大模型产品均为内测使用,公众需提出申请,获得内测资格后才能进行体验。7月10日,国家网信办联合国家发改委、教育部、科技部等七部门审议通过并发布《生成式人工智能服务管理暂行办法》(以下简称《办法》),该《办法》8月15日起正式施行。《办法》明确规定,提供具有舆论属性或者社会动员能力的生成式人工智能服务的,应当按照国家有关规定开展安全评估,并履行算法备案等手续。8月底,一批完成算法备案的大模型产品陆续上线,正式面向公众开放。

  或许是ChatGPT带来的震撼过于强烈,以自然语言对话为主要功能体验的大语言模型产品成为许多科技厂商的首选,甚至一度成为大模型的代名词。首批通过备案上线的大模型产品中有百度的“文心一言”、字节跳动的“豆包”、智谱华章的“智谱清言”等。截至9月底,已有十余家大语言模型产品官宣上线,大部分均提供聊天对话、创意写作、代码生成等服务。

  但在大语言模型之外,也有厂商选择了另一条道路,不“恋战”大语言模型,而是直面行业究竟问题。

免责声明
融易新媒体转载此文目的在于传递更多信息,不代表本网的观点和立场。文章内容仅供参考,不构成投资建议。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。
热门文章
日榜 周榜
1 赛后场馆利用样本:张家口冬奥村的康养转型记

冬奥会场馆的赛后维护费用高、使用率低一直是困扰各个举办国的主要问题。与夏奥会不同的...

2 “百模大战”打响,我们具体需要什么样的大模型

大模型展现出的通用智能能力具有重要的现实意义和影响力,是人工智能发展中里程碑式的进...

3 白酒存量市场竞争加剧 经销商门槛越来越高

白酒行业的深度调整,不仅对酒企提出挑战,也对渠道商提出了新要求,白酒渠道商迎来新一...

4 美国联邦贸易委员会对亚马逊发起反垄断诉讼

美国联邦贸易委员会26日联合17个州的总检察长对电商巨头亚马逊发起诉讼,指控其使用一系列...

5 “原生态”的假网红错在哪儿

长期以来,炒作假网红、“摆拍卖惨”“虚假助农”“伪慈善”等行为屡禁不止。法规规定,...

6 快递“最后一公里”大会:末端服务呈效率提升、件均成本降低

中国网财经9月27日讯(记者 王擎宇)“近年来,邮政快递行业实现了从“年均百亿”到“月均百...

7 商务部:已批准了符合规定的若干镓、锗相关物项的出口申请

商务部新闻发言人何亚东在例行新闻发布会上表示,管制政策正式实施以来,商务部陆续收到...

8 再刷刷12306?多地铁路部门宣布中秋国庆增开旅客列车

“为做好今年中秋国庆黄金周运输,满足潮汕地区旅客的出行需要,铁路部门决定加开潮汕站...

9 杭州亚运村“上云” “低碳账户”日新增注册量约一千

杭州亚运村、5个亚运分村、3个运动员住宿酒店已开村,45个国家(地区)代表队都已抵达入住。...

10 新能源车带来城市机遇:今年前7月安徽新能源汽车产量增速超八

中国新能源汽车产业的崛起正在为越来越多的城市发展带来新机遇。 9月20日,2023世界制造业大...

1 赛后场馆利用样本:张家口冬奥村的康养转型记

冬奥会场馆的赛后维护费用高、使用率低一直是困扰各个举办国的主要问题。与夏奥会不同的...

2 “百模大战”打响,我们具体需要什么样的大模型

大模型展现出的通用智能能力具有重要的现实意义和影响力,是人工智能发展中里程碑式的进...

3 白酒存量市场竞争加剧 经销商门槛越来越高

白酒行业的深度调整,不仅对酒企提出挑战,也对渠道商提出了新要求,白酒渠道商迎来新一...

4 美国联邦贸易委员会对亚马逊发起反垄断诉讼

美国联邦贸易委员会26日联合17个州的总检察长对电商巨头亚马逊发起诉讼,指控其使用一系列...

5 “原生态”的假网红错在哪儿

长期以来,炒作假网红、“摆拍卖惨”“虚假助农”“伪慈善”等行为屡禁不止。法规规定,...

6 快递“最后一公里”大会:末端服务呈效率提升、件均成本降低

中国网财经9月27日讯(记者 王擎宇)“近年来,邮政快递行业实现了从“年均百亿”到“月均百...

7 商务部:已批准了符合规定的若干镓、锗相关物项的出口申请

商务部新闻发言人何亚东在例行新闻发布会上表示,管制政策正式实施以来,商务部陆续收到...

8 再刷刷12306?多地铁路部门宣布中秋国庆增开旅客列车

“为做好今年中秋国庆黄金周运输,满足潮汕地区旅客的出行需要,铁路部门决定加开潮汕站...

9 杭州亚运村“上云” “低碳账户”日新增注册量约一千

杭州亚运村、5个亚运分村、3个运动员住宿酒店已开村,45个国家(地区)代表队都已抵达入住。...

10 新能源车带来城市机遇:今年前7月安徽新能源汽车产量增速超八

中国新能源汽车产业的崛起正在为越来越多的城市发展带来新机遇。 9月20日,2023世界制造业大...

备案号:鄂ICP备2022006215号 Copyright © 2002-2022 关于我们 融易新媒体