当前位置:主页 > 产业 > 消费提示 > 重磅!类人速度超快语音响应!OpenAI推出新旗舰模型GPT-4o 图文音频手机AI搞定

重磅!类人速度超快语音响应!OpenAI推出新旗舰模型GPT-4o 图文音频手机AI搞定

2024-05-14 21:11:39来源:互联网

文章导读
北京时间周二凌晨1点,自年初“文生视频模型”Sora后许久未给市场带来惊喜的OpenAI举行春季发布会。公司首席技术官米拉·穆拉蒂(Mira Murati)向外界展现了多项与ChatGPT有关的更新。 简要来...

  北京时间周二凌晨1点,自年初“文生视频模型”Sora后许久未给市场带来惊喜的OpenAI举行春季发布会。公司首席技术官米拉·穆拉蒂(Mira Murati)向外界展现了多项与ChatGPT有关的更新。简要来说,OpenAI的发布会主要干了两件事情:发布最新GPT-4o多模态大模型,相较于GPT-4 Trubo速度更快、价格也更便宜。

  第二件事情就是宣布,ChatGPT的免费用户也能用上最新发布的GPT-4o模型(更新前只能使用GPT-3.5),来进行数据分析、图像分析、互联网搜索、访问应用商店等操作。这也意味着GPT应用商店的开发者,融易新媒体消息,将面对海量的新增用户。

  当然,付费用户将会获得更高的消息限制(OpenAI说至少是5倍)。当免费用户用完消息数量后,ChatGPT将自动切换到GPT-3.5。

  另外,OpenAI将在未来1个月左右向Plus用户推出基于GPT-4o改进的语音体验,目前GPT-4o的API并不包含语音功能。苹果电脑用户将迎来一款为macOS设计的ChatGPT桌面应用,用户可以通过快捷键“拍摄”桌面并向ChatGP提问,OpenAI表示,Windows版本将在今年晚些时候推出。

  值得一提的是,米拉·穆拉蒂在一次直播活动中表示:“这是我们第一次在易用性方面真正向前迈出了一大步。”

图片来源:视频截图

  OpenAI由微软支持,目前投资者对其估值已超过800亿美元。该公司成立于2015年,目前正面临在生成式AI市场保持领先地位的压力,同时需要想方设法实现盈利,因为其在处理器和基础设施建设上投入了大量资金,以构建和训练其模型。

  实时口译、读取用户情绪等

  米拉·穆拉蒂强调了GPT-4o在实时语音和音频功能方面必要的安全性,称OpenAI将继续部署迭代,带来所有的功能。

  在演示中,OpenAI研究主管Mark Chen掏出手机打开ChatGPT,用语音模式Voice Mode现场演示,向GPT-4o支持的ChatGPT征询建议。GPT的声音听起来像一位美国女性,当它听到Chen过度呼气时,它似乎从中察觉到了他的紧张。然后说“Mark,你不是吸尘器”,告诉Chen要放松呼吸。如果有些大变化,用户可以中断GPT,GPT-4o的延迟通常应该不会超过两三秒。

图片来源:视频截图

  另一项演示中,OpenAI的后训练团队负责人Barret Zoph在白板上写了一个方程式3x+1=4,ChatGPT给他提示,引导他完成每一步解答,识别他的书写结果,帮助他解出了X的值。这个过程中,GPT充当了实时的数学老师。GPT能够识别数学符号,甚至是一个心形。

图片来源:视频截图

  应社交媒体X的用户请求,米拉·穆拉蒂现场对ChatGPT说起了意大利语。GPT则将她的话翻译成英语,转告Zoph和Chen。听完米拉·穆拉蒂说的意大利语,GPT翻译为英文告诉Chen:“Mark,她(米拉·穆拉蒂)想知道鲸鱼会不会说话,它们会告诉我们什么?”

图片来源:视频截图

  OpenAI称,GPT-4o还可以检测人的情绪。在演示中,Zoph将手机举到自己面前正对着脸,要求ChatGPT告诉他自己长什么样子。最初,GPT参考了他之前分享的一张照片,将他识别为“木质表面”。经过第二次尝试,GPT给出了更好的谜底。

  GPT注意到了Zoph脸上的微笑,对他说:“看起来你感觉非常快乐,喜笑颜开。”有评论称,这个演示显示,ChatGPT可以读取人类的情绪,但读取还有一点困难。

图片来源:视频截图

  OpenAI的高管表示,GPT-4o可以与代码库交互,并展示了它根据一些数据分析图表,根据看到的内容对一张全球气温图得出一些结论。OpenAI称,基于GPT-4o的ChatGPT文本和图像输入功能将于本周一上线,语音和视频选项将在未来几周内推出。

  据外媒援引PitchBook的数据,2023年,近700笔生成式AI交易共投入创纪录的291亿美元,较上一年增长逾260%。据预测,该市场将在未来十年内突破1万亿美元收入大关。业内一些人对于未经测试的新服务如此迅速地推向市场表示担忧,而学术界和伦理学家则对这项技术传播偏见的倾向感到忧虑。

  ChatGPT自2022年11月推出以来,便打破了当时最快增长消费类应用的历史记录,如今每周活跃用户已接近1亿。OpenAI表示,超过92%的《财富》500强企业都在使用该平台。

图片来源:CNBC报道截图

  在周一的活动上,穆拉蒂表示,OpenAI希望“消除科技中的一些神秘感”。她还说,“未来几周,我们将向所有人推出这些功能。”


免责声明
融易新媒体转载此文目的在于传递更多信息,不代表本网的观点和立场。文章内容仅供参考,不构成投资建议。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。
热门文章
日榜 周榜
1 超长期特别国债发行在即 或有货币政策配套支持

随着5月13日上午财政部一则通知发布,万亿超长期特别国债发行正式提上日程,市场对接下来...

2 重磅!类人速度超快语音响应!OpenAI推出新旗舰模型GPT-4o 图文音

北京时间周二凌晨1点,自年初“文生视频模型”Sora后许久未给市场带来惊喜的OpenAI举行春季发...

3 9.9万“开卖”!人形机器人也要价格战了?

半年前,人形 机器人 业内讨论最多的话题是“ 特斯拉 擎天柱(Optimus) 机器人 ”,要如何在...

4 5月13日晚间沪深上市公司重大事项公告最新快递

沪深两市多家上市公司5月13日晚间发布公司公告,以下为重要公告汇总: 【品大事】 南都物业...

5 GPT-4o正式亮相 多模态AI下游应用加速 机构扎堆调研这些概念股

从通用大模型到垂直大模型,从单模态向多模态融合,AI生成技术不断迭代,加速应用落地和商...

6 A股三大指数震荡整理 游戏板块大涨

A股三大指数今日震荡整理,截止收盘,沪指跌0.07%,收报3145.77点;深证成指跌0.05%,收报9668...

7 中泰证券:医疗器械板块把握创新驱动+业绩拐点投资机会

新冠基数、医疗反腐等影响下器械板块整体稳健。2023年 医疗器械 上市公司收入2,586.88亿元,同...

8 国联证券:拟购买民生证券100%股份 股票复牌

国联证券 5月14日公告,拟通过发行A股股份的方式向国联集团、沣泉峪等46名交易对方购买其合...

9 国泰君安:电建如火如荼 主、辅机需求接连爆发

国泰君安 5月14日研报表示,火电仍是电网的支撑性电源,兼具基荷调用和灵活性调峰的能力,...

10 中信证券:预计寿险股贝塔行情继续演绎概率较大

中信证券 指出,银保政策正在重塑市场环境,市场未反映集中度可能提高和银保价值率改善的...

1 超长期特别国债发行在即 或有货币政策配套支持

随着5月13日上午财政部一则通知发布,万亿超长期特别国债发行正式提上日程,市场对接下来...

2 重磅!类人速度超快语音响应!OpenAI推出新旗舰模型GPT-4o 图文音

北京时间周二凌晨1点,自年初“文生视频模型”Sora后许久未给市场带来惊喜的OpenAI举行春季发...

3 9.9万“开卖”!人形机器人也要价格战了?

半年前,人形 机器人 业内讨论最多的话题是“ 特斯拉 擎天柱(Optimus) 机器人 ”,要如何在...

4 5月13日晚间沪深上市公司重大事项公告最新快递

沪深两市多家上市公司5月13日晚间发布公司公告,以下为重要公告汇总: 【品大事】 南都物业...

5 GPT-4o正式亮相 多模态AI下游应用加速 机构扎堆调研这些概念股

从通用大模型到垂直大模型,从单模态向多模态融合,AI生成技术不断迭代,加速应用落地和商...

6 A股三大指数震荡整理 游戏板块大涨

A股三大指数今日震荡整理,截止收盘,沪指跌0.07%,收报3145.77点;深证成指跌0.05%,收报9668...

7 中泰证券:医疗器械板块把握创新驱动+业绩拐点投资机会

新冠基数、医疗反腐等影响下器械板块整体稳健。2023年 医疗器械 上市公司收入2,586.88亿元,同...

8 国联证券:拟购买民生证券100%股份 股票复牌

国联证券 5月14日公告,拟通过发行A股股份的方式向国联集团、沣泉峪等46名交易对方购买其合...

9 国泰君安:电建如火如荼 主、辅机需求接连爆发

国泰君安 5月14日研报表示,火电仍是电网的支撑性电源,兼具基荷调用和灵活性调峰的能力,...

10 中信证券:预计寿险股贝塔行情继续演绎概率较大

中信证券 指出,银保政策正在重塑市场环境,市场未反映集中度可能提高和银保价值率改善的...

备案号:鄂ICP备2022006215号 Copyright © 2002-2022 关于我们 网站地图