近日,豆包实时语音大模型正式推出,并在豆包App全量开放。作为一款语音理解和生成一体化的模型,豆包实时语音大模型实现了端到端语音对话。相比传统级联模式,该模型在语音表现力、控制力、情绪承接上有显著提升,并具备低时延、对话中可随时打断等特性,语音表达接近真人水准。
业内人士表示,豆包实时语音大模型的发布,进一步丰富了字节AI生态,看好字节AI在国内的领先地位,未来发展潜力可期。同时,情感陪伴和AI玩具产品有望伴随语音类模型能力的强化,提升用户交互体验。
事件驱动 豆包实时语音大模型上线
1月20日,豆包实时语音大模型正式推出,并在豆包APP全量开放。模型实现了语音理解和生成一体化、端到端语音对话,主要面向中文语境和场景。根据豆包大模型团队公众号,经外部众测,模型整体满意度较GPT-4o有明显优势,语音语气自然度和情绪饱满度高于GPT-4o。
该模型可理解输入语言情绪、实时联网,融易新媒体消息,在输出时具备强大声音控制能力,且高度近似人类、有超低延迟、可随时打断。其真人级语音对话能力究竟表现在以下方面:拟人化的情感承接,能够理解用户的内容及情绪,并用恰当的语气做出回应;强大的声音控制和丰富的情感演绎能力,能够遵循丰富的复杂指令,配合不同的音色、情绪及状态输出,可以讲故事、讲方言和口音,甚至可以唱歌;智商与表现力之间的平衡,该模型的表现力高度接近真人,包括类人的语气词、停顿思考等,模型也有实时联网功能,使其能够根据问题,动态获取最新信息,对时效问题给到精准、及时的回应;丝滑的交互体验和超低延迟,实现在更低系统时延情况下的生成准确性、自然度,并且具有敏锐的语音打断与用户对话判停能力。
豆包团队围绕拟人度、有用性、情商、通话稳定性、对话流畅度等多个维度选取数十名外部测试者进行考评,豆包实时语音大模型整体满意度(以5分为满分)得分为4.36,GPT-4o为3.18,超过半数的测试者对豆包模型表现打出满分,且豆包模型在情绪理解和情感表达方面优势明显,尤其在“一听就是AI与否”的评测中遭认为AI的概率极低。
行业现状 实时语音大模型丰富人工智能生态
目前,字节运营约20款AI应用,在对话、助手、虚拟社交、图像、视频、智能体、办公、社区、音乐、编程、教育、电商、硬件等几乎全领域都有布局。根据AI产品榜数据,2024年12月,豆包MAU为7116万,环比增长18.64%。其海外版Cici的MAU达到1133万,位列第26位。虚拟角色APP猫箱MAU为688万,环比增速达50.18%。豆包实时语音大模型的推出有望进一步赋能AI产品,推动用户增长。豆包实时语音大模型可提供涵盖从个人助手到行业解决方案的服务,并覆盖家居、医疗、教育、金融等多个领域。
此外,AI情感陪伴能力提升,或为端侧AI落地提供新的思路。据OpenAICEO奥特曼指出,通用人工智能(AGI)是指AI能够像人一样熟练完成重要工作的阶段。OpenAI定义了AGI五个层级,依次为语言对话、逻辑推理、代理行动、辅助创新、组织工作。豆包实时语音大模型更加 “人性化”,模型模拟人类情感、意识与价值观,或意味着在通用人工智能(AGI)上取得了重要进展。
除字节跳动外,科大讯飞、百度、中国电信、趣丸科技等纷纷开发语音大模型,并在语音同传、方言识别、语音合成等领域取得了丰富成果。在当前及未来一段时间内,高质量语料,端到端架构,跨领域识别,以及情感个性化等仍是语音大模型厂商发力的重要方向。
根据IDC数据,2024年全球人工智能资本开支有望达2350亿美元,并预计2028年增长至6320亿美元,复合增速达29%。此外,生成式人工智能资本开支2024—2028年年均复合增长率有望达59%,显著高于其他人工智能技术的22%。
投资思路 关注端侧应用落地带来的投资机会
广发证券表示,豆包实时语音大模型的发布,进一步丰富了字节AI生态,看好字节AI在国内的领先地位,未来发展潜力可期。同时,情感陪伴和AI玩具产品有望伴随语音类模型能力的强化,提升用户交互体验。建议关注与字节在AI领域具有合作基础的公司,如易点天下、蓝色光标等;布局AI语音相关业务的公司,如盛天网络(音乐社交类平台“给麦”等)、昆仑万维(AI音乐产品Melodio和Mureka)等;布局AI玩具的公司,如上海电影、奥飞娱乐等;行业层面来看,AI大模型能力提升、成本边际下降,持续完善的AI基础设施有望更好地赋能AI游戏、AI影视、AI营销、AI情感陪伴、AI教育、AIagent等场景。
(原标题:中海基金姚晨曦:拥抱超万亿美元的“时代机遇”) 姚晨曦,复旦大学金融学专业...
2 AI交互水平再升级 关注端侧应用落地带来的投资机会(原标题:AI交互水平再升级 关注端侧应用落地带来的投资机会) 近日,豆包实时语音大模型...
3 2024年全国城镇新增就业1256万人(原标题:2024年全国城镇新增就业1256万人) 据人力资源和社会保障部21日消息 2024年,全国城...
4 央行开展2560亿元逆回购操作(原标题:央行开展2560亿元逆回购操作) 本报综合消息 为维护春节前流动性充裕,2025年1月...
5 14部门发文加强极端场景应急通信能力建设(原标题:14部门发文加强极端场景应急通信能力建设) 据新华社21日消息 工业和信息化部等...
(原标题:中海基金姚晨曦:拥抱超万亿美元的“时代机遇”) 姚晨曦,复旦大学金融学专业...
2 AI交互水平再升级 关注端侧应用落地带来的投资机会(原标题:AI交互水平再升级 关注端侧应用落地带来的投资机会) 近日,豆包实时语音大模型...
3 2024年全国城镇新增就业1256万人(原标题:2024年全国城镇新增就业1256万人) 据人力资源和社会保障部21日消息 2024年,全国城...
4 央行开展2560亿元逆回购操作(原标题:央行开展2560亿元逆回购操作) 本报综合消息 为维护春节前流动性充裕,2025年1月...
5 14部门发文加强极端场景应急通信能力建设(原标题:14部门发文加强极端场景应急通信能力建设) 据新华社21日消息 工业和信息化部等...
备案号:鄂ICP备2022006215号 Copyright © 2002-2024 关于我们 网站地图