【行业研究报告】信息技术-字节豆包事件点评:豆包产品快速迭代,有望推动推理算力需求持续提升

类型: 行业事件点评

机构: 上海证券

发表时间: 2025-01-22 00:00:00

更新时间: 2025-01-23 09:14:12

◼主要观点
字节豆包实时语音大模型正式上线,AI版图持续扩张。2025年1月
20日,豆包实时语音大模型正式上线,主要面向中文场景,是一款语
音理解和生成一体化的模型,实现了端到端语音对话。相比传统级联
模式,在语音表现力、控制力、情绪承接方面表现惊艳,并具备低时
模式,在语音表现力、控制力、情绪承接方面表现惊艳,并具备低时
延、对话中可随时打断等特性。字节AI版图持续扩张,据硅星人统
计,从2024年开始,字节在国内外推出包括豆包在内的20余款App,
从集成式的聊天助手,到图像、视频、音乐等效率工具,加速渗透到
教育、办公助手、开发平台、代码生成等行业。我们认为,本次豆包
实时语音大模型的推出,有助于提升字节旗下应用体验,及豆包终端
用户增长,将加速相关应用场景渗透。
依托于语音和语义联合建模,模型智商与情商双双在线。豆包团队研
发出了一套端到端框架,面向语音生成和理解进行统一建模,实现多
模态输入和输出效果,弥补了传统语音对话任务系统级联模式的缺
陷。在预训练(Pretrain)阶段,团队对各模态交织数据进行深入训
练,精准捕捉并高效压缩海量语音信息,通过Scaling,最大程度实现
语音与文本能力深度融合和能力涌现。在后训练阶段,团队使用了高
质量数据与RL算法,进一步提供模型高情商对话能力与安全性,并在
“智商”与“情商”之间寻求平衡。
豆包实时语音大模型整体满意度高于GPT-4o。根据豆包大模型团队
评测,团队围绕拟人度、有用性、情商、通话稳定性、对话流畅度等
多个维度进行考评。整体满意度(以5分为满分)方面,豆包实时语
音大模型评分为4.36,GPT-4o为3.18。其中,50%的测试者对豆包
实时语音大模型表现打出满分。此外,在模型优点评测中,豆包实时
语音大模型在情绪理解和情感表达方面优势明显。尤其是“一听就是
AI与否”评测中,超过30%的反馈表示GPT-4o“过于AI”,而豆包
实时语音大模型相应比例仅为2%以内。
◼投资建议
我们认为,字节豆包产品快速迭代,豆包生态愈发完善,在B端和C
端有望加速落地和推广,带来推理算力需求的持续提升。同时,字节
在AI的进一步发力和持续投入,有望拉动国内互联网大厂在算力端的
支出,国内算力军备竞赛刚刚开始,国产算力厂商迎来发展机遇,建
议关注:
AI芯片:海光信息、寒武纪、景嘉微、安博通(与江原合作)等
服务器:浪潮信息、中科曙光、神州数码、软通动力、华勤技术、紫
光股份等
交换机:锐捷网络、紫光股份等
光模块:光迅科技、华工科技等
IDC:润泽科技、光环新网、亚康股份、数据港、世纪互联等
液冷:英维克、申菱环境、高澜股份、飞荣达、同飞股份等
电源:欧陆通、泰嘉股份、麦格米特等
行业:计算机
日期:
shzqdatemark
Tel:021-53686158