本周AI要闻
◼事件1:Anthropic本周发布旗舰模型ClaudeOpus4.5,在代码生成、
系统调试、重构与多步骤工程任务中表现显著提升。内部测试中,Opus
4.5在工程考试中成绩超过所有人类候选者,被称为“接近顶尖工程师
水平”。同时其办公自动化与工具调用能力增强,适用于文档、表格与
研究类任务。新版本成本更低,面向企业与开发者的生产力场景竞争力
进一步提升。
◼事件2:DeepSeek于11月27日推出数学推理模型DeepSeekMath-V2,
并在HuggingFace全面开源。新模型采用“生成-验证-元验证”自我审
并在HuggingFace全面开源。新模型采用“生成-验证-元验证”自我审
查框架,可自动检查推理链条,大幅提升数学证明可靠性。官方测试显
示,其在IMO、CMO等顶级竞赛中达到金牌水平,在Putnam赛中取得
118/120高分。
◼事件3:小米发布并开源具身大模型MiMo-Embodied,这是业内首个同
时覆盖“具身智能+自动驾驶”双场景的跨域基座模型。模型统一支
持可供性推理、任务规划、环境感知等六大核心任务,并在29项测试
中刷新多项SOTA。小米表示,该模型将为人形机器人、家用服务机器
人与自动驾驶提供统一底座,推动具身智能在更广泛真实场景落地。
(信息来源:腾讯网、华尔街见闻、AIbase基地等)
周度观点
◼夸克眼镜搭载阿里千问,AI全链路协同深化
(1)本周全球AI产业继续保持高速演进势头,技术突破、应用扩张与产
业政策多线共振,行业整体呈现由“模型竞争”向“系统化建设”加速转
型的趋势。从基础模型到具身智能,从算力投资到消费级AI设备,AI正
进入跨领域协同深化的关键阶段,显示出长期产业升级的强劲动能。
(2)技术端的突破仍是推动行业向前的核心力量。Anthropic推出旗舰模
型ClaudeOpus4.5,在复杂工程推理、系统调试与多步骤编码任务中展现
接近顶尖工程师水平,标志AI在“工程智能”方向迈入实用化阶段。与之
同时,DeepSeek发布数学推理模型DeepSeekMath-V2,通过引入“自验证
式”推理框架,实现从“答案正确”向“推理链条可信”的质变,将大模
型从语言生成引向科学计算、数学研究等更高精度场景。此外,视频生成
领域同样取得实质性进展,腾讯混元开源HunyuanVideo1.5,以轻量级架
构实现高质量短视频生成,加速国内多模态生成技术的工程化落地,也为
AIGC在内容、营销、影视等产业释放更大空间。
(3)具身智能仍是产业关注度最高的方向之一。在企业层面,小米发布跨
具身智能与自动驾驶的基座模型MiMo-Embodied,实现从室内任务规划到
道路环境感知的统一智能框架,说明国内头部厂商正在加速探索具身智能
的“通用智能底座”。但在政策层面,国家发改委要关注具身智能泡沫,强
调对具身智能产业既要鼓励创新也要防范同质化竞争,指出当前企业数量
快速上升、资本大量涌入背景下需警惕低水平重复建设。这一信号体现了
政策对行业长期健康发展的重视,有利于资源向技术能力强、产业化路径
清晰的企业集中,推动我国具身智能产业从单纯的概念热度迈向体系化建
设。
(4)AI向消费电子和生活场景的渗透明显加快。阿里旗下夸克推出AI眼
镜并接入通义千问,多模态交互能力进一步强化,消费级AI硬件从“尝鲜
产品”走向“功能实用化”的趋势更加明显。结合近期国内外AI应用、AI
PC的持续迭代,AI正在重新定义个人计算设备的形态边界。同时,各类
智能体、视频生成工具、办公AI助手的运用,也表明AI正在深度嵌入生