图表内容
日29:通义大模型文生图效采
研究报告节选:
4.2.2 通用模型层:趋向于统一大模型的演化 通义 - 视觉大模型分为了底层统一算法架构、中层通用算法和上层产业应用。 通义 - 视觉大模型可以在电商行业实现图像搜索和万物识别等场景应用,并在文生图以及交通和自动驾驶领域发挥作用。 应用方面,通义大模型依靠其领先的跨模态能力,为下游任务提质增效。 在淘宝服饰类搜索场景中实现了以文搜图的跨模态搜索、在 AI 辅助审判中司法卷宗的事件抽取、文书分类等场景任务中实现 3~5% 的应用效果提升、在开放域人机对话领域通过建立初步具备“知识、情感以及个性、记忆”的中文开放域对话大模型实现了主动对话、广泛话题、紧跟热点等对话体验。