(a)Object Detection - 2023年03月 - 行业研究数据

(a)Object Detection

研究报告节选:

 盘古视觉大模型:最大拥有30亿参数,兼顾判别与生成能力;在小样本学习性能领先。 融合了卷积网络和Transformer 架构,分开或按需结合达到更好效果;业界首创基于等级化语义聚集的对比度自监督学习,以减少样本选取过程中的噪声影响。 盘古多模态大模型:使用LOUPE 算法预训练所得的模型,在多项下游任务中表现出了更好的精度。 采用了双塔架构,利用不同的神经网络来完成不同模态的信息抽取,然后仅在最后一层做信息交互和融合,具有模型独立性强、训练效率高等优势。 实现方式为:分别抽取图像和文本特征,然后将一个批次的图像和文本特征送入判别器,使得配对的跨模态特征聚集在一起,而不配对跨模态特征被拉远,大数据充分迭代后,模型就能学会将图像和文本对齐到同一空间。此时,图像和文本的编码器可以独立用于各自下游任务,或协同用于跨模态理解类下游任务。
最后更新: 2023-03-08

相关行业研究图表


厂片行夕中士汽3
厂片行夕中士汽3 - 2023年03月 - 行业研究数据
角色名:字性视
角色名:字性视 - 2023年03月 - 行业研究数据
都分公司在A1GC领城的布局(戴至2023/3/5,块前)
都分公司在A1GC领城的布局(戴至2023/3/5,块前) - 2023年03月 - 行业研究数据
太极AngelPTM为预训练加速组件
太极AngelPTM为预训练加速组件 - 2023年03月 - 行业研究数据
飞浆部分重点产品
飞浆部分重点产品 - 2023年03月 - 行业研究数据
盘古困网络大模型应用于水泥生产系統,实现节能增产的目标
盘古困网络大模型应用于水泥生产系統,实现节能增产的目标 - 2023年03月 - 行业研究数据

相关行业研究报告


都分公司在A1GC领城的布局(戴至2023/3/5,块前) - 2023年03月 - 行业研究数据 MOSS具备代玛理解和生成能力 - 2023年03月 - 行业研究数据 断,有西行么名中行 - 2023年03月 - 行业研究数据
德邦证券 | 2023-03-07 | 40个图表

图表内容


(a)Object Detection
(b)Visual Grounding