主流生成模型一览表-小牛行研(hangyan.co)-AI驱动的行业研究数据服务

主流生成模型一览表

研究报告节选:

扩散模型有两个过程,分别为扩散过程和逆扩散过程。在前向扩散阶段对图像逐步施加噪声,直至图像被破环变成完全的高斯噪声,然后在逆向阶段学习从高斯噪声还原为原始图像的过程。经过训练,该模型可以应用这些去噪方法,从随机输入中合成新的“干净”数据。
最后更新: 2023-03-07

相关行业研究图表


A股传媒板块上市公司分布
A股传媒板块上市公司分布-小牛行研(hangyan.co)-AI驱动的行业研究数据服务
训练大模型“预训练+精调”模式
训练大模型“预训练+精调”模式-小牛行研(hangyan.co)-AI驱动的行业研究数据服务
Quiz|et推出A|教师Q-Chat
Quiz|et推出A|教师Q-Chat-小牛行研(hangyan.co)-AI驱动的行业研究数据服务
重点公司估值表
重点公司估值表-小牛行研(hangyan.co)-AI驱动的行业研究数据服务
年度营业收入(亿元)及增速
年度营业收入(亿元)及增速-小牛行研(hangyan.co)-AI驱动的行业研究数据服务
季度归母净利润(亿元)及增速
季度归母净利润(亿元)及增速-小牛行研(hangyan.co)-AI驱动的行业研究数据服务

图表内容


表2:主流生成模型一览表
模型
提出时间
模型描述
变分自动编码
2014年
基于变分下界约束得到的Encoder--Decoder
生成对抗网络(GAN)
2014年
基于对抗的Generator--Discr iminator模型对
基于流的生成模型
学习一个非线性双射转换(bijective transformation)
其将训练
2015年
(Flow-based models)
数据映射到另一个空间,在该空间上分布是可以因子化的,整个模型
扩散模型有两个过程,分别为扩散过程和逆扩散过程。在前向扩散阶
扩散模型(Diffusion
2015年
段对图像逐步施加噪声,直至图像被破环变成完全的高斯噪声,然后
Model)
在逆向阶段学习从高斯噪声还原为原始图像的过程。经过训练,该模
型可以应用这些去噪方法,从随机输入中合成新的“干净”数据。
一种基于自注意力机制的神经网络模型,最初用来完成不同语言之间
Transformer模型
2017年
的文本翻译任务,主体包含Encoder和Decoder部分,分别负责对源
语言文本进行编码和将编码信息转换为目标语言文本。
神经辐射场(Neural
它提出了一种从一组输入图像中优化连续5D神经辐射场的表示(任何
2020年
连续位置的体积密度和视角相关颜色)的方法,要解决的问题就是给
Radiance Field
NeRF)
定一些拍摄的图,如何生成新的视角下的图。
1.
CLIP (Constrastive
进行自然语言理解和计算机视觉分析;
2021年
2.使用已经标记好的“文字-图像”训练数据。一方面对文字进行模
Language-Image
型训练。一方面对另一个模型的训练,不断调整两个模型的内部参数,
Pre-Training)模型
使得模型分别输出的文字特征和图像特征值并确认匹配。
资料来源:腾讯研究院,
国信证券经济研究所整理