主流生成模型一览表

图表内容

表2：主流生成模型一览表
模型
提出时间
模型描述
变分自动编码
2014年
基于变分下界约束得到的Encoder--Decoder
生成对抗网络(GAN)
2014年
基于对抗的Generator--Discr iminator模型对
基于流的生成模型
学习一个非线性双射转换(bijective transformation)
其将训练
2015年
(Flow-based models)
数据映射到另一个空间，在该空间上分布是可以因子化的，整个模型
扩散模型有两个过程，分别为扩散过程和逆扩散过程。在前向扩散阶
扩散模型(Diffusion
2015年
段对图像逐步施加噪声，直至图像被破环变成完全的高斯噪声，然后
Model)
在逆向阶段学习从高斯噪声还原为原始图像的过程。经过训练，该模
型可以应用这些去噪方法，从随机输入中合成新的“干净”数据。
一种基于自注意力机制的神经网络模型，最初用来完成不同语言之间
Transformer模型
2017年
的文本翻译任务，主体包含Encoder和Decoder部分，分别负责对源
语言文本进行编码和将编码信息转换为目标语言文本。
神经辐射场(Neural
它提出了一种从一组输入图像中优化连续5D神经辐射场的表示（任何
2020年
连续位置的体积密度和视角相关颜色)的方法，要解决的问题就是给
Radiance Field
NeRF)
定一些拍摄的图，如何生成新的视角下的图。
1.
CLIP (Constrastive
进行自然语言理解和计算机视觉分析；
2021年
2.使用已经标记好的“文字-图像”训练数据。一方面对文字进行模
Language-Image
型训练。一方面对另一个模型的训练，不断调整两个模型的内部参数，
Pre-Training)模型
使得模型分别输出的文字特征和图像特征值并确认匹配。
资料来源：腾讯研究院，
国信证券经济研究所整理

相关行业研究图表

相关行业研究报告

图表内容

其他行业调研报告