首页 > 资讯

GAN卷土重来:10亿参数的GigaGAN效果堪比扩散模型-天天快报

中国新闻网 2023-04-20 13:54:17


(资料图片仅供参考)

点蓝色字关注“机器学习算法工程师”

设为星标,干货直达!

自从 DALL·E 2 之后,在图像生成方面扩散模型替代GAN成了主流方向,比如开源的文生图模型stable diffusion也是基于diffusion架构的。近日, Adobe研究者在论文Scaling up GANs for Text-to-Image Synthesis提出了参数量为10亿(1B)的GAN模型:GigaGAN,其在文生图效果上接近扩散模型效果,而且推理速度更快,生成512x512大小图像只需要0.13s,生成16M像素图像只需要 3.66s。同时GigaGAN也支持latent空间的编辑功能,比如latent插值,风格混合,以及向量运算等。

GigaGAN改进了StyleGAN架构,采用两阶段训练策略:一个是64x64的图像生成器和一个512x512的图像超分2器,其图像生成器架构如下所示(这里也是采用CLIP text encoder来引入text condition):GigaGAN在 LAION2B-en和 COYO-700M数据集上训练,其在COCO数据集上的FID达到9.09,超过stable diffusion 1.5,推理速度比stable diffusion快20倍多(2.9s vs 0.13s):GigaGAN除了文生图能力,还可以实现可控的合成,比如风格混合,如下图所示:更多效果图和技术细节见论文https://arxiv.org/abs/2303.05511和网站https://mingukkang.github.io/GigaGAN/
上一篇 下一篇
热文推荐 更多

GAN卷土重来:10亿参数的GigaGAN效果堪比扩散模型-天天快报

2023-04-20

手机为什么不能放在枕头边?

2023-04-20

国家自然资源督察广州局约谈南宁清远两市-天天报道

2023-04-20

快播:酒店工程部经理工作总结报告-酒店工程部经理怎么作述职报告

2023-04-20

每日简讯:如何用珠子和安全别针制作微型印第安酋长头饰

2023-04-20

高选择性和高灵敏度的形态分析分子印迹荧光传感器_关于高选择性和高灵敏度的形态分析分子印迹荧光传感器简述

2023-04-20

国际古迹遗址日中国主场活动举办

2023-04-20

如何快速消除黑眼圈_快速消除黑眼圈的方法

2023-04-20

全球即时看!派发京东美团股票后 腾讯旗下投资主体应股东要求派发快手股票

2023-04-20

用信用评价机制压实餐饮企业责任

2023-04-20

巫师澄清:博格巴捐钱买米打井做善事 未给姆巴佩下咒 世界微速讯

2023-04-20

北风呼啸 寒风刺骨_寒风刺骨的意思

2023-04-20

一年为4万余家经营主体修复信用 武汉市新洲区开设信用修复“快速通道”|环球今亮点

2023-04-20

世界速讯:《无畏契约(瓦罗兰特)》爆头哥ScreaM击杀集锦介绍[多图]

2023-04-20

虎头局因18.9万标的案件成老赖,资金链紧张发展陷入困局-天天即时

2023-04-20

全球时讯:港股异动 | 鞍钢股份(00347)涨超4%创9个月新高 机构指下游钢铁需求复苏有望带动公司盈利水平回升

2023-04-19

车载电源行业市场多大?车载电源市场深度调研报告2023

2023-04-19

研究生马来西亚留学博士申请要求介绍 世界热消息

2023-04-19

塞尔达传说火焰魔法师怎么打-火焰魔法师攻略-世界速讯

2023-04-19

中国国家发改委:坚决遏制铁矿石价格不合理上涨-世界看点

2023-04-19