
新闻动态
NEWS CENTER
NEWS CENTER
2023-09-26
前段时间和Leader聊AIGC时,说到了关于AI绘画原理的话题,一向只知道人工智能是降噪画图的原理,但是许多细节不是很清楚,挺好奇为什么输入一句话,人工智能就能了解,并且画出来一幅“可圈可点”的画作。
趁着周末爬了些材料,也找学术界朋友给推荐了一些研讨论文,大约理解了AI绘画是怎样工作的,分享给大家,共勉。
Ps:首要通过文言的方法论述AI绘画原理,手动制作了插图和流程图作为暗示,算法原理略去了许多细节,适用于泛AIGC爱好者阅读和学习了解。
整个AI绘画过程,我拆解成了五个中心问题,搞清楚这五个问题,AI绘画也就清晰了:
是不是看到这五个问题也有点懵,别着急,下面咱们先看下AI绘画的制作过程,就清楚这五个问题都是在问什么了。
由于再往前看几年,其实AI绘画的作用是这样的(12年吴恩达和团队用1.6万GPU和上万张数据,花了3天时间画出来的猫…):
咱们再看下现在AI绘画的作用(普通人输入一句话,几秒钟画出来的著作):
可以看出画质高清、精致,写实感很强,乃至可以比得上摄影师的著作了。
所以AI到底是怎样越来越优秀,依据一句话和几个参数就能画出这么好的著作呢?
先抛定论,AI绘画原理便是:
去除马赛克,就能看清了。
其实N多年前某些成人网就有了类似的技能,不过那个是1vs1复原,AI绘画实质是1vsN复原,中心便是把马赛克一点一点抹掉,终究“漏出”底图,完成所谓的“AI绘画”。
图画制作:Designed byLiunn
咱们先看下,AI绘画的运用场景,一切的软件或模型,基本上第一步都是让用户输入绘画关键词,也便是Prompt。
以Diffusion Model的暗示如下,咱们把最右边的当做正常图片,从右到左是不断模糊的,直至最终看不出来是什么,这个过程便是算法的叠加噪声。
你可以了解为不断对图片进行马赛克处理,这便是最著名的“分散(Diffusion)”过程。
打个比方,咱们把这个过程想象成你在发朋友圈照片时,想屏蔽一些信息,所以运用“编辑”功用不断地对某些区域进行涂改,直到这个区域看不清原本的内容了。
并且每一次的噪声迭代其实仅仅和上一次的状态相关联,所以这实质上也是一个马尔科夫链模型(简单了解为随机模型,细节可以移步google)。