当前位置：首页 >新闻动态 >快手号出售

AI绘画实质是1vsN复原

2023-09-26

前段时间和Leader聊AIGC时，说到了关于AI绘画原理的话题，一向只知道人工智能是降噪画图的原理，但是许多细节不是很清楚，挺好奇为什么输入一句话，人工智能就能了解，并且画出来一幅“可圈可点”的画作。

趁着周末爬了些材料，也找学术界朋友给推荐了一些研讨论文，大约理解了AI绘画是怎样工作的，分享给大家，共勉。

Ps：首要通过文言的方法论述AI绘画原理，手动制作了插图和流程图作为暗示，算法原理略去了许多细节，适用于泛AIGC爱好者阅读和学习了解。

整个AI绘画过程，我拆解成了五个中心问题，搞清楚这五个问题，AI绘画也就清晰了：

是不是看到这五个问题也有点懵，别着急，下面咱们先看下AI绘画的制作过程，就清楚这五个问题都是在问什么了。

由于再往前看几年，其实AI绘画的作用是这样的（12年吴恩达和团队用1.6万GPU和上万张数据，花了3天时间画出来的猫…）：

咱们再看下现在AI绘画的作用（普通人输入一句话，几秒钟画出来的著作）：

可以看出画质高清、精致，写实感很强，乃至可以比得上摄影师的著作了。

所以AI到底是怎样越来越优秀，依据一句话和几个参数就能画出这么好的著作呢？

先抛定论，AI绘画原理便是：

去除马赛克，就能看清了。

其实N多年前某些成人网就有了类似的技能，不过那个是1vs1复原，AI绘画实质是1vsN复原，中心便是把马赛克一点一点抹掉，终究“漏出”底图，完成所谓的“AI绘画”。

图画制作：Designed byLiunn

咱们先看下，AI绘画的运用场景，一切的软件或模型，基本上第一步都是让用户输入绘画关键词，也便是Prompt。

以Diffusion Model的暗示如下，咱们把最右边的当做正常图片，从右到左是不断模糊的，直至最终看不出来是什么，这个过程便是算法的叠加噪声。

你可以了解为不断对图片进行马赛克处理，这便是最著名的“分散（Diffusion）”过程。

打个比方，咱们把这个过程想象成你在发朋友圈照片时，想屏蔽一些信息，所以运用“编辑”功用不断地对某些区域进行涂改，直到这个区域看不清原本的内容了。

并且每一次的噪声迭代其实仅仅和上一次的状态相关联，所以这实质上也是一个马尔科夫链模型（简单了解为随机模型，细节可以移步google）。