AI 繪畫原理

圖片:“我散開了”

Diffusion 的自白

AI:我太難了

從圖片潛在空間中的一個點得到一張高清圖片相當于給你一個身份證號讓你在全國14億人中找到這個人難度可想而知

GAN技術缺陷

對AI來說,過去大家熟知一些AI 圖像生成的項目主要使用了GAN技術(Generative AdversarialNetwork生成對抗網絡)

(在AI 繪畫原理(二)“這個AI我曾見過的”~這次有什么不一樣?中兩個例子都是通過GAN生成的)

但 GAN 的一大缺陷是不好加條件比如 AI只知道要生成人臉但沒法兒指定讓 AI 生成黑長直美女頭像

為了讓Al聽懂人話,Diffusion (擴散) 技術逐漸成為AI生成圖像兄陪梁領域的新寵

如何理解 Diffusion 技術?

Diffusion 來自一個物理現象

當我們把墨汁滴入水中,墨汁會均勻散開這個過程一般不能逆轉,那AI可以做到么?

(AI:我太難了)

圖片逐漸變成噪點的過程

當墨汁剛滴入水中時,我們能區分哪里是墨哪里是水

信息是非常集中的;

當墨汁擴散開來,墨和水就難分彼此了信息是分散的;

類比于圖片,這個亂跡墨汁擴散的過程就是圖片逐漸變成噪點的過程從信息集中的圖片變成信息分散、沒有信息的噪點圖很簡單逆轉這個過程就需要AI的加持了。

研究人員對圖片加噪點,讓圖片逐漸變成純噪點圖

再讓AI學習這個過程的逆過程也就是如何從一張噪點圖得到一張有信息的高清圖

跟GAN 相比Diffusion是可以加條件的

也就是我們指定AI生成圖片時羨運描述的那句話依靠這樣的學習

AI就實現了我們看到的一句話生成圖片的驚艷效果