AI 繪畫原理

Al=縫合怪

提到AI作畫,很多批評者會提到

我們可能會假設當我們輸入“一只騎摩托車的大熊貓”

Al會在數據庫里

“摩托車”、“大熊貓的圖片檢索然后把他們拼在一起?

但實際上并非如此要了解A怎么生成圖片需要先理解

latent space-潛在空間

大家都有自己的身份證號碼

前6位代表地區、中間8位代表生日、后4位代表個人編號放到空間上如圖所示

這個空間就是[人類潛在桐畝空間

這個空間上相近的人游芹,可能就是生日、地區接近的人

人可以對應為這個空間的一個局磨森點

這個空間的一個點也對應一個人

如果在空間中我的附近找一個點

對應的人可能跟我非常相似沒準就是我失散多年的兄弟 hh

AI就是通過學習找到了一個

[圖片潛在空間.

每張圖片都可以對應到其中一個點相近的兩個點可能就是內容、風格相似的圖片

所以這個空間中有一個區域是“大熊貓區”一個區域是“摩托車區”提示語“一只騎摩托車的大熊貓” 會幫助AI找到圖片潛在空間]中某個可能位于“大熊貓區”、“摩托車區”交匯處的點

AI再把這個點

通過某種方式[生成]一張圖片

這種方式就是大名鼎鼎的

Diffusion

至于Al是怎么通過 prompt (提示語)找到[圖片潛在空間]中對應的點,再把這個點生成一張圖片