看不到原圖
1. 文本生成圖像(Text2image)
這是最近最火的類型。其中它們很多用的是diffusion model(擴散模型),有的AI模型還會加超分辨率重建模型,增強清晰度。
在使用這類模型時,你需要輸入prompt,也就是你對希望產生的圖像的描述。有的模型還支持初始圖片,AI的會基于你指定念枯的圖片開始創作。多數是僅支持英文的,不過也有支持中文的。
這里介紹幾個大家上手就能用的:

ERNIE-ViLG 文生圖

這是中文領域內比較不錯的文生圖模型。

文心大模型
​wenxin.baidu.com/moduleApi/ernieVilg
示例作品:

Midjourney:

非開源,需要你加入Discord小組給機器人發送prompt,機器人給你返回仔稿洞結果

Midjourney
​www.midjourney.com/home/
這里展示用midjourney畫出來的效果。對于結果,midjourney也提供超分辨率重建,提升圖片清晰度。

Dream by wombo :

可以說是最簡單的了,我不用介紹,大家點開就會用

https://app.wombo.art/
​敬穗app.wombo.art/
畫出來的效果

Stable Diffusion:

最近最火的繪畫AI之一。在線demo:

Stable Diffusion - a Hugging Face Space by stabilityai
​huggingface.co/spaces/stabilityai/stable-diffusion

繪畫效果

源碼:

GitHub - CompVis/stable-diffusion
​github.com/CompVis/stable-diffusion

Dalle-mini:

demo:

DALL·E mini by craiyon.com on Hugging Face
​huggingface.co/spaces/dalle-mini/dalle-mini

源碼:

https://github.com/borisdayma/dalle-mini
​github.com/borisdayma/dalle-mini
畫作展示:

適合畫場景

不太適合畫生物

Disco Diffusion

在之前這個回答里面有詳細的介紹。可以指定init_image。Disco Diffusion需要跑代碼,但不一定需要看懂,你知道改哪里就行了。

Disco Diffusion 體驗如何?你用它跑出了哪些圖?
267 贊同 · 29 評論回答

我用prompt「concept art, matte painting, in the rainy streets of a cyberpunk city at night, domination of a tall dark, robot wind sorcerer with glowing eyes and a cape, artstation, Greg Rutkowski」,可以畫出這樣的畫作

Stable Diffusion,Disco Diffusion, Dalle-mini之間的比較:

又來測評一個最近挺火的 # 人工智能 # #A…​www.zhihu.com/pin/1547932185491038208
​www.zhihu.com/pin/1547932185491038208

Clip-GEN

沒有demo,不過提供了源碼。

GitHub - HFAiLab/clip-gen: CLIP-GEN: Language-Free Training of a Text-to-Image Generator with CLIP
​github.com/HFAiLab/clip-gen

2. 風格遷移(style transfer)
風格遷移就是把圖片A按照圖片B的風格改畫,但圖片A的主體不變。

Fast Neural Style Transfer

https://huggingface.co/spaces/aravinds1811/neural-style-transfer
​huggingface.co/spaces/aravinds1811/neural-style-transfer
畫作參考:

Neural Style Transfer

這個名字沒起好,這個模型把前面講到的文本生成圖片和風格遷移融合在了一起。

Neural Style Transfer - a Hugging Face Space by NeuralStyleTransfer
​huggingface.co/spaces/NeuralStyleTransfer/neural-style-transfer

生成結果示例:

3. 超分辨率(superresolution )/ 圖片上采樣(Image Upsampling)
又稱圖片修復,大家可以看到很多老照片修復就是用超分辨率AI修復的。這里介紹一些

Real-ESRGAN

demo:

https://huggingface.co/spaces/akhaliq/Real-ESRGAN
​huggingface.co/spaces/akhaliq/Real-ESRGAN
代碼:

GitHub - xinntao/Real-ESRGAN: Real-ESRGAN aims at developing Practical Algorithms for General Image/Video Restoration.
​github.com/xinntao/Real-ESRGAN

效果測試

看起來修復動畫效果更好

SwinIR

demo地址:

https://huggingface.co/spaces/akhaliq/SwinIR
​huggingface.co/spaces/akhaliq/SwinIR
生成效果:

AI創作的思路
這里順便講講我使用AI創作的思路吧。

思路一:臨摹
如果僅僅給AI一個文字描述,輸出的風格可能不好控制,雖然可以在文本里加一些風格的描述詞,但是否感覺就是沒有藝術的感覺?不要緊,直接在文本中告訴AI:

你需要模仿哪個網站的作品。這里總結出了一些我個人感覺很好用的網站關鍵詞: on pixiv(日式動漫風), on artstation(科幻插畫風), on 500px(攝影大片風)
或者模仿哪個藝術家的作品。直接在文本中加入 by xxx就行了。
例如我用prompt「a castle in the rainforest, trending on artstation」,就能畫出這樣的效果

這個列表提供了一些藝術家的名字及其藝術風格

Disco Diffusion 70+ Artist Studies
​weirdwonderfulai.art/resources/disco-diffusion-70-plus-artist-studies/

這個網站可以輔助你生成prompt,包括風格,藝術家名字等等。

promptoMANIA:: prompt builder
​promptomania.com/prompt-builder/

思路二:AI根據描述作畫 -> 風格遷移-> 超分辨率
先給文本生成圖像的模型一個你想要的輸入,然后把輸出作為超分辨率模型的輸入。如果你要控制風格,你可以在文本里加一些風格的描述詞。

如果風格描述依然不能打造出你想要的風格,可以試試把生成的圖片輸入到風格遷移AI中,產生新的圖片。

如果你覺得生成的畫作太模糊,可以將輸出輸入到超分辨率模型。