使用圖片產生圖片 ( Image Guidance )
Leonardo.Ai 除了文字提示產生圖片,也提供 Image Guidance ( 運用圖片產生圖片 ) 的功能,只要上傳範例圖片,Leonardo.Ai 就會參考圖片進而生成圖片,這篇教學會介紹 Image Guidance 裡強大的圖片產生圖片功能以及各種模式。
- 2024 年中 Leonardo.Ai 進行大幅度更新,雖然增加許多新功能,但許多好用的功能卻消失了,如果要使用之前的版本,可點擊 Image Generation 介面右上方「Legacy Mode」切換成傳統模式。
- 因為 Leonardo.Ai 更新速度很快,有些畫面可能會有些許差異,但操作用法仍然相同。
快速導覽:
圖片產生圖片的功能
點擊 Image Guidance 頁籤,就能開啟圖片產生圖片的功能,如果啟用了圖片產生圖片的功能,在 Image Guidance 的頁籤旁邊會出現「ON」的提示。
Leonardo.Ai 提供許多種圖片產生圖片的功能,主要可以分成是「搭配 Prompt Magic」和「不搭配 Prompt Magic」兩種,功能說明如下:
- 搭配 Prompt Magic:使用 Image Prompt 模式,將圖片內容作為提示的一部分,類似 Midjourney 的 Blend 功能。
- 不搭配 Prompt Magic:使用十種圖片產生圖片模式,內建 ControlNet 控制網格功能。
例如下圖的介面,如果啟用了 Prompt Magic,產生圖片的模式就只能使用 Image Prompt。
如果是付費的使用者,可以同時使用四張圖片作為圖片產生圖片的素材。
Image Prompt 圖片提示
啟用了 Prompt Magic 之後就能使用「Image Prompt」功能,Image Prompt 可以將圖片作為提示使用,功能類似 Midjourney 的 Blend,設定參數 Strength 表示該張圖片提示的強度,範圍 0~1。
Image Prompt 不能和「PhotoReal」功能一起使用,付費的使用者可以搭配 Alchemy 使用 ( Alchemy 須設定 Prompt Magic 為 V2 )。
舉例來說,如果單純輸入「a cute dog
」,會產生一隻狗,但因為提示太少,所以產生的小狗不論是背景還是毛色都無法掌握。
如果上傳一張石膏像的圖片作為 image prompt。
產生的小狗就會是白色的毛,背景也會是白色的。
如果是付費的使用者,可以上傳其他的圖片輔助,舉例來說可以再上傳一張花朵的圖片,並調整圖片提示的強度。
最後產生的圖片就會變成白色的狗在綠色草地上。
Image to Image 圖片產生圖片
「Image to Image」功能可以提供「單張」圖片,搭配提示詞和設定產生相似的圖片,功能類似 Midjourney 的 Remix,設定參數 Strength 表示該張圖片提示的強度,範圍 0~1。
使用 Image to Image 功能時,產生的圖片與參考圖片需要「長寬比例相同或接近」,如果兩者差異太大,就可能產出無法控制的詭異的圖片,且無法使用兩張圖片進行 Image to Image。
下方的範例上傳了一張正在瑜珈運動的女生,Strength 設定 0.3,點擊圖片左下方的長寬比按鈕,可以設定產生圖片比例跟原始圖片相同。
輸入文字提示「a woman is doing yoga
」,Leonardo.Ai 就會在原本的圖片中進行加工,由於圖片權重 Strength 只設定 0.3,所以除了姿勢以外,不論穿著和長相都有些變化。
同理如果改成「a man is doing yoga」,參考圖片就會更換成一個正在做瑜珈的男性。
Pose to image 姿勢
「Pose to image 姿勢」是 ControlNet 的其中一種模型,會擷取參考圖片中主體的「姿勢」,再將文字提示詞套用這個姿勢,擷取的姿勢類似下圖,Strength 表示提示的強度,範圍 0~2。
使用 Pose to image 需要注意,Leonardo.Ai 判讀姿勢以「真人」為主,如果是插圖、動物...等非人的姿勢,在判讀上就會有差異,舉例來說,如果使用了插圖的瑜珈女生,產生的影像就會很詭異。
舉例來說,參考圖使用正在瑜珈的女性,,Strength 設定 0.3,根據提示「a man is doing yoga at school
」產生圖。
最後結果就會變成男生在學校裡面做瑜珈。
Edge to image 邊緣
「Edge to image 邊緣」是 ControlNet 的其中一種模型,會擷取參考圖中主體的「邊緣」,再將文字提示套用這個邊緣,擷取的邊緣類似下圖,Strength 表示提示的強度,範圍 0~2。
下面的範例上傳了一張用小畫家隨意畫出的圖,套用文字提示「a cute monster」後,就會使用怪獸的造型與顏色,填滿邊緣。
如果使用插圖的瑜珈女性作為參考圖片,根據提示「a woman is doing yoga, realistic, photography
」,就變成在做瑜珈的真人女生。
Depth to image 深度
「Depth to image 深度」是 ControlNet 的其中一種模型,屬於大面積色塊的模型,會擷取參考圖片中的「景深」,將文字提示套用在「清楚的景深」裡,擷取出來的景深類似下圖,會先產生黑白的影像,然後將文字提示套用在白色的部分,顏色越白套用越多,Strength 表示提示的強度,範圍 0~2。
下面的範例上傳了一張用小畫家隨意畫出的圖,套用文字提示後,就會發現怪獸主要都產生在白色的區域。
Pattern to image 圖案
「Pattern to image 圖案」是 ControlNet 的其中一種模型,會擷取參考圖片中的「圖案與花紋」,將文字提示套用在「圖案與花紋」裡,換句話說會使用文字提示中的內容,產生出來類似圖案和花色的東西,舉例來說如果提供蘋果的圖片,但是提示為山脈,則產生的山脈會按照蘋果的圖案進行排列,變成由山脈組成的蘋果,Strength 表示提示的強度,範圍 0~2。
這個做法的原理其實會先將圖片進行「二值化」為黑白影像,再根據黑白影像繪製對應的內容,如果圖片的顏色對比不夠明顯,產生的黑白影像就會不夠清楚,得到的結果也就不盡理想,所以要使用 Pattern to Image,盡可能要讓「主體與背景的顏色對比明顯」,甚至可以直接使用其他繪圖軟體產生黑白影像,效果就會更好,舉例來說,下圖黃色香蕉白色背景,因為黃色白色太接近,二值化的效果不好,產生的香蕉圖案就不明顯。
為了讓 Pattern to image 的效果更好,可以使用一些繪圖軟體增加圖片對比度,舉例來說可以使用 Google 雲端硬碟內建的「Google 繪圖」工具。
使用 Google 繪圖工具開啟香蕉圖片,調整香蕉的亮度和對比度,使其主體和背景的差異較為明顯 ( 也可調整顏色為灰階,效果更好 )。
完成後下載為 jpg 檔案。
回到 Leonardo.Ai,使用調整後的香蕉產生影像,就能得到更為漂亮的隱藏香蕉影像了。
Line Art
「Line Art」是 ControlNet 的其中一種模型,會提取圖片中的線稿,讓圖片更加精細和豐富,Strength 表示提示的強度,範圍 0~2,因為使用 Line Art 線稿會非常強調原本圖片的線條,因此如果強度設定比較高,提示詞反而會趨向增加圖片的「材質」。
舉例來說,使用一張蘋果的圖片,使用 Line Art 之後會完全保留蘋果的線條細節,搭配提示詞「beautiful clear crystal
」就會產生透明水晶的蘋果。
另外一個例子,如果使用的是人像圖片,也可以使用 Line Art 保留圖片的邊緣線條,搭配提示詞「sketch, pencil art
」就能做到手繪效果。
Normal Map
「Normal Map」是 ControlNet 的其中一種模型,會計算圖片中物體的表面法向量,進而計算物體表面的方向,透過表面的方向和光影還原原始圖片的立體感,Strength 表示提示的強度,範圍 0~2。
下圖使用一個女生的人像攝影素材照片,搭配提示詞「a cute girl at school , 2d cartoon
」,完成後就會按照光影片話,產生同樣光影位置的卡通角色。
QR Code to Image
「QR Code to Imagep」是 ControlNet 的其中一種模型,會根據提示詞,填滿或修飾 QRCode 原本的形狀,Strength 表示提示的強度,範圍 0~2,建議數值使用 1.5 以上,產生的 QRCode 才比較容易識別。
下圖使用一張 QRCode 圖片,搭配提示詞「some fruits
」,完成後就使用水果去組合成 QRCode。
使用同樣的方式,提示詞改成「brick maze, bird view, in the jungle
」,就會出現像是磚頭迷宮的 QRCode。
Sketch to Image
「Sketch to Image」是 ControlNet 的其中一種模型,會會將素描或手繪的影像,轉換成上色的影像,Strength 表示提示的強度,範圍 0~2。下圖使用一張簡單的速寫圖片,搭配提示詞「a hand holds a pen
」,完成後就會將速寫轉換成上色的圖片。
運用這種方法,也可以將小朋友的手繪圖,轉換成上色版本的影像。
Text Image Input
「Text Image Input」是 ControlNet 的其中一種模型,會會將「文字圖片」作為基底,運用提示去組合成文字圖片的樣子,Strength 表示提示的強度,範圍 0~2。下圖使用一張「讚」的黑白文字圖片,搭配提示詞「many fruits
」,完成後就會用水果去組合成文字。
小結
圖片產生圖片 ( Image to Image ) 是非常強大好用的功能,特別在於如果有看到喜歡的圖,但不知道文字提示該如何使用時,就能透過圖片來產生圖片,藉由圖片產生更多的創意。
意見回饋
如果有任何建議或問題,可傳送「意見表單」給我,謝謝~