隨著人工智能繪圖技術 (AI image) 的科技愈趨成熟,各科技公司也爭相發展及推出自家品牌的產品給公眾試用,測試並收集數據以改進 AI 技術。
2024年10月10日,Google 宣佈開放旗下 「Gemini Imagen 3」給有 Google Gemini 的用戶免費試用 ; 而已付費用戶更能解鎖更多限制的功能。(官網: https://deepmind.google/technologies/imagen-3/ )
Google Imagen 3 在官網強調以下性能 :
~不論從簡易的塗鴉到複雜的傑作也應付自如
~注重細節,交付精準
~擁有更高品質的影像
~更好的文字處理
~減少及避免有害的內容生成,確保安全性
大家可以從「Google Gemini」或是「ImageFX」網頁中直接使用「Google Imagen 3」。
以下是「Google Gemini」的介面:
接下來,直接看看 AI 繪圖工具的表現吧~
小影比較了「Gemini Imagen 3」及近年很受歡迎的「Image Creator in Bing」兩個 AI 繪圖工具,用相同的咒語 (prompt) 會產出甚麼的圖案呢? 一起看看吧~
先看兩者如何表達光與泡泡的影像:
兩者能正確表達。Bing Image Creator 懂得用深色背景來特顯「光」和「泡泡」的夢幻效果。
試畫一下可口的七彩冰淇淋及小配件:
兩者都能正確顯示七彩冰淇淋及小配件。
Gemini Imagen 3 是直接呈現「蕾絲花邊」在杯上,
而 Bing Image Creator 則會自然融入成杯中的細節,而且配件比較多。
再來畫一下塔羅師的桌面:
兩者能正確表達。Gemini Imagen 3 能合理地呈現水晶和塔羅牌等物件的位置 ;
而 Bing Image Creator 的配件是非常之多,物件之間的排放比較密集。
試畫一下塔羅師的剪影:
......Gemini Imagen 3 對「剪影」的理解及呈現方式卻有點......柯南!? (苦笑) 而到測試的後期,Gemini Imagen 3更直接拒絕指令,說「人像生成」是 Gemini Advanced (付費用戶) 才能使用的功能......
而 Bing Image Creator 一如以往能完美地繪畫出浪漫而充滿美感的圖畫。
再來畫一下甜點店及日系水彩畫風餐牌:
兩者在前期也要稍作微調指令才能生成想要的圖片。
但由於Bing Image Creator 能每次同時生成多張不同款式的圖片,試錯空間相對地高得多。
試畫一下漢服店:
兩者皆能正確表達。Gemini Imagen 3 畫的漢服比較樸素,而店內的陳列方式亦合理。
雖然 Bing Image Creator 所畫的漢服比較華麗,但店內的則堆滿貨物,像是好看的貨倉一樣......
最後試畫一下塔羅魔法陣:
兩者能正確表達。但 Gemini Imagen 3 畫質確實有待加強🤡
而 Bing Image Creator 比較有氣勢。
題外話,小影從測試中得知 Gemini Imagen 3 能理解中文的咒語 (prompt)。 大家也可自行測試啊。
小影比較了「Gemini Imagen 3」及「Image Creator in Bing」兩個 AI 繪圖工具,小總結如下:
不知道大家更喜歡哪個 AI 繪圖程式呢? 你又會為這些新功能而升級嗎?
希望大家一起交流分享吧~
謝謝大家收看~
Hello, everyone~ ^_~
Welcome to "Shoppingageha" ~ Shadowlady's craft world!
Let's enjoy and create the beautiful craft & Tarot / Oracle cards in the world~ \^o^)/
Pixnet Blog:
http://shoppingageha520.pixnet.net/blog
Pinterest:
https://www.pinterest.com/shoppingageha/
Facebook:
https://www.facebook.com/shoppingageha/
Instagram:
https://www.instagram.com/shadowlady_craft/