基於DALL-E3的微軟Bing Image Creator,表現一點都不遜於其他生成式

生成式AI呈現爆發性成長後,讓大部分人為之驚豔的,非AI生圖不可了。

最早出名的是Midjourney,Midjourney是一個由位於美國加州舊金山的同名研究實驗室開發之人工智慧程式,可根據文字生成圖像。目前已經迭代至V5版本,使用者眾多。早期的Midjourney使用者需要輸入複雜的指令 (Prompt)與參數,才能產出令人滿意的圖片。(包括解析度 8K, ar 16:9…)  

而且Midjourney只認英文指令Prompt,因此對許多讀者而言,如果要使用,還是需要先翻譯成英文。後來,為了解決非英文指令的困擾,由 Spellbrush 與 Midjourney 所共同設計開發的Niji-journey跟著普及,尤其擅長生成日系動漫風格的圖片也廣受亞洲消費者喜愛。

Rick@Midjourney創作
Rick@Niji-journey創作

如果說MJ與Niji是適合一般行銷人員使用的AI生圖工具,那Stable Diffusion可以說是趨近專業動畫師等級的AI生圖工具。因為用到大量的模型與算力,早期沒有強大的GPU提供算力根本無法簡單使用。

Stable Diffusion模型支援通過使用提示詞來產生新的圖像,描述要包含或省略的元素,以及重新繪製現有的圖像,其中包含提示詞中描述的新元素,通過使用模型的擴散去噪機制(diffusion-denoising mechanism)。此外,該模型還允許通過提示詞在現有的圖中進行內補繪製和外補繪製來部分更改,當與支援這種功能的使用者介面使用時,其中存在許多不同的開源軟體。[from 維基百科]

後來透過WebUI方式,不需要配置高端的GPU電腦也能相對快速的生成圖片,但相對更複雜的參數,也是大部分使用者不易上手的原因,而且每算一張圖的時間相對較長,對於急於看到自己的創作的人相對會不具備耐心。

但其高度擬真的產圖結果,往往令人忍不住發出ㄧ聲「WOW!!」

Rick@StableDiffusion
Rick@StableDiffusion創作

微軟在購併Open AI後,不斷整合ChatGPT以提高其在AI方面的解決方案,除了Office支援ChatGPT大幅的改善文書處理效率外,另一個值得關注的,當然是推出如MJ般的以文生圖工具Bing Image Creator,這是基於Opne DALL-E的生圖工具,尤其在2023年9月底release基於DALL-E3的Image Creator,表現更是令人讚嘆。

透過簡單易操作的介面,只要輸入一段文字,透過其背後的模型,就可以產出相對令人滿意的圖片。

以下是讀者透過簡單的文字指令,不需輸入太多專業咒語,就能快速產生很不錯的結果。

Bing Image Creator 介面

下圖是筆者輸入的簡單指令而產出的圖,“英俊少年,韓風美男,穿著修身背心,白色絲綢質感緊身襯衫,手握麥克風,雙眼深情凝視,在舞台上唱歌”等待時間也不超過一分鐘,應該可以讓大部分簡單有產圖需求的人使用。重點在於產出的神韻與動作,著實出乎我意料之外的驚艷!!

Rick@Bing Image Creator 創作

AI生成工具的使用,筆者認為可以分為兩個流派,一個為純藝術創作,一個為商業運用。

  1. 純藝術或文學創作流派

    • 目的:這類工具的主要目標是探索AI在藝術和文學領域的創新潛力,並促進原創性和深度的表現。

    • 特點

      • 深度創作:這些工具更加強調原創性和藝術價值,生成的內容往往更具深度和藝術感。
      • 人工智慧與人類協同:藝術家和作家可以利用這些工具擴展他們的創作邊界,將AI視為一個協助工具或創作夥伴。
      • 實驗性質:這類工具常常更為實驗性,探索AI生成內容的新方法和可能性。
  2. 快速商業運用流派

    • 目的:這類工具主要針對商業領域,如行銷、廣告、客戶服務等,旨在提高效率和產出。

    • 特點

      • 高效率:這些工具的主要目標是快速生成內容,以滿足業務需求。
      • 模板和自定義:為了快速生成特定的內容,這些工具通常提供模板和自定義選項。
      • 多語言和本地化:商業運用的工具往往需要支援多語言和本地化內容,以適應全球市場。
      • 數據驅動:這些工具可能還包括分析和優化功能,以根據用戶反饋和行為數據調整內容。
沒有好壞,但不可否認的,生成式AI的普及,讓每個人的創作門檻大幅降低,也節省了創作的效率。

文末,送福利來了,一樣是Bing Image Creator的創作,妥妥的氣質美女在咖啡廳。

Rick@AI
Rick@AI