3月21日,比爾·蓋茨發表了一篇題為「AI時代已經開始」的博文。他提到,在過去的幾個月裡,人工智能在自然語言處理等領域實現了重大突破,像ChatGPT這樣的先進AI技術,已經展示出在工作、健康和教育等方面的巨大潛力。未來,AI將對我們的辦公室工作產生顯著影響,包括減輕工作負擔和提高生產力。蓋茨總結說,AI時代既充滿機遇,也充滿挑戰。我們需要確保AI的發展惠及全球人民,並制定相應的規則以降低潛在風險。然而,他並未提及AI圖像生成器這個話題。去年12月,我在這個專欄簡單介紹過DALL-E,今天讓我們來談談另一個相似的技術——Midjourney。
Midjourney是一個由舊金山的獨立研究實驗室開發的AI程式,它利用網路爬取的50億張圖像進行訓練。這個技術與DALL-E和Stable Diffusion類似,它們都可以從自然語言提示中生成圖像。2022年7月12日,Midjourney推出了試用版,用戶可以通過Discord機器人命令來創建作品。根據社交媒體數據,Midjourney在過去的幾個月中一直是熱門話題。海外每周約有15萬條社交媒體討論,差不多是ChatGPT的四分之一。然而,香港的關注度相對較低,每周僅有數百條討論。值得一提的是,Midjourney於3月16日推出了最新版本V5。將它與GPT-4結合,或許可以開創一個不再需要相機的攝影新時代。
隨著GPT-4和Midjourney V5的相繼亮相,用戶可以巧妙地創作出超越一般AI藝術的精彩照片。有趣的是,用戶只需將一些細節,如相機和鏡頭類型、照片風格和膠片類型等,輸入到ChatGPT(GPT-4)中,就可以生成包含高質素內容的Midjourney提示(prompt)。然而,由於大多數人並非專業攝影師,他們可能不清楚哪種相機或鏡頭最適合拍攝照片。這時,用戶可以向ChatGPT提出一個簡單的要求,如「為可愛的貓寫3個Midjourney提示」,然後將相應的輸出放入Midjourney V5中使用。
如果上述基本技巧已經讓您感到不可思議,那麼GPT-4的「上帝模式」將讓您更加震撼。在「上帝模式」中,用戶向ChatGPT(GPT-4)提供一系列指令,讓它了解Midjourney以及V5版本的新信息,以便為用戶創建出非常細緻的Midjourney V5提示,從而生成更逼真的照片。這一套指令包含10個步驟,篇幅相當長,有興趣的讀者可以留下電郵地址,我會寄一份給您。
我要提一下中國搜索巨頭百度推出的首款ChatGPT競品「文心一言」(Ernie)。這款產品在3月16日首次亮相就以失敗告終,導致百度在香港的股價當天下跌了10%。最新消息是原定於3月27日舉行的百度智能雲「文心一言」應用產品發布會已被臨時取消,改為面向首批邀約測試企業的閉門溝通會。究竟其中的原因何在,可能從我之前的「鴛鴦火鍋」小測試中找到一些線索。
總之,在這個充滿無限可能性的AI時代,GPT-4和Midjourney 5正共同編織出了一個令人驚歎的生成式AI新紀元,讓我們跨越次元,探索更多無法用言語形容的奇妙世界。
文:劉偉良(Eden) / 社交媒體商業應用公司天勤(Tocanan)首席執行官