國際
2024-02-22 18:42:28

國際分析|新AI Sora文本生成影片幾可亂真 荷李活玩完?

分享:
OpenAI早前公開Sora生成的「女子晚上於東京街頭漫步」的影片,效果逼真。(互聯網)

OpenAI早前公開Sora生成的「女子晚上於東京街頭漫步」的影片,效果逼真。(互聯網)

研發出AI聊天機械人ChatGPT的美國人工智能公司OpenAI,近日再受關注,其宣布推出能夠通過文本指令,生成出超逼真影片的人工智能模型Sora,震撼科技界。這一突破鞏固OpenAI在AI領域的領軍地位,但同時帶來衝擊電影行業崗位以及加劇「深度偽造」(Deepfake)風險的擔憂。

AI Sora|將文字描述化成高清影片

今次是OpenAI首次進軍影片生成領域。該公司稱Sora使用Transformer架構,可按文本指令,創建近似現實且富有想象力的場景,生成多種風格、不同畫幅、最長為一分鐘的高清影片。Sora並能根據靜態圖像生成影片,又或擴展現有影片或填補缺失。Sora橫空出世且發展潛力巨大,為影視產業開闢了新勢態,但亦有可能顛覆行業現況。荷李活去年發生63年來首次編劇和演員全行業罷工,原因是該行業的部分崗位,可能被AI取代,Sora的出現讓這威脅有「殺到埋身」之感。Sora面世後翌日,主營圖像處理、影片製作軟件的Adobe公司股價一度下跌逾7%。

OpenAI稱,Sora對語言有深刻理解,不僅明白用戶所給出的文本提示,還能了解所述事物在現實世界中的存在方式,「我們正在教導AI理解和模擬動態的現實世界,目標是訓練模型幫助人類,處理一些要在真實世界互動才能解決的問題。」

AI Sora|暫有技術不足 「主角食餅乾 餅乾卻完好」

暫時所見的Sora更像是預覽版,公眾尚未能全面掌握該模型優缺點。OpenAI表示,目前主要向一些設計師和電影製作人等特定人士提供Sora訪問權限,以獲取改善建議。該公司承認,目前Sora生成的影片,可能包含不合邏輯的圖像,以及出現左右調轉等錯誤,同時難以準確模擬複雜場景的物理原理和因果關係,例如片中人咬了餅乾一口,餅乾卻完好無缺。但隨著模型改進及運算力增強,一切當然都會有改善。

另一段Sora生成影片。(互聯網)

另一段Sora生成影片。(互聯網)

AI Sora|「三個C」阻Sora衝擊荷李活

一談到AI可以用文本生成影片,順理成章會想到可以用來製作動畫或拍戲。美國雜誌《Variety》的評論文章指,Sora發布後,「人們對於這種AI功能的預測愈趨瘋狂,畢竟與之前的同類工具相比,OpenAI似乎帶來巨大的飛躍」。但文章認為,Sora以及其他同類AI模型,對荷李活構成的衝擊仍有限,原因在「三個C」。一是Continuity連貫性,指現階段Sora所承諾的未來改進,不能確保片中的人物及場境「不走樣」,無法如真實電影或電視節目般一致及連貫,指Sora目前甚至無法準確理解現實世界的外觀或行為。

二是Controllability可控性,指Sora等模型未能讓製作人精準發揮創作力,以及控制成品,預料AI短期內在這方面無法超越傳統製作模式。三是版權Copyright,指由AI模型生成的影片恐有版權爭議,除了是影片是否受版權保護、版權誰屬之外,由於AI模型的訓練過程通常涉及使用大量數據,當中可能包含受版權保護的內容,故AI生成的素材,包括影片,可能存在侵犯版權的風險。不過儘管有這「三個C」,文本生成影片AI持續發展,或多或少會衝擊部分荷李活崗位。

adblk6
Sora生成影片。(互聯網) Sora生成影片。(互聯網) Sora生成影片。(互聯網)

AI Sora|為「深度偽造」推波助瀾

也有不少人擔心,Sora將為「深度偽造」技術推波助瀾。深度偽造是指deep learning(深度學習)和fake(偽造),利用深度學習和AI製作的虛假影像,將某人特徵或說話,移花接木至另一人身體或情境中,令人誤以為真。美國加州大學柏克萊分校資訊科技學院副院長法里德(Hany Farid)指,「在各種AI生成技術不斷發展下,沒理由認為文本生成影片技術不會急速改進,這令我們走向一個難分真與假的時代」,「當新聞、圖片、音頻、影片——任何事都可偽造時,世界就沒有甚麼是真實的。」文本成生影片技術一旦成熟,與AI模仿聲線技術結合運用,要無生中有一些人們從沒說過的話、從沒做過的事,就易如反掌。

AI Sora|「元數據」助辨清AI生成影片

針對深度偽造顧慮,OpenAI強調在正式向公眾推出產品前,將確保生成的影片包含依照C2PA(Coalition for Content Provenance and Authenticity、內容來源和真實性聯盟)標準的「元數據」(Metadata)。C2PA成員包括軟件、晶片、相機及社交平台巨企,如Adobe、微軟、英特爾、X、SONY、Nikon以及英國廣播公司(BBC)等。至於元數據是指「數據的數據」,即嵌入到檔案中的一些屬性資料,包括檔案標題、擁有者、被修改的時間和日期等。以影片為例,其元數據還包括拍攝時使用的相機型號、拍攝數據及時間地點等,這些數據有助了解影片真偽。

OpenAI亦稱,會同時推出檢測影片真偽的工具,並承諾在產品加入安全措施,包括由「錯誤信息、仇恨內容和偏見等領域的專家」評估模型的潛在危害及風險;核查並禁止輸入包含極端暴力、性內容、仇恨圖像及他人IP等文本等。儘管有著以上一系列措施,但OpenAI承認難以預測有關技術被濫用的一切可能方法。

科技界不斷出現顛覆式創新,如何在擁抱科技進步和確保社會安全取得平衡,愈來愈受關注。OpenAI稱將與各地政策制定者、教育工作者和藝術家合作,了解其擔憂。但在當下治理框架、管控措施未跟上的情況下,單靠企業本身,恐怕無法提供社會所需的安全感。

Netflix、Disney+、Viu、HMVOD 串流平台費用及畫質比較(am730製圖) Netflix、Disney+、Viu、HMVOD 串流平台費用及畫質比較(am730製圖) Netflix、Disney+、Viu、HMVOD 串流平台費用及畫質比較(am730製圖) Netflix、Disney+、Viu、HMVOD 串流平台費用及畫質比較(am730製圖) Netflix、Disney+、Viu、HMVOD 串流平台費用及畫質比較(am730製圖) Netflix、Disney+、Viu、HMVOD 串流平台費用及畫質比較(am730製圖) Netflix、Disney+、Viu、HMVOD 串流平台費用及畫質比較(am730製圖) Netflix、Disney+、Viu、HMVOD 串流平台費用及畫質比較(am730製圖) Netflix、Disney+、Viu、HMVOD 串流平台費用及畫質比較(am730製圖) Netflix、Disney+、Viu、HMVOD 串流平台費用及畫質比較(am730製圖) Netflix、Disney+、Viu、HMVOD 串流平台費用及畫質比較(am730製圖) Netflix、Disney+、Viu、HMVOD 串流平台費用及畫質比較(am730製圖) Netflix、Disney+、Viu、HMVOD 串流平台費用及畫質比較(am730製圖)

立即更新/下載AM730手機APP 體驗升級功能

全新會員積分獎賞計劃 打開App進入會員專區體驗升級功能