2024-02-22 18:42:28

國際分析｜新AI Sora文本生成影片幾可亂真荷李活玩完？

OpenAI早前公開Sora生成的「女子晚上於東京街頭漫步」的影片，效果逼真。(互聯網)

研發出AI聊天機械人ChatGPT的美國人工智能公司OpenAI，近日再受關注，其宣布推出能夠通過文本指令，生成出超逼真影片的人工智能模型Sora，震撼科技界。這一突破鞏固OpenAI在AI領域的領軍地位，但同時帶來衝擊電影行業崗位以及加劇「深度偽造」(Deepfake)風險的擔憂。

AI Sora｜將文字描述化成高清影片

今次是OpenAI首次進軍影片生成領域。該公司稱Sora使用Transformer架構，可按文本指令，創建近似現實且富有想象力的場景，生成多種風格、不同畫幅、最長為一分鐘的高清影片。Sora並能根據靜態圖像生成影片，又或擴展現有影片或填補缺失。Sora橫空出世且發展潛力巨大，為影視產業開闢了新勢態，但亦有可能顛覆行業現況。荷李活去年發生63年來首次編劇和演員全行業罷工，原因是該行業的部分崗位，可能被AI取代，Sora的出現讓這威脅有「殺到埋身」之感。Sora面世後翌日，主營圖像處理、影片製作軟件的Adobe公司股價一度下跌逾7%。

OpenAI稱，Sora對語言有深刻理解，不僅明白用戶所給出的文本提示，還能了解所述事物在現實世界中的存在方式，「我們正在教導AI理解和模擬動態的現實世界，目標是訓練模型幫助人類，處理一些要在真實世界互動才能解決的問題。」

AI Sora｜暫有技術不足「主角食餅乾餅乾卻完好」

暫時所見的Sora更像是預覽版，公眾尚未能全面掌握該模型優缺點。OpenAI表示，目前主要向一些設計師和電影製作人等特定人士提供Sora訪問權限，以獲取改善建議。該公司承認，目前Sora生成的影片，可能包含不合邏輯的圖像，以及出現左右調轉等錯誤，同時難以準確模擬複雜場景的物理原理和因果關係，例如片中人咬了餅乾一口，餅乾卻完好無缺。但隨著模型改進及運算力增強，一切當然都會有改善。

AI Sora｜「三個C」阻Sora衝擊荷李活

一談到AI可以用文本生成影片，順理成章會想到可以用來製作動畫或拍戲。美國雜誌《Variety》的評論文章指，Sora發布後，「人們對於這種AI功能的預測愈趨瘋狂，畢竟與之前的同類工具相比，OpenAI似乎帶來巨大的飛躍」。但文章認為，Sora以及其他同類AI模型，對荷李活構成的衝擊仍有限，原因在「三個C」。一是Continuity連貫性，指現階段Sora所承諾的未來改進，不能確保片中的人物及場境「不走樣」，無法如真實電影或電視節目般一致及連貫，指Sora目前甚至無法準確理解現實世界的外觀或行為。

二是Controllability可控性，指Sora等模型未能讓製作人精準發揮創作力，以及控制成品，預料AI短期內在這方面無法超越傳統製作模式。三是版權Copyright，指由AI模型生成的影片恐有版權爭議，除了是影片是否受版權保護、版權誰屬之外，由於AI模型的訓練過程通常涉及使用大量數據，當中可能包含受版權保護的內容，故AI生成的素材，包括影片，可能存在侵犯版權的風險。不過儘管有這「三個C」，文本生成影片AI持續發展，或多或少會衝擊部分荷李活崗位。

AI Sora｜為「深度偽造」推波助瀾

也有不少人擔心，Sora將為「深度偽造」技術推波助瀾。深度偽造是指deep learning(深度學習)和fake(偽造)，利用深度學習和AI製作的虛假影像，將某人特徵或說話，移花接木至另一人身體或情境中，令人誤以為真。美國加州大學柏克萊分校資訊科技學院副院長法里德(Hany Farid)指，「在各種AI生成技術不斷發展下，沒理由認為文本生成影片技術不會急速改進，這令我們走向一個難分真與假的時代」，「當新聞、圖片、音頻、影片——任何事都可偽造時，世界就沒有甚麼是真實的。」文本成生影片技術一旦成熟，與AI模仿聲線技術結合運用，要無生中有一些人們從沒說過的話、從沒做過的事，就易如反掌。

AI Sora｜「元數據」助辨清AI生成影片

針對深度偽造顧慮，OpenAI強調在正式向公眾推出產品前，將確保生成的影片包含依照C2PA(Coalition for Content Provenance and Authenticity、內容來源和真實性聯盟)標準的「元數據」(Metadata)。C2PA成員包括軟件、晶片、相機及社交平台巨企，如Adobe、微軟、英特爾、X、SONY、Nikon以及英國廣播公司(BBC)等。至於元數據是指「數據的數據」，即嵌入到檔案中的一些屬性資料，包括檔案標題、擁有者、被修改的時間和日期等。以影片為例，其元數據還包括拍攝時使用的相機型號、拍攝數據及時間地點等，這些數據有助了解影片真偽。

OpenAI亦稱，會同時推出檢測影片真偽的工具，並承諾在產品加入安全措施，包括由「錯誤信息、仇恨內容和偏見等領域的專家」評估模型的潛在危害及風險；核查並禁止輸入包含極端暴力、性內容、仇恨圖像及他人IP等文本等。儘管有著以上一系列措施，但OpenAI承認難以預測有關技術被濫用的一切可能方法。

科技界不斷出現顛覆式創新，如何在擁抱科技進步和確保社會安全取得平衡，愈來愈受關注。OpenAI稱將與各地政策制定者、教育工作者和藝術家合作，了解其擔憂。但在當下治理框架、管控措施未跟上的情況下，單靠企業本身，恐怕無法提供社會所需的安全感。