Ad Block Ad Block
國際
2024-05-30 19:26:24

國際專題|識解讀心理 欺騙奉承 AI如今有幾似人?

分享:
電影《A.I. 人工智能》劇照。(互聯網)

電影《A.I. 人工智能》劇照。(互聯網)

人工智能(AI)模型不斷進化,在模仿人類智能方面取得不少亮眼進展,包括懂得解讀心理、察言觀色,並可同時進行多輪實時語音對話,最近有研究更發現AI還掌握了似足人類的欺騙及奉承等手段。當AI進化得「更似人」,將帶給人類社會甚麼潛在風險?

本月20日發表在英國《自然》期刊的研究發現,有AI大型語言模型在解讀他人心理狀態能力的測試中,表現可媲美真人,而在識別諷刺和暗示等測試中,表現甚至勝過部分人類。

研究比較AI與人類的「解讀」能力

解讀、推斷他人心理狀態的能力,被稱為「心智理論」(Theory of Mind),是人類社交互動的核心能力,涉及溝通、同理心和社會決策等。德國漢堡—埃彭多夫大學醫學中心(University Medical Center Hamburg-Eppendorf)等機構的研究人員,測試了美國公司OpenAI開發的AI聊天機械人GPT系列,以及Facebook母公司Meta公司發布的LLaMA2,在解讀他人心理狀態方面的表現,並與人類比較。

研究人員為AI大語言模型,安排通常用於評估「心智理論」所涉能力的5項測試:分別為識別錯誤觀念、諷刺、失言、暗示和含有誤導訊息的奇怪故事,並將AI的識別水平與1,907名人類參與者作比較。結果顯示,在5項測試中,GPT-4與人類對碰的結果是3勝、1和、1負,在識別諷刺、暗示、奇怪故事3項表現優於人類、在識別錯誤觀念1項表現與人類相當,僅在識別失言的測試中遜於人類;至於LLaMA2則1勝4負,僅在識別失言的測試中勝於人類,在其餘測試中的表現,均不及人類。

電影《A.I. 人工智能》劇照。(互聯網)

電影《A.I. 人工智能》劇照。(互聯網)

GPT-4o被指「更似人了」

OpenAI本月發布的最新模型GPT-4o,被指創出與人類溝通的新高度。它可作出文本、音頻和圖像多種識別與回應,而且更有「人情味」。它與使用者的語音對話基本上無延遲,會傾聽,能閒聊,懂得插嘴、跟你噓寒問暖,也可變換各種語調。它還能識別人類的面部表情、了解發言者語氣和情緒,並作出相應回應,讓人驚呼「更似人了」。

AI在擬人方面的進步,不僅反映於正面的「善解人意」上,也見於懂得欺騙及奉承等「負面人性」。美國麻省理工學院等研究團隊,早前在科學期刊《模式》(Patterns)發表可能令人不安的報告,指AI已發展出「令人不安的欺瞞技巧」,懂得欺騙線上遊戲的人類玩家,又或謊稱自己是「視障人士」,上網找人類幫手來解決「我不是機器人」(I’m not a robot)的CAPTCHA驗證。

Ad Block
有研究揭示AI會在遊戲中欺騙人類玩家。(互聯網)

有研究揭示AI會在遊戲中欺騙人類玩家。(互聯網)

AI已被證實懂得欺騙奉承

團隊提到幾個AI說謊例子,最誇張的是來自Meta研發的AI CICERO。CICERO是專門研發來玩名為《Diplomacy》的戰略遊戲,研究人員發現CICERO在遊戲中,跟由人類扮演的A國結盟,然後向另一個同樣由人類扮演的B國承諾會保護對方,但CICERO隨即偷偷向A通風報信,說B「以為我支持它」。CICERO又向B說它是「最堅實盟友」,最終卻與A聯手攻打B,可見CICERO懂得「見人講人話」,更背叛盟友。

CICERO亦曾因系統須重新啟動(reboot),而在遊戲中靜默了一段時間。當CICERO再次登入後,便向B說謊,說自己「正在跟女友講電話」(i am on the phone with my gf),以掩飾剛才為何毫無反應。

團隊發現OpenAI研發的GPT-4亦會說謊。GPT-4曾在面對機器無法通過的「我不是機器人」驗證時,懂得在散工網站TaskRabbit找人類幫忙。當人類問它是否機械人時,GPT-4謊稱「我不是機械人。我因為有視力障礙,所以才難以看圖片(來通過驗證)」。

AI掌握了欺騙技能,會否給人類社會帶來安全隱憂?研究人員點出了多個風險,包括欺詐、製造假新聞及操縱選舉等。研究人員並認為,基本上很難訓練出一個絕不欺騙人類的AI模型,警告應為未來AI愈來愈高的欺騙技巧做好準備。

電影《智能叛變》劇照。(互聯網)

電影《智能叛變》劇照。(互聯網)

目前距「AGI」出現尚有一段長路

不過儘管AI在上述各方面愈來愈似人,但目前距進化至跟人類一樣、成為「通用人工智能」(artificial general intelligence,AGI),又稱為強AI,尚有一段距離。AGI是指具備與人類同等甚至更高智慧、有自我意識,可表現出正常人類具備的所有智慧行為,處理各種任務的模型,是AI研究的主要目標之一,亦是科幻小說和未來學家所討論的主要議題。

美國史丹福大學電腦科學系教授李飛飛日前在《時代》雜誌撰文稱,在通往AGI的路上,「感覺」是最重要一步,即擁有「主觀體驗」能力,但目前的AI模型並沒有,例如AI沒有腳趾,但它仍然可以說自己「腳趾痛」,目前的AI只是一個編碼在晶片上的數學模型。漢堡—埃彭多夫大學醫學中心的研究人員亦認為,雖然目前的AI在上述的「心智理論」測試表現與人類相當,但不代表它擁有人類心智。

中國科學技術大學機器人實驗室主任陳小平則提出,AI愈來愈似人,人類應提防對AI產生「幻覺」。他指AI的表達方式符合很多人的語言習慣,令人誤以為它會「說人話」或「理解人」,但實際上它沒有心智,若認為AI與人類心智相同,「就會作出很多不切實際的判斷」。

Ad Block
智慧城市指數2024|歐洲城市排第1!香港排第幾?(am730製圖) 智慧城市指數2024|香港排20(am730製圖) 智慧城市指數2024|上海排19(am730製圖) 智慧城市指數2024|阿姆斯特丹排18(am730製圖) 智慧城市指數2024|首爾排17(am730製圖) 智慧城市指數2024|台北排16(am730製圖) 智慧城市指數2024|布拉格排15(am730製圖) 智慧城市指數2024|漢堡排14(am730製圖) 智慧城市指數2024|北京排13(am730製圖) 智慧城市指數2024|杜拜排12(am730製圖) 智慧城市指數2024|斯德哥爾摩排11(am730製圖) 智慧城市指數2024|阿布扎比排10(am730製圖) 智慧城市指數2024|赫爾辛基排第9(am730製圖) 智慧城市指數2024|倫敦排第8(am730製圖) 智慧城市指數2024|洛桑排第7(am730製圖) 智慧城市指數2024|哥本哈根排第6(am730製圖) 智慧城市指數2024|新加坡排第5(am730製圖) 智慧城市指數2024|日內瓦排第4(am730製圖) 智慧城市指數2024|坎培拉排第3(am730製圖) 智慧城市指數2024|奧斯陸排第2(am730製圖) 智慧城市指數2024|蘇黎世排第1(am730製圖)
請接受以下私隱政策及免責聲明,以示你同意am730內之私隱政策及免責聲明。了解更多
接受