2023-03-15 18:32:41

仲玩ChatGPT？拆解新版GPT-4！解難能力大增識睇圖識撮要超長文章(有片)

OpenAI發布新一代AI聊天機械人GPT-4，能力完勝ChatGPT。(互聯網)

AI聊天機械人ChatGPT好多人仲未玩過，但竟然咁快就out？事關開發商OpenAI話咁快已推出功能大跳級的新一代AI機械人GPT-4，其解難能力較舊版更勝一籌，而分析文章的能力也大增，最有趣的是GPT-4懂得看圖作答，例如給它一張氣球照片，問它若把繩子剪斷會發生何事，它會識答︰「氣球會飛走」。

GPT-4｜可分析2.5萬字長文解難能力完勝ChatGPT

獲微軟加持的OpenAI周一正式發布GPT-4，公司強調它擁有「更廣博的知識及更強的解難能力」，「能以更大準繩度解答難題」。據稱GPT-4有能力分析及理解長達2.5萬字的文章，可迅速撮要或搜尋特定內容，例如輸入維基百科有關女歌手Rihanna的頁面，問GPT-4 Rihanna在美式足球大賽「超級碗」的表演如何及有何特點，GPT-4會從洋洋字海中撮要出一小段作答。官方又叫GPT-4「寫一篇關於電腦的哥德式愛情故事」，它亦交出令人滿意的文章。

叫GPT-4根據Rihanna的維基百科，形容她在超級碗上的表演如何及有何特別之處，GPT-4隨即整理出一小段撮要。(互聯網)

除「睇長文」能力大增外，GPT-4的「智慧」也有提升。根據官方示範，若叫ChatGPT為3位空閒時間不同的人士，安排一場半小時會議，而情況是「Andrew︰11pm至3pm有空。Joanne︰中午至2pm，以及3:30pm至5pm有空。Hannah︰中午打後半小時，以及4pm至6pm有空。」疑因難度太高，ChatGPT會交出「4點鐘開會」的錯誤答案，反觀GPT-4則正確地說是「12點至12點半」。另外，若問GPT-4「如何清洗養有食人魚的魚缸內側」，它建議製作一個附有繩子及磁石的海綿工具清洗，並列出5個步驟。

官方交出難題，問GPT-4 3位空閒時間不同的人，何時才能一起開會半小時，ChatGPT答錯，GPT-4則答對。(互聯網)

GPT-4｜一大賣點︰懂看圖片解答問題

GPT-4的另一大賣點是「懂看圖片」。除上述的氣球照片外，官方向GPT-4展示一張蹺蹺板照片，其中一邊放有一顆球，然後問GPT-4若吊在另一邊半空的拳套墮下會發生甚麼事，GPT-4懂得回答「它會打中木板，然後球會彈起」。又例如讓GPT-4觀看一張在充電位置上插有舊款影像傳輸線的智能電話照片，GPT-4會答得出不合理之處。

此外，若給GPT-4看一張有雞蛋、牛奶、麵粉等材料的照片，問它可以用來做甚麼，它答出班戟、蛋糕、鬆餅、布甸、法式多士等多個答案，並說「這裡只是小部分例子，還有無窮無盡的可能性！」

OpenAI表示，舊版ChatGPT在一個模擬律師考試中，得分位處最低分的10%，反觀GPT-4則媲美最高分的10%考生。此外，GPT-4亦提升了內容的安全性，答出不恰當內容的機會較舊版低82%。

GPT-4｜《紐時》實測︰多方面升級但仍然會計錯數

GPT-4是否真的如意無敵？曾試用它的美國《紐約時報》以「多方面升級，但還會做錯算術題」為題報道，指曾叫GPT-4撮要《紐時》長文，它「幾乎每次都會給出精確的結果」。但文章指OpenAI的新技術「仍然存在一些奇怪的類似人類的缺點」，「它是某些學科的專家，而對另一些學科則是外行。它可以在標準化測試中比大多數人做得更好，並為醫生提供精確的醫療建議，但同時它連基礎的算術題都會做錯」。