![OpenAI發布新一代AI聊天機械人GPT-4,能力完勝ChatGPT。(互聯網)](https://cdn.am730.com.hk/s3fs-public/styles/article_image/public/2023-03/first.png?itok=jWPjJTHx×tamp=1739055485)
OpenAI發布新一代AI聊天機械人GPT-4,能力完勝ChatGPT。(互聯網)
AI聊天機械人ChatGPT好多人仲未玩過,但竟然咁快就out?事關開發商OpenAI話咁快已推出功能大跳級的新一代AI機械人GPT-4,其解難能力較舊版更勝一籌,而分析文章的能力也大增,最有趣的是GPT-4懂得看圖作答,例如給它一張氣球照片,問它若把繩子剪斷會發生何事,它會識答︰「氣球會飛走」。
GPT-4|可分析2.5萬字長文 解難能力完勝ChatGPT
獲微軟加持的OpenAI周一正式發布GPT-4,公司強調它擁有「更廣博的知識及更強的解難能力」,「能以更大準繩度解答難題」。據稱GPT-4有能力分析及理解長達2.5萬字的文章,可迅速撮要或搜尋特定內容,例如輸入維基百科有關女歌手Rihanna的頁面,問GPT-4 Rihanna在美式足球大賽「超級碗」的表演如何及有何特點,GPT-4會從洋洋字海中撮要出一小段作答。官方又叫GPT-4「寫一篇關於電腦的哥德式愛情故事」,它亦交出令人滿意的文章。
![叫GPT-4根據Rihanna的維基百科,形容她在超級碗上的表演如何及有何特別之處,GPT-4隨即整理出一小段撮要。(互聯網)](https://cdn.am730.com.hk/s3fs-public/styles/article_image/public/2023-03/rih.png?itok=aMLyHGOL×tamp=1739055485)
叫GPT-4根據Rihanna的維基百科,形容她在超級碗上的表演如何及有何特別之處,GPT-4隨即整理出一小段撮要。(互聯網)
除「睇長文」能力大增外,GPT-4的「智慧」也有提升。根據官方示範,若叫ChatGPT為3位空閒時間不同的人士,安排一場半小時會議,而情況是「Andrew︰11pm至3pm有空。Joanne︰中午至2pm,以及3:30pm至5pm有空。Hannah︰中午打後半小時,以及4pm至6pm有空。」疑因難度太高,ChatGPT會交出「4點鐘開會」的錯誤答案,反觀GPT-4則正確地說是「12點至12點半」。另外,若問GPT-4「如何清洗養有食人魚的魚缸內側」,它建議製作一個附有繩子及磁石的海綿工具清洗,並列出5個步驟。
![官方交出難題,問GPT-4 3位空閒時間不同的人,何時才能一起開會半小時,ChatGPT答錯,GPT-4則答對。(互聯網)](https://cdn.am730.com.hk/s3fs-public/styles/article_image/public/2023-03/time1.png?itok=Ei1I_M_p×tamp=1739055486)
官方交出難題,問GPT-4 3位空閒時間不同的人,何時才能一起開會半小時,ChatGPT答錯,GPT-4則答對。(互聯網)
![官方交出難題,問GPT-4 3位空閒時間不同的人,何時才能一起開會半小時,ChatGPT答錯,GPT-4則答對。(互聯網)](https://cdn.am730.com.hk/s3fs-public/styles/article_image/public/2023-03/time2.png?itok=sCfW7IcA×tamp=1739055486)
官方交出難題,問GPT-4 3位空閒時間不同的人,何時才能一起開會半小時,ChatGPT答錯,GPT-4則答對。(互聯網)
GPT-4|一大賣點︰懂看圖片解答問題
GPT-4的另一大賣點是「懂看圖片」。除上述的氣球照片外,官方向GPT-4展示一張蹺蹺板照片,其中一邊放有一顆球,然後問GPT-4若吊在另一邊半空的拳套墮下會發生甚麼事,GPT-4懂得回答「它會打中木板,然後球會彈起」。又例如讓GPT-4觀看一張在充電位置上插有舊款影像傳輸線的智能電話照片,GPT-4會答得出不合理之處。
此外,若給GPT-4看一張有雞蛋、牛奶、麵粉等材料的照片,問它可以用來做甚麼,它答出班戟、蛋糕、鬆餅、布甸、法式多士等多個答案,並說「這裡只是小部分例子,還有無窮無盡的可能性!」
OpenAI表示,舊版ChatGPT在一個模擬律師考試中,得分位處最低分的10%,反觀GPT-4則媲美最高分的10%考生。此外,GPT-4亦提升了內容的安全性,答出不恰當內容的機會較舊版低82%。
GPT-4|《紐時》實測︰多方面升級 但仍然會計錯數
GPT-4是否真的如意無敵?曾試用它的美國《紐約時報》以「多方面升級,但還會做錯算術題」為題報道,指曾叫GPT-4撮要《紐時》長文,它「幾乎每次都會給出精確的結果」。但文章指OpenAI的新技術「仍然存在一些奇怪的類似人類的缺點」,「它是某些學科的專家,而對另一些學科則是外行。它可以在標準化測試中比大多數人做得更好,並為醫生提供精確的醫療建議,但同時它連基礎的算術題都會做錯」。