科技
2024-09-13 18:00:00

OpenAI最新o1 AI模型 複雜邏輯思考比GPT-4o優勝

分享:
OpenAI全新預覽版o1模型,付費的ChatGPT用戶可供試用。

OpenAI全新預覽版o1模型,付費的ChatGPT用戶可供試用。

OpenAI推出了一個名為o1的全新AI模型,在執行複雜的推理任務方面比之前的模型更有效,這一發布是在OpenAI面臨越來越多競爭而誕生。

OpenAI在官網及YouTube發布了一系列測試o1模型的短片。

OpenAI在官網及YouTube發布了一系列測試o1模型的短片。

邏輯思考能力更強

根據Engadget報道,o1經過訓練可以「在回應之前花更多時間思考問題,就像人一樣」。OpenAI稱模型學會了改進其思考過程,嘗試不同的策略,並識別自己的錯誤。預計這個新模型將被用於醫療保健研究人員對細胞序列數據進行註釋,以及物理學家生成數學公式和軟件開發人員。

目前的AI系統本質上是更高級的自動完成版本,通過統計生成回應,但並非真正思考問題。o1模型的設計目的是進行複雜的問題解決和邏輯思考,OpenAI表示它在物理、化學和生物等具有挑戰性的基準任務上的表現與博士生相似,並在數學和編程方面表現出色。例如當前旗艦模型GPT-4o在國際數學奧林匹克賽的資格考試中只正確解答了13%的問題,而o1則解答了83%。

adblk6
OpenAI o1以邏輯思考作為賣點,適合數學及編程。

OpenAI o1以邏輯思考作為賣點,適合數學及編程。

預覽版仍有漏洞

不過o1並不包括像網頁瀏覽或上傳文件和圖像等功能,與GPT-4o相比,它在處理提示時速度明顯較慢。而且o1仍未解決「幻覺」的問題——指AI模型編造信息的情況。OpenAI的首席研究官Bob McGrew接受The Verge訪問時承認幻覺問題未解決。

o1目前仍處於初期階段,OpenAI將其稱為預覽版,並僅向付費的ChatGPT用戶提供,每周提問次數亦有限制。此外OpenAI還推出了簡化版本o1-mini,在編程方面特別有用。

消息來源:Engadget