
阿里巴巴推新模型「通義千問QwQ-32B」,聲稱在數學及通用能力上能媲美DeepSeek-R1。(路透社)
阿里巴巴(港交所:9988)高開逾6%,截至發稿,漲6.6%,報138港元,成交額97.69億港元。消息面上,阿里巴巴發布並開源全新的推理模型「通義千問QwQ-32B」,該模型在數學、代碼及通用能力上整體性能表現據稱可媲美DeepSeek-R1,並且降低了部署成本,在消費級顯卡上也能實現本地部署。自2023年以來,阿里巴巴的通義團隊已開源超過200款模型。

阿里巴巴推新模型「通義千問QwQ-32B」,聲稱在數學及通用能力上能媲美DeepSeek-R1。(網上圖片)
某些測試超越DeepSeek-R1
根據官方介紹,「通義千問QwQ-32B」是一款擁有320億參數的模型,在性能上不僅能夠媲美擁有6,710億參數的DeepSeek-R1(其中370億被激活),更在某些測試中超越了對方。
阿里Qwen團隊表示,這一成果突顯了將強化學習應用於經過大規模預訓練的強大基礎模型的有效性,希望以此證明強大的基礎模型疊加大規模強化學習也許是一條通往通用人工智能的可行之路。