
阿里巴巴發布「混合」AI模型Qwen3。
阿里巴巴周一發布了最新AI模型「通義千問」Qwen3,聲稱可與Google和OpenAI提供的DeepSeek-R1、o1、 o3-mini、Grok-3及Gemini-2.5-Pro等模型匹敵,而且香港可用。大多數型號都可以或準備於AI開發平台Hugging Face和GitHub的開放許可下載,大小範圍從6億個參數到2350億個參數不等,Qwen等中國原創模式系列的崛起加大了OpenAI等美國實驗室提供更強大人工智能技術的壓力。
混合模型更快更準
阿里巴巴表示,Qwen3 模型是「混合」模型,整合了思維和非思維模式,為用戶提供了控制思維預算的靈活性,可以花時間推理複雜的問題或快速回答更簡單的請求。有些模型也採用專家混合(MoE)架構,可以提高回答查詢的運算效率。MoE將任務分解為子任務,並將它們委託給更小的、專門的「專家」模型。
Qwen3模型支援119種語言,並在包含近36兆個代幣的資料集上進行了訓練。Qwen3的訓練結合了教科書、「問答對」、程式碼片段、人工智能產生的資料等。與前身 Qwen2相比,這些改進以及其他改進極大地增強了Qwen3的功能。 Qwen3模式中沒有一個比OpenAI的o3和o4-mini等最新的頂級模式領先,但仍然表現強勁。
實力比對手更強
在程式設計競賽平台Codeforces上,最大的Qwen3模型Qwen-3-235B-A22B擊敗了OpenAI的o3-mini和Google的Gemini 2.5 Pro。 Qwen-3-235B-A22B在最新版本的AIME(具有挑戰性的數學基準)和BFCL(評估模型「推理」問題的能力的測試)方面也優於o3-mini,但Qwen-3-235B-A22B尚未公開。
最大的公共Qwen3模型Qwen3-32B仍然與許多專有和開放的人工智能模式具有競爭力,包括中國人工智慧實驗室DeepSeek的R1,Qwen3-32B在多項測試中超越了OpenAI的o1模型,包括編碼基準LiveCodeBench。阿里巴巴表示,Qwen3在工具呼叫能力以及遵循指令和複製特定資料格式方面「表現出色」。
消息來源:TechCrunch