科技
2025-04-29 11:48:30

阿里巴巴發布Qwen3 AI模型 香港免VPN可用、極強推理能力可生成圖像

分享:
阿里巴巴發布「混合」AI模型Qwen3。

阿里巴巴發布「混合」AI模型Qwen3。

阿里巴巴周一發布了最新AI模型「通義千問」Qwen3,聲稱可與Google和OpenAI提供的DeepSeek-R1、o1、 o3-mini、Grok-3及Gemini-2.5-Pro等模型匹敵,而且香港可用。大多數型號都可以或準備於AI開發平台Hugging Face和GitHub的開放許可下載,大小範圍從6億個參數到2350億個參數不等,Qwen等中國原創模式系列的崛起加大了OpenAI等美國實驗室提供更強大人工智能技術的壓力。

只要註冊帳號香港都可用到Qwen3。 Qwen3有深度思考、圖像生成及影片生成等不同功能。

混合模型更快更準

阿里巴巴表示,Qwen3 模型是「混合」模型,整合了思維和非思維模式,為用戶提供了控制思維預算的靈活性,可以花時間推理複雜的問題或快速回答更簡單的請求。有些模型也採用專家混合(MoE)架構,可以提高回答查詢的運算效率。MoE將任務分解為子任務,並將它們委託給更小的、專門的「專家」模型。 

Qwen3模型支援119種語言,並在包含近36兆個代幣的資料集上進行了訓練。Qwen3的訓練結合了教科書、「問答對」、程式碼片段、人工智能產生的資料等。與前身 Qwen2相比,這些改進以及其他改進極大地增強了Qwen3的功能。 Qwen3模式中沒有一個比OpenAI的o3和o4-mini等最新的頂級模式領先,但仍然表現強勁。

adblk5
Qwen3模型與其他模型比較。 Qwen3模型與其他模型比較。

實力比對手更強

在程式設計競賽平台Codeforces上,最大的Qwen3模型Qwen-3-235B-A22B擊敗了OpenAI的o3-mini和Google的Gemini 2.5 Pro。 Qwen-3-235B-A22B在最新版本的AIME(具有挑戰性的數學基準)和BFCL(評估模型「推理」問題的能力的測試)方面也優於o3-mini,但Qwen-3-235B-A22B尚未公開。

最大的公共Qwen3模型Qwen3-32B仍然與許多專有和開放的人工智能模式具有競爭力,包括中國人工智慧實驗室DeepSeek的R1,Qwen3-32B在多項測試中超越了OpenAI的o1模型,包括編碼基準LiveCodeBench。阿里巴巴表示,Qwen3在工具呼叫能力以及遵循指令和複製特定資料格式方面「表現出色」。

消息來源:TechCrunch

【立即參加】送Rollink全球最輕薄可摺疊手提行李箱🧳!

ad