返回

2025-04-29 11:48:30

阿里巴巴發布Qwen3 AI模型　香港免VPN可用、極強推理能力可生成圖像

分享：

阿里巴巴發布「混合」AI模型Qwen3。

阿里巴巴周一發布了最新AI模型「通義千問」Qwen3，聲稱可與Google和OpenAI提供的DeepSeek-R1、o1、 o3-mini、Grok-3及Gemini-2.5-Pro等模型匹敵，而且香港可用。大多數型號都可以或準備於AI開發平台Hugging Face和GitHub的開放許可下載，大小範圍從6億個參數到2350億個參數不等，Qwen等中國原創模式系列的崛起加大了OpenAI等美國實驗室提供更強大人工智能技術的壓力。

只要註冊帳號香港都可用到Qwen3。

Qwen3有深度思考、圖像生成及影片生成等不同功能。

混合模型更快更準

阿里巴巴表示，Qwen3 模型是「混合」模型，整合了思維和非思維模式，為用戶提供了控制思維預算的靈活性，可以花時間推理複雜的問題或快速回答更簡單的請求。有些模型也採用專家混合（MoE）架構，可以提高回答查詢的運算效率。MoE將任務分解為子任務，並將它們委託給更小的、專門的「專家」模型。

Qwen3模型支援119種語言，並在包含近36兆個代幣的資料集上進行了訓練。Qwen3的訓練結合了教科書、「問答對」、程式碼片段、人工智能產生的資料等。與前身 Qwen2相比，這些改進以及其他改進極大地增強了Qwen3的功能。 Qwen3模式中沒有一個比OpenAI的o3和o4-mini等最新的頂級模式領先，但仍然表現強勁。

Qwen3模型與其他模型比較。

Qwen3模型與其他模型比較。

實力比對手更強

在程式設計競賽平台Codeforces上，最大的Qwen3模型Qwen-3-235B-A22B擊敗了OpenAI的o3-mini和Google的Gemini 2.5 Pro。 Qwen-3-235B-A22B在最新版本的AIME（具有挑戰性的數學基準）和BFCL（評估模型「推理」問題的能力的測試）方面也優於o3-mini，但Qwen-3-235B-A22B尚未公開。

最大的公共Qwen3模型Qwen3-32B仍然與許多專有和開放的人工智能模式具有競爭力，包括中國人工智慧實驗室DeepSeek的R1，Qwen3-32B在多項測試中超越了OpenAI的o1模型，包括編碼基準LiveCodeBench。阿里巴巴表示，Qwen3在工具呼叫能力以及遵循指令和複製特定資料格式方面「表現出色」。

消息來源：TechCrunch

【立即參加】送Rollink全球最輕薄可摺疊手提行李箱🧳！