快訊

一洲焦點/川普外交政策背離、DOGE省錢還給納稅人?

運輸部將終止紐約「堵車費」重創霍楚

感受DeepSeek壓力 阿里雲發表「通義千問」新AI模型

阿里雲在大年初一發布通義千問旗艦版模型Qwen2.5-Max,宣稱超越DeepSeek-V3等其他模型。(路透)
阿里雲在大年初一發布通義千問旗艦版模型Qwen2.5-Max,宣稱超越DeepSeek-V3等其他模型。(路透)

在中國人工智慧公司DeepSeek (深度求索)一夕爆紅引發華爾街震盪之際,「阿里雲」計算公司(Alibaba Cloud)在29日(大年初一)宣布推出新一代AI模型「通義千問旗艦版模型Qwen2.5-Max」,並宣稱在性能測試中,其表現幾乎全面超越DeepSeek-V3等其他AI模型。

阿里雲29日凌晨在微信公眾號宣布,通義千問Qwen2.5-Max全新升級發布,並表示新模型不僅展現出極強勁的綜合性能,更在多項公開主流模型評測基準上均取得高分,全面超越目前全球領先的開源混合專家模型(MoE)及最大的開源稠密模型。

阿里雲說,通義團隊分別對Qwen2.5-Max的指令(Instruct)模型版本和基座(base)模型版本效能進行了評估測試。

在指令模型方面,Qwen2.5-Max在多個基準測試中比肩美國的Claude-3.5-Sonnet模型,幾乎全面超越另外三個模型GPT-4o、DeepSeek-V3及Llama-3.1-405B。

在基座模型方面,阿里雲則表示,通義團隊將Qwen2.5-Max與目前領先的開源MoE模型DeepSeek V3、最大的開源稠密模型Llama-3.1-405B,以及同樣位列開源稠密模型前列的Qwen2.5-72B進行了對比,Qwen2.5-Max在所有11項基準測試中,表現全部超越對比模型。

據路透報導,選擇大年初一發布Qwen 2.5-Max是較為特殊的時間點,也顯示了DeepSeek過去三周迅速崛起,給中國境內外競爭對手帶來壓力。

「阿里雲」在大年初一宣布推出新一代AI模型「通義千問旗艦版模型Qwen2.5-M...
「阿里雲」在大年初一宣布推出新一代AI模型「通義千問旗艦版模型Qwen2.5-Max」。(取自阿里雲網站)

DeepSeek AI 微信

上一則

DeepSeek繞道囤積大量晶片 遭疑「隱藏開發成本」

下一則

穿鐵背心、負重20斤 16歲登珠峰的少女立志「7+2」登頂

超人氣

更多 >

世界新聞網為提供更佳的網站體驗,採cookies分析。如繼續瀏覽本網站即表示您同意我們使用cookies。
更多cookies、隱私權聲明可參考我們的「 隱私權與條款more > Worldjournal.com use cookies to improve your experience on our site. By using this site, you agree to our use of cookies.To find out more, read our update privacy policy.

我知道了