快訊

CDC一成人力遭裁減 1300員工將被解雇

國稅局將讓政府效率部人員進入納稅人資料庫

阿里雲發表通義千問旗艦版 宣稱全面超越DeepSeek

聽新聞
test
0:00 /0:00
阿里雲發布通義千問旗艦版模型Qwen2.5-Max,宣稱性能測試幾乎全面超越深度求索DeepSeek-V3等其他模型。(路透)
阿里雲發布通義千問旗艦版模型Qwen2.5-Max,宣稱性能測試幾乎全面超越深度求索DeepSeek-V3等其他模型。(路透)

阿里雲在大年初一發布通義千問旗艦版模型Qwen2.5-Max,並宣稱在指令模型版本性能測試中,幾乎全面超越深度求索DeepSeek-V3等其他模型。

阿里雲1月29日凌晨在微信公眾號宣布,Qwen2.5-Max全新升級發布,並說新模型展現出極強勁的綜合性能,在多項公開主流模型評測基準上錄得高分,全面超越了目前全球領先的開源混合專家(MoE)模型以及最大的開源稠密模型。

阿里雲說,通義團隊分別對Qwen2.5-Max的指令(Instruct)模型版本和基座(base)模型版本效能進行了評估測試。

在指令模型方面,Qwen2.5-Max在多個基準測試中比肩美國的Claude-3.5-Sonnet模型,幾乎全面超越了另外三個美國模型GPT-4o、DeepSeek-V3及Llama-3.1-405B。

在基座模型方面,阿里雲則說,通義團隊將Qwen2.5-Max與目前領先的開源MoE模型DeepSeek V3、最大的開源稠密模型Llama-3.1-405B,以及同樣位列開源稠密模型前列的Qwen2.5-72B進行了對比。在所有11項基準測試中,Qwen2.5-Max全部超越了對比模型。

另據路透社報導,選擇大年初一發布Qwen 2.5-Max是較為特殊的時間點,也顯示了深度求索過去三週迅速崛起,給中國境內外競爭對手帶來壓力。

深度求索1月20日發布推理模型DeepSeek-R1後,字節跳動旗下豆包更新版大模型1.5-pro上星期三(22日)正式發布。

根據IT之家報導,1.5-pro模型增強了綜合能力,在知識、代碼、推理、中文等多個評測基準上,綜合得分優於GPT-4o、Claude 3.5 Sonnet 等模型。

微信

上一則

DeepSeek對台積電影響有多大?彭博:短空長多

下一則

Nvidia挫跌 華爾街股市開低…聚焦聯準會利率決策

➤➤➤想要快速掌握最新時事?世界新聞網免費電郵報(eNews),為您精選世界大事、熱門議題、生活趣聞,透過電子郵件送到您面前,讓您精準掌握天下事...即刻訂閱>>

延伸閱讀

超人氣

更多 >

世界新聞網為提供更佳的網站體驗,採cookies分析。如繼續瀏覽本網站即表示您同意我們使用cookies。
更多cookies、隱私權聲明可參考我們的「 隱私權與條款more > Worldjournal.com use cookies to improve your experience on our site. By using this site, you agree to our use of cookies.To find out more, read our update privacy policy.

我知道了