DeepSeek勁敵?阿里發布新開源模型QwQ-32B 家用顯卡就能跑

阿里巴巴AI To C業務旗下AI應用「阿里通義」在6日正式發布最新的開源推理模型通義千問QwQ-32B,其官方介紹稱,透過大規模強化學習,千問QwQ-32B在數學、代碼及通用能力上進步飛躍,整體性能比肩DeepSeek-R1,同時大幅降低部署使用成本,在消費級顯卡上能實現本地部署。
使用者已可免費下載及商用QwQ-32B模型,或透過網頁版Qwen Chat體驗,該模型也將免費上架通義App。
阿里通義團隊表示,QwQ-32B模型針對數學和編程任務、通用能力分別進行2輪大規模強化學習,在32B的模型尺寸上獲得推理能力提升,印證了大規模強化學習(Reinforcement Learning,一種機器學習技術)可顯著提高模型性能。
該團隊指,千問QwQ-32B能提供極強的推理能力,以及滿足更低的資源消耗需求,背後關鍵在於強化學習。該團隊表示,希望能夠證明強大的基礎模型疊加大規模強化學習,也許是一條通往通用人工智能(AGI)的可行之路。
此外,QwQ-32B模型中還集成了與智能體(AI Agent,指的是能夠自主做出決策、完成行動,且毋需人類介入的人工智慧)相關的能力,能在使用工具的同時進行批判性思考,以及根據環境回饋調整推理過程。
受此消息影響,6日阿里巴巴集團港股早盤大幅高開漲逾6%,截至午盤漲逾7%。
FB留言