超越Meta 阿里推最強開源AI模型
阿里巴巴旗下阿里雲19日宣布推出史上最大規模開源模型Qwen 2.5,預訓練資料量達到18兆個Token,超越Meta最新開源模型Llama-3.1的15兆個,成為目前訓練數據最大的開源模型。
法人看好,阿里雲祭出最強開源AI模型,可望吸引更多中國本土企業採用,催動AI伺服器建置需求,阿里雲代工合作夥伴英業達將率先受惠。
為因應市場對AI算力日益成長的需求,阿里雲全面升級大語言模型,推出基礎模型Qwen 2.5、用於程式設計的Qwen 2.5-Coder和專精數學的Qwen 2.5-Math,三大類模型共有十多個版本,同時也開放旗艦模型Qwen-Plus和Qwen-Turbo的API。
阿里雲指出,雖然Qwen 2.5只有720億個參數,但在多個基準測試中擊敗Meta擁有4050億參數的Llama-3.1指令微調模型。
若進一步從開放API的旗艦模型Qwen-Plus來看,性能更媲美OpenAI的閉源模型GPT-4o,及OpenAI競爭對手Anthropic推出的Claude-3.5-Sonnet。
阿里雲智能董事長兼首席執行長吳泳銘表示,為因應未來強勁的AI市場需求,阿里雲正以前所未有的力道,投資AI研發與全球基礎設施建設,以服務全球客戶。
隨著阿里雲宣示以「前所未有」的力道擴大投資AI基礎建設,法人看好,英業達身為中國雲端服務商緊密合作的夥伴,客戶囊括阿里巴巴、百度、騰訊、字節跳動等中系雲端服務供應商(CSP),營運率先受惠。
英業達上半年中系CSP廠AI伺服器拉貨動能強勁,受到華為自主開發AI晶片不順影響,客戶積極採購輝達H20晶片伺服器,買氣火熱,大幅推升英業達中國CSP客戶組裝與測試產線(L10)業績成長動能,下半年來自中國客戶的H20相關訂單也優於原先預期。
Qwen模型系列是阿里雲2023年4月推出的自研大語言模型,進入Qwen 2.5開源模型版本後,參數規模由5億至720億不等,知識、數學和編碼能力均有所提升,涵蓋語言、音頻和視覺等多種模態,並支援超過29種語言,及汽車、遊戲、科學研究等各領域應用。
在AI技術發展下,吳泳銘稱,在汽車、生物醫藥、工業仿真、氣象預測、教育企業軟體、遊戲等行業,AI計算正在加速滲透。在前述趨勢下,阿里雲正在從晶片、伺服器、網路存儲、供電數據中心等方面,重新打造面向未來的AI先進基礎設施。
留言