超越Meta 阿里推最強開源AI模型

2024-09-20 02:15 記者林薏茹、黃雅慧／綜合報導

阿里巴巴旗下阿里雲19日宣布推出史上最大規模開源模型Qwen 2.5，預訓練資料量達到18兆個Token，超越Meta最新開源模型Llama-3.1的15兆個，成為目前訓練數據最大的開源模型。

法人看好，阿里雲祭出最強開源AI模型，可望吸引更多中國本土企業採用，催動AI伺服器建置需求，阿里雲代工合作夥伴英業達將率先受惠。

為因應市場對AI算力日益成長的需求，阿里雲全面升級大語言模型，推出基礎模型Qwen 2.5、用於程式設計的Qwen 2.5-Coder和專精數學的Qwen 2.5-Math，三大類模型共有十多個版本，同時也開放旗艦模型Qwen-Plus和Qwen-Turbo的API。

阿里雲指出，雖然Qwen 2.5只有720億個參數，但在多個基準測試中擊敗Meta擁有4050億參數的Llama-3.1指令微調模型。

若進一步從開放API的旗艦模型Qwen-Plus來看，性能更媲美OpenAI的閉源模型GPT-4o，及OpenAI競爭對手Anthropic推出的Claude-3.5-Sonnet。

阿里雲智能董事長兼首席執行長吳泳銘表示，為因應未來強勁的AI市場需求，阿里雲正以前所未有的力道，投資AI研發與全球基礎設施建設，以服務全球客戶。

隨著阿里雲宣示以「前所未有」的力道擴大投資AI基礎建設，法人看好，英業達身為中國雲端服務商緊密合作的夥伴，客戶囊括阿里巴巴、百度、騰訊、字節跳動等中系雲端服務供應商（CSP），營運率先受惠。

英業達上半年中系CSP廠AI伺服器拉貨動能強勁，受到華為自主開發AI晶片不順影響，客戶積極採購輝達H20晶片伺服器，買氣火熱，大幅推升英業達中國CSP客戶組裝與測試產線（L10）業績成長動能，下半年來自中國客戶的H20相關訂單也優於原先預期。

Qwen模型系列是阿里雲2023年4月推出的自研大語言模型，進入Qwen 2.5開源模型版本後，參數規模由5億至720億不等，知識、數學和編碼能力均有所提升，涵蓋語言、音頻和視覺等多種模態，並支援超過29種語言，及汽車、遊戲、科學研究等各領域應用。

阿里雲宣示以「前所未有」的力道擴大投資AI基礎建設。（中新社資料照片）

在AI技術發展下，吳泳銘稱，在汽車、生物醫藥、工業仿真、氣象預測、教育企業軟體、遊戲等行業，AI計算正在加速滲透。在前述趨勢下，阿里雲正在從晶片、伺服器、網路存儲、供電數據中心等方面，重新打造面向未來的AI先進基礎設施。

AI 晶片雲端

推薦文章