快訊

人腦裝電腦透過AI 中風失語18年病患「說出自己的話」

對等關稅砲口 瞄準所有國家 川普:沒聽說什麼15國

半導體研究機構:DeepSeek硬體投資逾5億美元

聽新聞
test
0:00 /0:00
半導體研究機構SemiAnalysis近日發表報告,估計DeepSeek歷來硬體投資支出高於5億美元。(路透資料照)
半導體研究機構SemiAnalysis近日發表報告,估計DeepSeek歷來硬體投資支出高於5億美元。(路透資料照)

中國人工智慧(AI)新創公司「深度求索」(DeepSeek),以僅約560萬美元及使用2048顆輝達(Nvidia)「H800」繪圖處理器(GPU),推出的新模型DeepSeek-R1,由於成本遠低於美國科技巨擘,引發全球市場關注。不過,半導體研究機構SemiAnalysis近日發表報告估計,DeepSeek歷來的硬體投資支出,應遠高於5億美元。

SemiAnalysis報告估計,DeepSeek使用5萬顆輝達Hopper架構GPU,包括1萬顆「H800」、1萬顆「H100」,還有特供中國的「H20」,這些GPU主要用於AI訓練、研究及財務模型。換算下來,DeepSeek總資本支出約為16億美元,其中營運成本估計有9.44億美元,對GPU的投資額超過5億美元。

SemiAnalysis報告裡提到,2023年5月,中國對沖基金「幻方量化」成立「深度求索」(DeepSeek),以推動AI技術研發,但早在2021年,幻方量化已在出口管制生效前,投資購買了1萬顆輝達(Nvidia)A100 GPU。

DeepSeek論文提到的近600萬美元成本,是指預訓練運行(pre-training run)的GPU成本,只占部分的模型總成本,不代表完整支出。另外未計入的重要支出,還包括研發(R&D)、硬體總擁有成本(Total Cost of Ownership)等關鍵因素。

同時,DeepSeek自中國本土招募人才,目前約有150名員工,也正急速擴張中。

先前DeepSeek宣稱,使用6710億個參數進行訓練的「V3」模型,僅用2048顆輝達「H800」GPU、費時2個月訓練完成,相當於280萬個GPU小時。相較之下,Facebook母公司Meta Platforms使用4050億個參數訓練的「Llama 3」模型,其採用的超級電腦內建16384顆「H100」GPU、費時54天,等於後者花費的運算資源(3080萬個GPU小時),是V3的11倍。

DeepSeek 輝達 投資

上一則

Dior春季男裝 高訂剪裁走運動風

下一則

10條美國公路之旅 收入一生願望清單

➤➤➤世界新聞網全新推出「消費頻道」,提供好吃、好玩、好買的實用消費資訊,以及最新個人退休、理財、保險等省錢妙方,還有增進家居生活品質的最新情報。每天關注「消費頻道」,天天有新鮮事!

延伸閱讀

超人氣

更多 >

世界新聞網為提供更佳的網站體驗,採cookies分析。如繼續瀏覽本網站即表示您同意我們使用cookies。
更多cookies、隱私權聲明可參考我們的「 隱私權與條款more > Worldjournal.com use cookies to improve your experience on our site. By using this site, you agree to our use of cookies.To find out more, read our update privacy policy.

我知道了