DeepSeek啟示錄 中拚AI自主化

中國人工智慧(AI)模型DeepSeek問世,震驚世界科技圈。大家都想知道,DeepSeek是什麼來頭?資安疑慮程度如何?會打趴美國的ChatGPT嗎?
DeepSeek的創始者是中國對沖基金幻方量化聯合創始人梁文鋒。台灣的工研院產科國際所研究經理石立康指出,從技術面看,DeepSeek事先囤積並使用了輝達專門為中國市場開發的H800晶片。它將記憶體管理、訓練流程,及可能使用了如蒸餾ChatGPT模型的多種技術疊加,壓低大模型開發成本,既提升推理效率,也產生更好的產品。
他提到,DeepSeek的誕生,也許給了Open AI和谷歌一些啟發:未來可依循此蒸餾與疊加路徑推出CP值更高的產品,效能應不致比現在的對話機器人差。
擁有豐富訓練生成式AI經驗的臺北醫學大學醫療暨生物科技法律研究所副教授邵軒磊提到,美國與中國是全球AI領域兩大佼佼者,原本學術圈評估,美國技術領先約兩到三年,不過DeepSeek橫空出世,兩國AI技術落差恐縮小到三至六個月。
邵軒磊解釋,所謂的蒸餾,就是把某一大語言模型裡的重要參數「萃取」出來,讓新的模型可以更少資源運作出至少「七、八分像」的功能。尤其美中較勁正熱,DeepSeek的出現,也代表承載了更多的政治意義。
根據中國媒體報導,現在中國的三大電信公司體系都會引進DeepSeek,預料不久後會看到各種DeepSeek在垂直領域的應用,由此也將拉動DeepSeek供應鏈。
石立康提到,DeepSeek的誕生,最明顯效果是對中國AI晶片提供助力,「中國的晶片本來沒有人想用,現在因為有了DeepSeek模型,起碼是為中國的AI晶片打開出海口,」日前就有媒體指出,有16家中國AI晶片公司表態,可將DeepSeek部署在中國的AI晶片上。
FB留言