DeepSeek未必改變美中AI競爭態勢

中國人工智慧（AI）模型「深度求索」（DeepSeek）橫空出世，引發產業界熱烈討論，這個高性能、低成本、在App Store下載冠軍的新模型，以及其對AI和整個科技業未來代表的意義。然而，對DeepSeek以比競爭對手少得多的資金，構建出最佳的開源模型，即使每個人都印象深刻，但對於其長期意義的看法卻各不相同。

對於那些認為AI成本太高、永遠無法回收的懷疑論者來說，DeepSeek的成功證明了矽谷的浪費和傲慢，也證實了他們之前的預言；而對於那些認為美國出於國家安全考量，需要搶先開發通用人工智慧（AGI）的AI愛好者來說，DeepSeek是一個必須加快腳步的嚴峻警告；對於長期以來一直擔心將AI定義為一場競賽，會增加系統失控造成災難性危害的風險的人，DeepSeek正是他們一直在等待的噩夢。

美國科技公司正規畫將斥資數百億美元興建資料中心，滿足其AI需求。今天很多人在問：DeepSeek是否會讓所有這些投資變得毫無意義？如果能用舊硬體建立一流的模型，何需巨額的投資？

但重點在於，投資的目的是訓練更強大的模型，並探索開源開發人員尚未掌握的技術，雖然過去六個月關於AI的討論主要圍繞著缺乏晶片為訓練新模型帶來的瓶頸，但真正的瓶頸是還沒有人擁有的運算能力。

有些觀察家主張，DeepSeek的進展代表拜登政府的晶片出口限制失敗了，但出口管制措施才上路沒多久，需要時間才能真正發揮效果。出口管制的主要目標是讓中國的整體運算能力低於美國。這意味著即使像DeepSeek這樣的中國公司發布了更強大的模型，中國也可能無法廣泛地部署它們。運算能力對於未來更強大的AI系統非常重要，而美國業者目前處於較優勢的地位，就是因為擁有更多、更好的先進晶片。

DeepSeek的創新是真實的，它使如今的AI系統能變得更便宜、更容易使用，但它只是優化了OpenAI和其他人首先發明的技術。也許DeepSeek或其他中國公司也可以在AI代理方面搶先一步。但更有可能的是，它們只是在等待一家美國公司推出一款好的產品，然後嘗試複製它。

DeepSeek的確是一個值得持續關注的重大新聞，可是它的出現未必會像一些觀察家所說的那樣徹底改變競爭態勢。

美國大型AI實驗室似乎沒有建立護城河。到目前為止，DeepSeek的公司的v3和r1模型是運用蒸餾的技術，在美國的創新之上優化。美國AI實驗室開發出大語言模型（LLM）和較新的推理模型的底層架構；而DeepSeek所做的是利用舊硬體和較少的運算能力，巧妙地優化該架構。

在過去的GPT-3時代，OpenAI的競爭對手需要數月甚至更長時間來進行逆向工程並吸收其創新，至少需要一年的時間才能滲透到免費提供的開源模型中。但DeepSeek的例子證明，開源實驗室在逆向工程方面做得更好，美國AI實驗室提出的任何創新都可以很快被吸收。轉換成本很低，而使用DeepSeek可以實現巨大的成本節省，這對美國AI實驗室而言的確是很大的挑戰。

不過DeepSeek對AI安全隻字未提，而不管對美國AI實驗室的成敗與否，它們至少嘗試以安全的方式地建造強大的AI。對急性子的AI支持者而言，這或許是合理化他們呼籲放棄安全措施的例證。

但別忘了：所有最重要的AI安全問題至今無解。拜登政府企圖透過行政命令對美國AI實驗室設下了一些限制，但川普上任第一天就廢除了該命令。如果某個企業AI實驗室突然發明並發布了超人類智能，而沒有辦法確保它與人類的價值觀或願望相一致，也沒有備援方案。

有些人看到DeepSeek的進展後就認為它即將超越美國，這是可以理解的。不過目前而言，真的不必過度杞人憂天。

AI DeepSeek 投資

上一則