DeepSeek未必改變美中AI競爭態勢
中國人工智慧(AI)模型「深度求索」(DeepSeek)橫空出世,引發產業界熱烈討論,這個高性能、低成本、在App Store下載冠軍的新模型,以及其對AI和整個科技業未來代表的意義。然而,對DeepSeek以比競爭對手少得多的資金,構建出最佳的開源模型,即使每個人都印象深刻,但對於其長期意義的看法卻各不相同。
對於那些認為AI成本太高、永遠無法回收的懷疑論者來說,DeepSeek的成功證明了矽谷的浪費和傲慢,也證實了他們之前的預言;而對於那些認為美國出於國家安全考量,需要搶先開發通用人工智慧(AGI)的AI愛好者來說,DeepSeek是一個必須加快腳步的嚴峻警告;對於長期以來一直擔心將AI定義為一場競賽,會增加系統失控造成災難性危害的風險的人,DeepSeek正是他們一直在等待的噩夢。
美國科技公司正規畫將斥資數百億美元興建資料中心,滿足其AI需求。今天很多人在問:DeepSeek是否會讓所有這些投資變得毫無意義?如果能用舊硬體建立一流的模型,何需巨額的投資?
但重點在於,投資的目的是訓練更強大的模型,並探索開源開發人員尚未掌握的技術,雖然過去六個月關於AI的討論主要圍繞著缺乏晶片為訓練新模型帶來的瓶頸,但真正的瓶頸是還沒有人擁有的運算能力。
有些觀察家主張,DeepSeek的進展代表拜登政府的晶片出口限制失敗了,但出口管制措施才上路沒多久,需要時間才能真正發揮效果。出口管制的主要目標是讓中國的整體運算能力低於美國。這意味著即使像DeepSeek這樣的中國公司發布了更強大的模型,中國也可能無法廣泛地部署它們。運算能力對於未來更強大的AI系統非常重要,而美國業者目前處於較優勢的地位,就是因為擁有更多、更好的先進晶片。
DeepSeek的創新是真實的,它使如今的AI系統能變得更便宜、更容易使用,但它只是優化了OpenAI和其他人首先發明的技術。也許DeepSeek或其他中國公司也可以在AI代理方面搶先一步。但更有可能的是,它們只是在等待一家美國公司推出一款好的產品,然後嘗試複製它。
DeepSeek的確是一個值得持續關注的重大新聞,可是它的出現未必會像一些觀察家所說的那樣徹底改變競爭態勢。
美國大型AI實驗室似乎沒有建立護城河。到目前為止,DeepSeek的公司的v3和r1模型是運用蒸餾的技術,在美國的創新之上優化。美國AI實驗室開發出大語言模型(LLM)和較新的推理模型的底層架構;而DeepSeek所做的是利用舊硬體和較少的運算能力,巧妙地優化該架構。
在過去的GPT-3時代,OpenAI的競爭對手需要數月甚至更長時間來進行逆向工程並吸收其創新,至少需要一年的時間才能滲透到免費提供的開源模型中。但DeepSeek的例子證明,開源實驗室在逆向工程方面做得更好,美國AI實驗室提出的任何創新都可以很快被吸收。轉換成本很低,而使用DeepSeek可以實現巨大的成本節省,這對美國AI實驗室而言的確是很大的挑戰。
不過DeepSeek對AI安全隻字未提,而不管對美國AI實驗室的成敗與否,它們至少嘗試以安全的方式地建造強大的AI。對急性子的AI支持者而言,這或許是合理化他們呼籲放棄安全措施的例證。
但別忘了:所有最重要的AI安全問題至今無解。拜登政府企圖透過行政命令對美國AI實驗室設下了一些限制,但川普上任第一天就廢除了該命令。如果某個企業AI實驗室突然發明並發布了超人類智能,而沒有辦法確保它與人類的價值觀或願望相一致,也沒有備援方案。
有些人看到DeepSeek的進展後就認為它即將超越美國,這是可以理解的。不過目前而言,真的不必過度杞人憂天。
FB留言