輝達四面受敵 劫後再生衝出重圍
輝達26日(周三)財報,華爾街分析師除了注意季度收入和獲利,這次更注意輝達在DeepSeek事件後的發展部署,以及黃仁勳對AI整個行業未來發展的看法。
黃仁勳在20日首次就DeepSeek公開發表意見。上月27日,DeepSeek公開新模型R1,輝達受到衝擊,股價大跌17%,市值蒸發了6000億。投資者認為,R1使用較少經費和次級的輝達晶片,就能訓練出模型,市場將不再需要輝達的高價先進晶片,因此急著拋售手中的輝達股票。
黃仁勳認為,事實並非如此,輝達股票被拋售,是因為投資者誤解所致;投資者認定,AI模型就是將原始資料訓練成模型,使用者向模型提出問題,模型就會迅速提供答案。這樣的AI模型觀念已經過時,因為當今的AI發展已脫離「前期訓練」(pre-training)的觀念,而到一個「後期訓練」(post-training)階段。
前期訓練之後的所謂「後期訓練」,目的是推高模型的推理能力;隨著推理方法愈豐富愈有效,推理能力也就愈接近人的智慧,或超過人類智慧。但要提高推理能力,所需的輝達先進晶片也愈多;所以DeepSeek的出現,並不會減少輝達晶片的使用,反而會增加。
DeepSeek 1月底推出的R1模型,是所謂的「推理模型」(reasoning model)。2002年諾貝爾經濟獎得主卡尼曼將人的思考方式分為「快思考」與「慢思考」(Thinking, fast and slow)。人在遇到問題時,內心積聚的經驗會迅速就問題提供一個答案,這是快思考,但遇到複雜問題時,就必須進行一步一步的分析,最後才得出一個答案,這就是慢思考。例如,詢問ChapGPT:輝達財報會有怎樣的結果?它不可能給你一個迅速解答,必須進行多方和逐一分析,最後才給出一個答案。
黃仁勳預計將在26日的財報電訊會議中對推理模型作進一步的解釋。3月18日,黃仁勳將在一年一度的GTC大會(以人工智慧為核心的頂尖開發人員大會)演講,重點勢必講到輝達的新晶片「Rubin」,屆時必然會說明,Rubin的設計將在推理能力上有何突破。
自2022年11月ChapGPT面世以來,「AI革命」發展迅速,過去數月又已發展至一個新階段。早在DeepSeek R1模型出現前,黃仁動去年11月接受「經濟學人」專訪,被問到「AI模型是否進入死胡同」,當時AI行業已發現原始資料耗盡,連ChatGPT的模型也再難訓練下去,黃仁勳回答說,未來的模型訓練,將從前期訓練進入後期訓練,因此不是無路可進。今年1月6日,黃仁勳在CES大展(消費電子展)演講,也提出三種資料訓練的方式,其中就包括了前期訓練和後期訓練。
事實上,輝達目前的處境正是四面受敵,必須在下一階段中找到新方向,才能衝出重圍,繼續保持AI晶片的龍頭地位。所謂的「四面受敵」,包括了在美國,輝達正受拜登卸任前推出的新一輪對中禁售、以及川普18日宣布的進口半導體徵稅的雙重衝擊;在中國,像DeepSeek式的突襲,將會繼續發生;在矽谷,微軟、亞馬遜、谷歌和Meta的自製晶片正在迅速增加,對輝達形成新挑戰;在輝達本身,今年主打的Blackwell晶片不斷傳出生產問題。Blackwell是輝達存亡所繫,稍有閃失,股價勢必受到巨大衝擊。
至於26日的財報,華爾街分析師普遍認為,季度收入和利潤可雙雙超過預期,收入預期是381.3億,每股獲利是0.85元。但26日財報後輝達股價的去向,勢必要看輝達對下一季(2月至4月)的收入預估,去年11月的財報顯示,雖然收入和獲利都超過預期,但對下季收入的預估卻低於華爾街的預估,財報後股價因此跌了7%。這種情況26日會否歷史重演?
輝達對下季收入的預估,例必超過現季約20億,按此比率,則下季至少要400億。但已有分析師指出,由於投資者對輝達期望極高,所以下季的預估收入必須到420億,否則股價有可能再次下挫。
FB留言