我的頻道

* 拖拉類別可自訂排序
恢復預設 確定
設定
快訊

Trader Joe's這款冷凍義大利麵 粉絲:具餐廳等級

一洲焦點/川普關稅第1槍、賀錦麗敗因、媒體大變局

史丹福抄襲中國AI大模型 內藏「清華簡」彩蛋露餡 急道歉、刪除

美國史丹福一AI團隊發布了名為Llama3-V的多模態大模型,卻被指出抄襲中大模型;示意圖。(路透)
美國史丹福一AI團隊發布了名為Llama3-V的多模態大模型,卻被指出抄襲中大模型;示意圖。(路透)

美國史丹福大學一AI團隊發布了名為Llama3-V的多模態大模型,但隨後,該團隊發布的模型因為一個暗藏的「清華簡」彩蛋,被發現其模型抄襲自中國大模型。目前,該團隊已公開道歉,並刪除了相關庫和官宣推文。

每日經濟新聞報導,史丹福大學AI團隊在2024年5月29日發布了一個名為Llama3-V的多模態大模型,聲稱只需500美元(約3619元人民幣)就能訓練出一個性能可與GPT4-V媲美的模型。Llama3-V不僅在社交媒體上迅速竄紅,還一度沖上了HuggingFace趨勢榜首頁。

然而,一名細心網友發現,該團隊發布的Llama3-V和中國國內大模型MiniCPM-Llama3-V 2.5有極高的相似度,後者是由中國大模型初創企業「面壁智能」和清華大學自然語言處理實驗室聯合推出的。該網友表示,這兩個模型的結構、代碼、配置文件都一模一樣,只有變量名被替換了。

面壁智能首席科學家、清華大學長聘副教授劉知遠隨後在知乎上回應,MiniCPM-Llama3-V 2.5在研發時內置了一個彩蛋,就是對「清華簡」的識別能力,而Llama3-V模型居然也有一模一樣的能力。

清華簡是清華大學於2008年7月收藏的一批戰國竹簡,為戰國中晚期文物。劉知遠透露,識別清華簡是MiniCPM-Llama3-V 2.5的一項實驗功能,訓練圖像是最近從出土文物中掃描並標注,且尚未公開發布。

報導指出,遭到大量質疑後,該史丹福團隊成員已刪除他們在X平台上官宣模型的推文,並將該項目在Github和HuggingFace上的相關庫一併刪除。

Llama3-V團隊的森德哈斯·沙瑪(Siddharth Sharma)和阿克沙·加格(Aksh Garg)4日在社交平台上,就這一學術不端行為向面壁智能MiniCPM團隊正式道歉,並表示會將Llama3-V模型悉數撤下。

阿克沙表示,為這個項目編寫代碼的穆斯塔法(Mustafa)已無法聯繫。他們查看了最新的論文,以驗證這項工作的新穎性,但並未被告知或意識到OpenBMB(清華團隊支持發起的大規模預訓練語言模型庫與相關工具)之前的任何工作。他們向作者道歉,並對自己沒有努力驗證這項工作的原創性感到失望。

面壁智能CEO李大海3日表達了對此事的深切遺憾,他指出,盡管從某種程度上看,這種模仿可以被視為他們的成果得到了國際團隊的某種認可,但他更強調應該構建一個開放、協作且充滿信任的技術社區環境。他們希望團隊的努力和優秀工作能夠吸引更多人的關注和認可,但並非以這種被模仿甚至抄襲的方式。

中國大模型裡的「清華簡」可以辨識對比戰國古文字。(取材自微博)
中國大模型裡的「清華簡」可以辨識對比戰國古文字。(取材自微博)

AI CEO

上一則

中國首位染疫明星 「浪姐」金莎確診 工作人員證實

下一則

名校低就? 史丹福大學博士考鄉鎮公務員 網友直呼「想不通」

延伸閱讀

超人氣

更多 >