最近 AI 圈里又鬧出一個(gè)大新聞,《斯坦福團(tuán)隊(duì)抄襲中國 AI!》
估計(jì)剛看到這個(gè)標(biāo)題,很多人跟世超一樣都蒙了。???是不是看花眼了?
哪個(gè)斯坦福?確定沒搞反?


您猜怎么著,這還真就是 QS 排名前五的那個(gè)美國斯坦福。
別說國內(nèi)網(wǎng)友,業(yè)內(nèi)大佬也繃不住,直呼時(shí)代變了。

確切的說,應(yīng)該是斯坦福的一個(gè)本科生團(tuán)隊(duì),抄了清華博士創(chuàng)業(yè)公司的產(chǎn)品,也就是面壁智能的開源模型:MiniCPM-Llama3-V 2.5 小鋼炮。
事兒要從 5 月 29 號(hào)說起。
這天有兩個(gè)斯坦福的印度年輕人,一個(gè)還跟佛祖( Siddharth 悉達(dá)多)同名,在世界上* ai 開源社區(qū)—— HuggingFace上發(fā)布了他們的大模型 Llama-3-V 。

看著他們光鮮亮麗的實(shí)習(xí)簡(jiǎn)歷,又是特斯拉又是 SpaceX 的,很快,網(wǎng)友們就把這個(gè)號(hào)稱“500刀就能練成比肩 GPT-4V 、 Gemini Ultra”的后起之秀,頂上了 HuggingFace 首頁,推文瀏覽量也超過 30萬。

剛開始可能還有人覺著:我大美利堅(jiān)江山代有才人出啊,你看看,本科生就能做出比肩大廠的成績(jī),什么叫世界一流啊~
很快,一些眼尖的業(yè)內(nèi)人士發(fā)現(xiàn)不對(duì)勁了,你這玩意怎么看著跟21 號(hào)那個(gè) MiniCPM 小鋼炮差不多,不會(huì)是抄的吧,咋不標(biāo)注來源?

之所以人家一眼丁真鑒定為抄,主要是它宣稱的體積小、性能強(qiáng)、多模態(tài)的特點(diǎn),很難不讓人把它和清華的 MiniCPM 對(duì)比。
但他又申明自己是原創(chuàng)的,沒引用人家 MiniCPM 。
不過面對(duì)別人的指責(zé),這大學(xué)生團(tuán)隊(duì)還嘴硬,說 MiniCPM 是引用了 LLaVA-UHD 的,我們也引的這個(gè),讀書人的事,那能叫抄嗎?真是裝糊涂的天才。

問題是 MiniCPM 和 LLaVA-UHD 原來的樣子早就不一樣了,而你這個(gè) Llama3-V 的長(zhǎng)相跟 LLaVA-UHD 不能說一模一樣,至少是毫不相關(guān),但是跟人家小鋼炮就像一個(gè)媽生的。
等放一塊兒仔細(xì)一瞅,好家伙,模型結(jié)構(gòu)跟人家像也就算了,配置文件怎么都一模一樣。

再一看代碼,除了加點(diǎn)格式化,改了幾個(gè)變量名,別的都毫無區(qū)別,甚至人家清華專門定義的特殊符號(hào),你這代碼里都沒變過。
更搞笑的是,有網(wǎng)友發(fā)現(xiàn)運(yùn)行 Llama3-V 時(shí),用斯坦福團(tuán)隊(duì)提供的權(quán)重文件(神經(jīng)網(wǎng)絡(luò)微調(diào)用的參數(shù))是跑不起來的,但如果把其中的變量名改為 MiniCPM-Llama3-V 2.5 的,就會(huì)絲滑啟動(dòng)。

都錘成這樣了,印度老哥還是始終咬死不認(rèn)。
很快,收到消息的面壁智能官方也下場(chǎng)開錘,表示 Llama3-V 項(xiàng)目的作者并不完全理解 MiniCPM-Llama3-V 2.5 的架構(gòu),甚至也不理解他們自己的代碼。
換句話說,還挺陰陽的,“你抄都沒抄明白啊。”

除此之外,面壁團(tuán)隊(duì)還甩出一個(gè)雷神之錘的證據(jù), Llama3-V 居然可以識(shí)別清華簡(jiǎn)!
清華簡(jiǎn)是清華校友捐贈(zèng)的重要文物,這些埋藏于戰(zhàn)國時(shí)代的竹簡(jiǎn)躲過了秦始皇焚書,保存著包括古本《尚書》、先秦史料、醫(yī)方哲學(xué)等極其珍貴的原始檔案,簡(jiǎn)單來說就是上古版《永樂大典》。
清華簡(jiǎn)識(shí)別其實(shí)是 MiniCPM-Llama3-V 2.5 研發(fā)時(shí)內(nèi)置的彩蛋,所有訓(xùn)練識(shí)別的數(shù)據(jù),都是面壁智能和清華大學(xué)合作,一個(gè)字一個(gè)字掃描標(biāo)注的,從未公開。這些完全私有的數(shù)據(jù)斯坦福團(tuán)隊(duì)不可能拿到,但是兩個(gè)模型卻都能實(shí)現(xiàn)識(shí)別,甚至犯錯(cuò)的地方都一模一樣。

到這,可以說他們抄襲是百分百,板上釘釘的事了。鼓破萬人捶,面對(duì)全世界網(wǎng)友的唾沫星子,這倆印度哥們?cè)趺醋龅哪兀?/p>
答,刪庫跑路!

他們馬上刪掉了 HuggingFace 上的 Llama3-V 模型,并表示:“非常感謝那些在評(píng)論中指出與之前研究相似之處的人。我們意識(shí)到我們的架構(gòu)非常類似于OpenBMB 的 MiniCPM-Llama3-V 2.5 ,他們?cè)趯?shí)現(xiàn)上比我們搶先一步。我們已經(jīng)刪除了關(guān)于作者的原始模型?!?/p>
不是,過分了啊,還要點(diǎn)臉不?
然后他們又光速滑跪道歉甩鍋三連,說我們哥倆只是宣傳推廣的,代碼都是外包給另一個(gè)南加州大學(xué)老哥干的,冤枉啊!

但事已經(jīng)鬧大了,丟面兒的斯坦福大學(xué)官方也急忙下場(chǎng),他們的人工智能實(shí)驗(yàn)室主任,谷歌 Deepmind 的研究員 Christopher David Manning 直接發(fā)文開噴,“典型的不承認(rèn)自己錯(cuò)誤!”
并對(duì) MiniCPM 這一中國開源模型表示贊揚(yáng)。

而被抄的面壁智能聯(lián)合創(chuàng)始人劉知遠(yuǎn),則對(duì)他們喊話:“團(tuán)隊(duì)三人中的兩位也只是斯坦福大學(xué)本科生,未來還有很長(zhǎng)的路,如果知錯(cuò)能改,善莫大焉?!?/p>
面壁 CEO 李大海也詼諧回應(yīng)道:“我們對(duì)這件事深表遺憾。一方面感慨這也是一種受到國際團(tuán)隊(duì)認(rèn)可的方式,另一方面呼吁大家共建開放、合作、有信任的社區(qū)環(huán)境?!?/p>
“我們希望團(tuán)隊(duì)的好工作被更多人關(guān)注與認(rèn)可,但不是以這種方式。”


話雖這么說,但這次的事確實(shí)也讓大家注意到,國產(chǎn) AI 好像也不是刻板印象中那樣了。
連開頭的大佬,Hugging Face的負(fù)責(zé)人Omar Sanseviero也表示,
“社區(qū)一直忽視了中國機(jī)器學(xué)習(xí)生態(tài)系統(tǒng)的工作。他們正在用有趣的大語言模型、視覺大模型、音頻和擴(kuò)散模型做一些令人驚奇的事情?!?/p>
并提到鵝廠混元大模型,和最近爆火的ChatTTS

拿這次的主角面壁智能來說,雖然各大廠商(上個(gè)月谷歌安卓 15 ,過幾天蘋果 iOS18 )都在布局移動(dòng)端大模型,但經(jīng)過此次事件,大家發(fā)現(xiàn)這家中國公司,在這個(gè)賽道上也十分出色。
MiniCPM 不但體量小,只用 2.4B 的數(shù)據(jù)規(guī)模就能達(dá)到數(shù)倍于它的模型能力,不僅支持安卓系統(tǒng),還支持鴻蒙,推理做題都毫不遜色。

視覺識(shí)別能力也相當(dāng)不錯(cuò),特別是中文圖像場(chǎng)景下,表現(xiàn)比 ChatGPT-4V 更好。

除此之外,面壁官方還在今天中午官宣,「小鋼炮」MiniCPM 決定免費(fèi)公開!對(duì)學(xué)術(shù)研究完全開放,企業(yè)和個(gè)人只需填寫問卷登記后就允許商用。
什么叫格局啊~(戰(zhàn)術(shù)后仰)

世超覺得,網(wǎng)友們確實(shí)也應(yīng)該改變一些成見。許多人以前都認(rèn)為,國產(chǎn) AI 都是套殼 ChatGPT , 這不行那不行,感謝 XXX 開源。
然而就像劉知遠(yuǎn)說的,盡管面對(duì)國際*模型仍有差距,但中國大模型已經(jīng)從以前的 nobody ,成長(zhǎng)為了 AI 領(lǐng)域的關(guān)鍵推動(dòng)者之一。
至于這兩個(gè)年輕人,希望你們耗子尾汁,不要再耍這樣的小聰明。


233206/06








