中國的開源大模型正以“集群式”的崛起,重塑全球AI版圖。
過去兩周多的時(shí)間里,阿里通義千問陸續(xù)開源了六款模型。在這應(yīng)接不暇的開源狂歡中,某AI公司的技術(shù)研發(fā)人員董銘(化名)卻感到有些心力交瘁——他默默關(guān)掉了一個(gè)剛部署幾天的測試集群,因?yàn)殡S著新模型的開源,應(yīng)用程序接口又變了,而這已經(jīng)是他近期第四次重寫模型調(diào)用腳本。
最近,此前有些沉寂的中國大模型又重新熱鬧起來,無論是互聯(lián)網(wǎng)大廠還是初創(chuàng)公司,都緊鑼密鼓地發(fā)布了新模型,頗有2023年“百模大戰(zhàn)”的味道。但不同的是,這一次的大模型浪潮以開源為核心,近期更新模型的公司都選擇了開源的路徑。與此同時(shí),據(jù)全球知名AI開源社區(qū)Hugging Face近日公布的榜單,排名前十的開源大模型中,中國占據(jù)了九席。
中國的開源大模型正以“集群式”的崛起,重塑全球AI版圖。但這在加強(qiáng)中國技術(shù)影響力、加快AI應(yīng)用和普及的同時(shí),也存在著隱憂。一方面,開源模型頻繁迭代,但本質(zhì)依然是基于主流Transformer架構(gòu)的微調(diào),能力差距并未拉開,有陷入“微調(diào)內(nèi)卷”與同質(zhì)化困境的傾向。另一方面,對于開發(fā)者來說,開源模型的爆發(fā)雖然提供了各式各樣的工具,但也帶來了反復(fù)調(diào)試、兼容成本高等挑戰(zhàn)。
中國大模型“橫掃”開源榜單
作為AI大模型大戰(zhàn)的兩個(gè)不同方向,開源與閉源孰優(yōu)孰劣歷來存在爭議。開源是指開放源代碼,允許用戶修改、使用、分發(fā),閉源則是指源代碼不公開,用戶僅能通過接口調(diào)用功能。
今年以前,我國大模型雖也“百花齊放”,但開源與閉源呈現(xiàn)勢均力敵的狀態(tài),直到DeepSeek火爆出圈,國產(chǎn)大模型才走到了一個(gè)分水嶺。業(yè)界普遍認(rèn)為,DeepSeek的成功是開源的勝利,讓所有人直觀感受到了開源的影響力。于是,更多的中國公司選擇效仿DeepSeek,轉(zhuǎn)向開源路線,并將工作重點(diǎn)重新轉(zhuǎn)向模型的優(yōu)化與更新迭代中來。
今年7月底,國產(chǎn)大模型再次迎來了一輪開源“井噴潮”:7月22日起,阿里以“日更”的節(jié)奏,連續(xù)發(fā)布4款開源模型;7月27日,騰訊開源了混元3D世界模型1.0;7月28日,智譜發(fā)布了專為智能體應(yīng)用打造的開源模型GLM-4.5;7月31日,AI大模型“六小虎”之一的階躍星辰正式開源新一代基礎(chǔ)大模型Step-3……
與此同時(shí),Hugging Face在7月31日公布的榜單顯示,排名前十的開源大模型中,中國占據(jù)了九席。其中,智譜的GLM-4.5排名第一,阿里的通義千問系列大模型更是獨(dú)霸5個(gè)席位,同時(shí)上榜的還有騰訊混元大模型、月之暗面的Kimi K2大模型等。自年初至今,DeepSeek和阿里被外界稱為“開源雙子星”,Kimi K2發(fā)布后被《自然》雜志稱為“又一個(gè)DeepSeek時(shí)刻”……中國開源大模型迎來了集體爆發(fā)的時(shí)刻。
“這一現(xiàn)象標(biāo)志著中國AI從‘技術(shù)追趕’邁向‘生態(tài)主導(dǎo)’,核心驅(qū)動(dòng)力源于‘?dāng)?shù)據(jù)—算力—場景’構(gòu)筑的強(qiáng)勁閉環(huán)優(yōu)勢?!碧焓雇顿Y人、資深人工智能專家郭濤在接受證券時(shí)報(bào)記者采訪時(shí)表示,我國開源大模型強(qiáng)勢崛起,一方面,是由于我國大模型廠商依托海量優(yōu)質(zhì)中文語料,深度挖掘垂直應(yīng)用場景,構(gòu)建起了特色鮮明的差異化訓(xùn)練數(shù)據(jù)集;另一方面,以華為昇騰為代表的國產(chǎn)化算力底座日趨成熟,為大規(guī)模分布式訓(xùn)練奠定堅(jiān)實(shí)基礎(chǔ),疊加開源社區(qū)的飛輪效應(yīng),頭部企業(yè)開放代碼匯聚眾智,從而形成了良性循環(huán)的正向反饋。
先發(fā)者與后發(fā)者的路徑分化
8月2日,國際知名大模型評測平臺Chatbot Arena更新了最新一期榜單,阿里旗下最新開源的千問3超越了Grok4、Claude4等閉源模型,位列總榜全球第三,僅次于谷歌與OpenAI旗下的閉源大模型。
與此同時(shí),作為開源模型領(lǐng)域的先驅(qū),Meta創(chuàng)始人扎克伯格在一封公開信中表示,Meta會(huì)“謹(jǐn)慎選擇開源內(nèi)容”,這被視為Meta轉(zhuǎn)向閉源的一個(gè)信號。這意味著,在中國大力擁抱開源模型的同時(shí),閉源模型成為了美國科技公司的主流選擇,發(fā)展路徑已出現(xiàn)明顯分化。
“AI的先發(fā)者必然傾向于閉源,因?yàn)橄劝l(fā)者要鞏固自己的優(yōu)勢,保持獨(dú)特性,比如OpenAI就是從開源逐漸走向閉源;而后發(fā)者必然傾向于開源,因?yàn)橹挥虚_源,才能打破閉源者構(gòu)建的生態(tài)?!惫ば挪啃畔⑼ㄐ沤?jīng)濟(jì)專家委員會(huì)委員盤和林在接受證券時(shí)報(bào)記者采訪時(shí)表示,作為后發(fā)者,我國發(fā)展AI最佳路徑就是開源,只有開源模式可以不斷優(yōu)化,吸引全世界開發(fā)者幫助研發(fā)算法來適配應(yīng)用場景,從而獲得廣闊的應(yīng)用生態(tài)支持。
一名人工智能資深專家告訴記者,美國的AI產(chǎn)業(yè)由資本驅(qū)動(dòng),有較強(qiáng)的資本回報(bào)預(yù)期,其盈利訴求導(dǎo)致AI大模型企業(yè)往往先追求技術(shù)領(lǐng)先,形成一定壟斷后再創(chuàng)造巨額利潤,使其傾向于選擇閉源路線。但對于中國大模型廠商而言,唯有憑借開源的技術(shù)透明性,才能迅速在全球范圍內(nèi)獲得信任,建立自己的開發(fā)者生態(tài)。“開源是一種產(chǎn)業(yè)優(yōu)先的路徑,通過開源降低使用門檻,讓大模型加速成為與實(shí)體經(jīng)濟(jì)融合的基礎(chǔ)設(shè)施?!痹撊斯ぶ悄苜Y深專家表示。
但開源并不等于放棄盈利,事實(shí)上,目前不同的模型廠商都有各自的盈利探索。比如,智譜以開源吸引更多的開發(fā)者,同時(shí)也向企業(yè)和政府客戶提供付費(fèi)的定制化解決方案;阿里則是通過打造強(qiáng)大的開源模型,吸引開發(fā)者使用其云計(jì)算等基礎(chǔ)設(shè)施,通過云服務(wù)獲取收益。
“開源模式如利刃破局,打破技術(shù)壟斷壁壘,讓中小企業(yè)能以低成本調(diào)用前沿模型,加速AI在智能制造質(zhì)檢、金融風(fēng)控等領(lǐng)域的落地?!惫鶟f,當(dāng)閉源模型采取API(應(yīng)用程序接口)收費(fèi)模式時(shí),中國開源模型通過微調(diào)定制服務(wù)、云平臺分成等路徑實(shí)現(xiàn)盈利,推動(dòng)了AI技術(shù)的普及和應(yīng)用。
光環(huán)之下的隱憂與挑戰(zhàn)
開源模型越來越“卷”,這是今年以來從業(yè)者的普遍感受。各個(gè)廠商迭代模型的速度越來越快、版本越來越多,一個(gè)模型“登頂”之后很快又會(huì)被新的模型超越,看似是在參數(shù)性能、評測分?jǐn)?shù)上“你追我趕”,實(shí)則是缺乏顛覆式創(chuàng)新之下的“微調(diào)內(nèi)卷”與同質(zhì)化困境。
“開源也好,閉源也好,所有領(lǐng)先模型都是基于谷歌發(fā)明的Transformer,在這個(gè)基礎(chǔ)架構(gòu)上再創(chuàng)新,如此而已?!遍_源中國董事長馬越表示。前述人工智能資深專家表示,國產(chǎn)模型在開源榜上領(lǐng)先,體現(xiàn)的是國內(nèi)廠商在算法工程化、推理性能、成本優(yōu)化等方面的實(shí)力,大多數(shù)模型進(jìn)步是依賴工程調(diào)優(yōu),而不是像Transformer那樣的訓(xùn)練框架及算法創(chuàng)新。
硅谷基準(zhǔn)風(fēng)投公司合伙人Bill Gurley曾評價(jià),中國開源模型之間可以互相改進(jìn),產(chǎn)生的組合效應(yīng)非常強(qiáng)大,推出新模型變得更容易。但技術(shù)壁壘上的不足,導(dǎo)致新模型雖然愈發(fā)頻繁地推出,但能力差距并未拉開。對于開發(fā)者而言,開源工具雖多,卻面臨密鑰管理割裂、版本迭代失控等問題。
“通義、DeepSeek、GLM,每個(gè)模型都有各自的控制臺和密鑰。而且模型更新頻繁,接口經(jīng)常變化,給集成工作帶來不少困擾?!倍懕硎?,為了快速驗(yàn)證新模型,開發(fā)者往往不得不反復(fù)部署臨時(shí)集群,當(dāng)模型更新節(jié)奏超過開發(fā)速度,開源狂歡某種程度也成為了“甜蜜的負(fù)擔(dān)”。
在郭濤看來,模型高速迭代催生技術(shù)突破的同時(shí)也暗含著隱憂,不僅會(huì)帶來兼容性危機(jī),版本更迭過頻導(dǎo)致下游應(yīng)用適配成本激增,同時(shí)也可能存在創(chuàng)新空心化傾向,多數(shù)工作停留在參數(shù)調(diào)優(yōu),缺乏底層架構(gòu)突破。對此,需推動(dòng)統(tǒng)一API接口標(biāo)準(zhǔn),激勵(lì)開展原創(chuàng)性基礎(chǔ)研究,規(guī)避低水平重復(fù)建設(shè)。
盤和林認(rèn)為,靠“微調(diào)內(nèi)卷”實(shí)現(xiàn)進(jìn)步是AI基礎(chǔ)算法突破乏力導(dǎo)致的,要真正引領(lǐng)AI范式,基礎(chǔ)模型算法創(chuàng)新和算力芯片突破是繞不過去的兩大門檻。“未來,需要建立中國AI的基礎(chǔ)算法知識分享圈子,通過圈子內(nèi)的相互啟發(fā),來推動(dòng)中國AI算法思想的創(chuàng)新?!北P和林表示。
校對:蘇煥文