在京東的一次高層會(huì)議上,集團(tuán)高級(jí)副總裁、探索研究院副院長(zhǎng)何曉冬曾帶著一條機(jī)器狗走進(jìn)了會(huì)議室。這不是普通的機(jī)器人,它一邊跟著何曉冬行走,一邊用自然的語(yǔ)音與在場(chǎng)人員互動(dòng)、聊天。
會(huì)議結(jié)束后,不少高管圍上來(lái)圍觀這條“能說(shuō)會(huì)動(dòng)”的機(jī)器寵物,甚至有人當(dāng)場(chǎng)表示:“我也想買一條?!?/p>
這個(gè)看似輕松的“遛狗”畫(huà)面背后,是京東想要在AI和機(jī)器人賽道上施展拳腳的信號(hào)。在2025年世界人工智能大會(huì)(WAIC)上,京東正式發(fā)布具身智能平臺(tái)品牌“JoyInside”,與眾多機(jī)器人企業(yè)達(dá)成合作,不久前還一口氣宣布投資了三家機(jī)器人公司——千尋智能、逐際動(dòng)力、眾擎機(jī)器人。
2025年,具身智能成為人工智能領(lǐng)域最火熱的新戰(zhàn)場(chǎng)。在剛剛結(jié)束的WAIC上,大模型和機(jī)器人相結(jié)合成為主旋律,展會(huì)現(xiàn)場(chǎng)幾乎變成了一場(chǎng)機(jī)器人技能秀。各大科技巨頭紛紛展示人形機(jī)器人、四足機(jī)器人、AI玩具與智能Agent系統(tǒng),試圖搶占下一個(gè)AI落地風(fēng)口。
然而,在何曉冬看來(lái),具身智能并不只是“給機(jī)器人加上大模型”那么簡(jiǎn)單,而是涉及“大腦(智能)+小腦(運(yùn)動(dòng))+輸入輸出交互”的復(fù)雜系統(tǒng)工程。想要真正從實(shí)驗(yàn)室走入家庭和生活場(chǎng)景,遠(yuǎn)比想象中難得多。
“公眾對(duì)AI的期待值很高,所以它很容易在一個(gè)點(diǎn)就引爆。但是真正要落地,比如走入家庭,還有很多問(wèn)題要解決。大模型本身也還沒(méi)有充分跟機(jī)器人結(jié)合?!焙螘远瑢?duì)界面新聞等媒體表示。
但他個(gè)人對(duì)行業(yè)比較樂(lè)觀,“任何產(chǎn)業(yè)只要開(kāi)始走入用戶以后,特別是C端用戶,迭代速度會(huì)非???,就像自動(dòng)駕駛,機(jī)器人可能也會(huì)走類似的路徑”。
具身智能的“三件套”
如果用一句話概括具身智能,可以是 “有智能的物理機(jī)器”,或是兩足人形、四足狗,也可以是其他形態(tài)。
何曉冬對(duì)具身智能的理解比較寬泛,不局限于人形機(jī)器人,只要能在物理世界與用戶交互、且具備一定情商智商的智能體都屬于具身智能,但需要有以下三個(gè)核心模塊:
一是控制運(yùn)動(dòng)的“小腦”,確保機(jī)器能在物理世界行動(dòng),“完全沒(méi)有運(yùn)動(dòng)能力,體驗(yàn)會(huì)有明顯欠缺”;
二是作為 "大腦" 的智能中樞,僅有運(yùn)動(dòng)能力會(huì)顯得單調(diào),而“大腦”能提升可體驗(yàn)性、交互性和感知性;
三是IO輸入輸出交互,這是常被忽視卻至關(guān)重要的一環(huán),具身智能機(jī)器人涉及機(jī)器人、世界和用戶三方交互,用戶的命令、需求要被感知,機(jī)器人也要能給出回饋。
“市場(chǎng)上很多機(jī)器人公司擅長(zhǎng)控制和運(yùn)動(dòng)技術(shù),但缺乏大模型、語(yǔ)音交互、對(duì)話智能體等能力?!被谶@一認(rèn)知,京東將JoyInside定位為“附身智能”平臺(tái)——“附身”在這些公司之上,補(bǔ)齊短板。
目前,JoyInside已與包括Fuzozo芙崽、火火兔、元蘿卜AI、心大陸、Folotoy、嚕咔博士、眾擎機(jī)器人、云深處、魔法原子等在內(nèi)的多家公司達(dá)成合作,并限時(shí)免費(fèi)開(kāi)放大模型技術(shù)接入。
不同于多數(shù)企業(yè)從工業(yè)機(jī)器人起步,京東具身智能的戰(zhàn)略重心開(kāi)始傾向于家庭、陪伴等生活化場(chǎng)景。原因在于,這些場(chǎng)景不僅體量大、頻次高,也是最具用戶粘性和消費(fèi)潛力的方向,更能驗(yàn)證智能體與人的情感聯(lián)結(jié)能力。
以JoyInside與“云深處”合作的機(jī)器狗為例,這款原本用于管道巡檢的四足機(jī)器人,現(xiàn)在正變身為一款可交互、可陪伴的家庭寵物。它既能自主行走,又能聊天互動(dòng),還具備一定任務(wù)執(zhí)行能力,被何曉冬稱為“行走的搜索引擎”或“家庭助手的雛形”。
“這塊的空間會(huì)比原來(lái)大一個(gè)到兩個(gè)數(shù)量級(jí),對(duì)用戶來(lái)說(shuō)體驗(yàn)也更直接。”何曉冬說(shuō)。
他甚至將具身智能的普及類比于汽車的演進(jìn):“就像現(xiàn)在每家都有車,未來(lái)可能每家都有一個(gè)人形機(jī)器人或其他形態(tài)的機(jī)器人?!?/p>
除了技術(shù)平臺(tái)與產(chǎn)品合作,京東還在通過(guò)投資加速具身智能生態(tài)構(gòu)建。就在WAIC召開(kāi)前一周,京東先后宣布投資千尋智能、逐際動(dòng)力(LimX Dynamics)以及眾擎機(jī)器人等三家機(jī)器人企業(yè),持續(xù)加碼產(chǎn)業(yè)側(cè)投入。
對(duì)于投資策略,何曉冬在媒體溝通會(huì)中表示,京東看重三個(gè)標(biāo)準(zhǔn):第一,具身智能是戰(zhàn)略性賽道,值得長(zhǎng)期投入;第二,它能納入京東服務(wù)生態(tài)、帶來(lái)用戶體驗(yàn)躍升;第三,只要符合“大腦+小腦+IO”的系統(tǒng)邏輯,就能被京東視為合作與投資對(duì)象,并透露下一步的投資計(jì)劃仍在推進(jìn)中。
技術(shù)落地難題待解
具身智能無(wú)疑是今年最火爆的賽道之一,據(jù)IT桔子數(shù)據(jù)顯示,今年內(nèi)國(guó)內(nèi)具身智能行業(yè)的投資事件,已超過(guò)110起,總投資金額超過(guò)120億元。
就在剛結(jié)束的2025WAIC現(xiàn)場(chǎng),機(jī)器人也是當(dāng)之無(wú)愧的焦點(diǎn),各類機(jī)器人上演“技能大比拼”,從翻滾、跳躍到精準(zhǔn)操作,技術(shù)展示吸引了大量關(guān)注。這種熱度背后,是行業(yè)對(duì)具身智能的高期待,但也引發(fā)了“概念是否過(guò)熱”的討論。
何曉冬認(rèn)為,公眾對(duì)AI技術(shù)的高期待容易讓某個(gè)領(lǐng)域快速“引爆”,但具身智能要真正落地——比如走進(jìn)家庭——還有諸多難題待解。
“最典型的是手部操作?!彼e例,“手雖然小,但關(guān)節(jié)多,靈活度遠(yuǎn)高于腳。現(xiàn)在很多機(jī)器人能做前滾翻、后滾翻,但論自由度難度,可能還不如一只手的操作復(fù)雜。機(jī)器人要做服務(wù),手部精準(zhǔn)控制是繞不開(kāi)的坎?!?/p>
另一大挑戰(zhàn)是大模型與機(jī)器人的深度融合。比如空間智能,讓機(jī)器人進(jìn)房間后快速識(shí)別誰(shuí)在什么位置;再比如語(yǔ)義理解,讓它把桌上的水杯拿過(guò)來(lái),它要能精準(zhǔn)定位是哪個(gè)水杯——這些看似簡(jiǎn)單的場(chǎng)景,背后涉及視覺(jué)識(shí)別、語(yǔ)義推理、空間建模等多重技術(shù),目前還沒(méi)完全解決。
盡管存在挑戰(zhàn),何曉冬對(duì)行業(yè)前景仍持樂(lè)觀態(tài)度,他以自動(dòng)駕駛為例,早期大家爭(zhēng)論先做L2還是L3,用模擬數(shù)據(jù)還是真實(shí)數(shù)據(jù)。但特斯拉先推L2,通過(guò)攝像頭收集大量真實(shí)數(shù)據(jù),這兩年技術(shù)進(jìn)步很明顯。機(jī)器人可能也會(huì)走類似路徑——先落地到具體場(chǎng)景,積累用戶數(shù)據(jù),再快速迭代。
在他看來(lái),面向C端的機(jī)器寵物可能是率先爆發(fā)的賽道?!梆B(yǎng)一只真狗成本高、麻煩多,要喂食、遛彎、處理衛(wèi)生,而高情商的機(jī)器狗能提供類似的陪伴感,還不用費(fèi)心照顧,市場(chǎng)潛力很大。”
在具身智能進(jìn)入C端市場(chǎng)的過(guò)程中,如何控制token消耗成本、實(shí)現(xiàn)商業(yè)變現(xiàn),也成為企業(yè)普遍面臨的問(wèn)題。
Fuzozo芙崽的開(kāi)發(fā)企業(yè)珞博智能創(chuàng)始人孫兆治在接受界面新聞等媒體采訪時(shí)稱,產(chǎn)品上線以來(lái)用戶平均每日使用時(shí)長(zhǎng)達(dá)1-2小時(shí),token(大模型調(diào)用成本單位)消耗量非常驚人?!斑@類產(chǎn)品并非簡(jiǎn)單對(duì)話機(jī),而是背后有復(fù)雜的agent機(jī)制和情緒、記憶管理能力,每次交互都在調(diào)用多種模型?!?/p>
“目前沒(méi)有哪家公司靠賣token掙錢(qián)。”何曉冬稱,“如果純拼token單價(jià),只會(huì)導(dǎo)致價(jià)格越來(lái)越低,體驗(yàn)越來(lái)越差,形成不健康的生態(tài),就像早期智能音箱的價(jià)格戰(zhàn),最后大家都把體驗(yàn)放在了后面?!?/p>
在定價(jià)機(jī)制上,F(xiàn)uzozo將采用“月度付費(fèi)會(huì)員制”,而非一次性買斷,“希望做成類似美國(guó)SaaS公司的模式”。
目前來(lái)看,雖然具身智能的風(fēng)口已至,但從爆款產(chǎn)品到真正可用的系統(tǒng),還有很長(zhǎng)一段路要走。