界面新聞記者 | 徐美慧
界面新聞編輯 | 文姝琪
今年的外灘大會,再次把具身智能推到了臺前。
2025 Inclusion·外灘大會于9月11日在上海黃浦世博園區(qū)開幕。今年,機器人的存在感明顯更強,10000平方米科技展覽、5000平方米的科技集市以及“機器人小鎮(zhèn)”上,機器人相關展臺人頭涌動,成為觀眾們的“打卡點”。從烹飪演示到工業(yè)巡檢、從人機協(xié)作到場景遷移,從精細蛋雕到專業(yè)按摩,機器人在多元化任務中展現(xiàn)出廣泛的應用潛力。
具身智能之所以成為今年大會的焦點之一,與AI發(fā)展范式的重大轉(zhuǎn)折密切相關。2024年圖靈獎得主、“強化學習之父”理查德·薩頓(Richard Sutton)表示,人工智能正從對人類現(xiàn)有數(shù)據(jù)的依賴轉(zhuǎn)向“經(jīng)驗時代”。
他的判斷是,人類數(shù)據(jù)紅利正逼近上限,未來更高階的智能要靠智能體與世界的直接交互,不斷在觀察、行動和反饋的循環(huán)中生成“新的知識”。他強調(diào),真正新的知識和智能必須來源于智能體與世界直接交互所生成的數(shù)據(jù),也就是“經(jīng)驗”。
在“經(jīng)驗”被反復提及之后,討論的落點轉(zhuǎn)向工程化路徑。加州大學圣地亞哥分校終身教授、Hillbot創(chuàng)始人蘇昊對技術架構的演進進行了梳理。他介紹,機器人智能的發(fā)展概括為三個階段:第一階段以規(guī)則為主的執(zhí)行;第二階段引入感知,但感知、規(guī)劃、控制仍然割裂;第三階段嘗試打通感知、規(guī)劃和控制,機器人能夠?qū)⒔换シ答佊糜趦?yōu)化自身策略,進入如今的“具身智能時代”。

蘇昊指出,如果不能讓機器人在交互中汲取經(jīng)驗,智能水平就無法持續(xù)提升,而當前諸如Transformer、GPT等大模型的突破,與這種感知決策一體化趨勢融合,共同催生了近期機器人的創(chuàng)新熱潮。
從理論到落地,創(chuàng)業(yè)者的取舍更直接。宇樹科技創(chuàng)始人兼首席執(zhí)行官王興興認為,“現(xiàn)在AI寫文作畫,已經(jīng)比99.99%的人都要做得好,但真正讓AI干活,還是一片荒漠?!?/p>
對于此前“數(shù)據(jù)不是具身智能的最大挑戰(zhàn)”的言論,王興興回應稱:“我不是否定數(shù)據(jù)不重要,大家不要誤解?!彼毖?,業(yè)界當前對數(shù)據(jù)的關注往往多于對模型架構本身的打磨,數(shù)據(jù)雖然重要,但行業(yè)對“采什么、采多少、質(zhì)量如何判定”尚無共識。
因此,他主張?zhí)嵘P蛯?shù)據(jù)的利用效率,通過更好的算法架構讓模型“用更少的數(shù)據(jù)學到更多”。同時,還要明確哪些特定場景和動作的數(shù)據(jù)更有價值,從而有針對性地獲取高質(zhì)高效的數(shù)據(jù)。
換言之,在“數(shù)據(jù)”與“模型”這對AI升級的關鍵要素中,需要尋求更佳平衡,而非一味地數(shù)據(jù)堆砌。
除了架構與數(shù)據(jù)的討論,具身智能的實現(xiàn)路徑也呈現(xiàn)出多元化的探索。值得一提的是,曾就職OpenAI的清華大學交叉信息研究院助理教授吳翼還分享了一個前瞻性的概念——“In-Body Agents”(具身智能體)。
他表示,今天多數(shù)機器人或智能體執(zhí)行一次指令,能連續(xù)自治運行的時長仍以分鐘計,理想狀態(tài)應當是把一個模糊目標交給它,它可以連續(xù)工作數(shù)小時甚至一整天,直到“把事辦完”。
他判斷,這種長時序、自主性的“物理世界Agent”將是具身智能的終極形態(tài)之一,這也是他團隊正在探索的方向。
市場對具身智能的期待與日俱增。據(jù)IDC預計,到2030年全球具身智能相關市場規(guī)??蛇_到1.5萬億美元,年復合增長率約25%。第二屆中國人形機器人與具身智能產(chǎn)業(yè)大會發(fā)布的《2025人形機器人與具身智能產(chǎn)業(yè)研究報告》顯示,2025年,中國具身智能市場規(guī)模預計達52.95億元,占全球約27%;人形機器人市場規(guī)模預計達82.39億元,占全球約50%。
盡管前景廣闊,具身智能產(chǎn)業(yè)化之路并非坦途。正如王興興所言,目前讓AI“落地干活”的實踐還處在“大規(guī)模爆發(fā)的前夜”,離真正的生產(chǎn)力變革尚有距離。


