2025年,在世界范圍內(nèi),人工智能已經(jīng)開始深度賦能實體經(jīng)濟(jì),全球制造業(yè)格局也正加快重塑。作為人工智能發(fā)展重點之一,“具身智能”今年首次寫入了我國的政府工作報告。而智能機(jī)器人正是“具身智能”的典型終端產(chǎn)品。在以往的節(jié)目中,大家也可以看到,從春晚舞臺到運(yùn)動賽場,再到生產(chǎn)一線、生活場景,我國的具身智能機(jī)器人正以肉眼可見的速度加速迭代?!熬呱碇悄堋奔磳⒂瓉砬八从械谋l(fā)時刻。
我國“具身智能”機(jī)器人正在加速迭代
具身智能,簡單來說,就是讓人工智能真正“長出身體”。它不僅要像人一樣“能看、能聽、能感受”,還要學(xué)會規(guī)劃與決策,自主完成各種復(fù)雜動作。
2025年,具身智能機(jī)器人實現(xiàn)了更多技術(shù)突破。扔掉遙控器,搭載全球首個人形機(jī)器人通用視覺感知系統(tǒng),具身智能機(jī)器人可以在體育賽道上實現(xiàn)自主奔跑;從原型機(jī)邁向量產(chǎn),具身智能機(jī)器人走入巡檢、服務(wù)營業(yè)廳、工廠、養(yǎng)老醫(yī)療等真實場景,拿下億元訂單。2025年,中國具身智能市場規(guī)模預(yù)計達(dá)52.95億元,占全球約27%;從本體到大腦,具身智能機(jī)器人正在加速迭代。
從實驗室到真實世界 聰慧機(jī)器人如何打造?
2025年是人形機(jī)器人邁向產(chǎn)業(yè)應(yīng)用的元年,我們看到人形機(jī)器人從今年開始走入工廠、零售店等真實環(huán)境,協(xié)助人類完成各類任務(wù)。機(jī)器人如何從實驗室邁向復(fù)雜的真實世界?一個聰慧的機(jī)器人是怎么訓(xùn)練出來的?
精準(zhǔn)挖細(xì)沙、倒入液體、擰上瓶蓋、放入離心機(jī)、控制移液槍、在隊友之間互相傳遞樣品、操作儀器等,機(jī)器人完成了一連串超長程復(fù)雜任務(wù)。這背后依靠的不是“固定腳本”,而是學(xué)習(xí)訓(xùn)練后,機(jī)器人具備的自主推理與規(guī)劃的能力。
上海交通大學(xué)人工智能學(xué)院教授 源絡(luò)科技創(chuàng)始人 連文昭:它的難點主要體現(xiàn)在兩個層面,在高層面是它的整個任務(wù)次序特別長,一個任務(wù)可能有幾十步,有時候機(jī)器人要做一些很精細(xì)的操作,像擰蓋子,像打開一個很小的試管的小帽,或者去拿移液槍去吸液體。這些都要對它的一個實時運(yùn)動控制有極其高精度的要求。
為此,團(tuán)隊設(shè)計了一套大小腦配合的模型架構(gòu),機(jī)器人會將看到的有用的物品信息反饋給大腦,由大模型作為大腦來進(jìn)行任務(wù)的分析、拆解、推理和決策,而小腦負(fù)責(zé)按照目標(biāo)去輸出相應(yīng)的動作和結(jié)果。模型還提煉出了目標(biāo)物體之間的關(guān)系,這就像機(jī)器人動作的導(dǎo)航一樣,讓機(jī)器人能夠自主決策,達(dá)到目標(biāo)。
上海交通大學(xué)人工智能學(xué)院教授 源絡(luò)科技創(chuàng)始人 連文昭:通過力傳感器、觸覺傳感器,機(jī)器人可以感知到更高維的信號,定量的任務(wù)機(jī)器人做得比人更強(qiáng)。它一旦每個步驟都比人精準(zhǔn),同時又能做很復(fù)雜的事情,它就能自主完成比較有價值的事。
如今,這些服務(wù)實驗室工作的科研機(jī)器人已經(jīng)在基因?qū)嶒炇依锷蠉徚?。隨著具身智能的發(fā)展,越來越多的機(jī)器人正在走入生產(chǎn)一線、服務(wù)行業(yè)等各種崗位,從實驗室邁向更為復(fù)雜的真實世界。
記者探秘全國最大的具身智能數(shù)據(jù)工廠
數(shù)據(jù)常被說成是具身智能發(fā)展的“燃料”?,F(xiàn)在,一臺機(jī)器人要想在真實場景里靈活完成任務(wù),背后還是得靠大量高質(zhì)量的數(shù)據(jù)來支撐。那怎么才能又快又好地把這些數(shù)據(jù)積累起來呢?在天津,就有一座專門面向具身智能機(jī)器人的“數(shù)據(jù)工廠”,正在嘗試給出答案。
在全國最大的擁有觸覺數(shù)據(jù)的機(jī)器人數(shù)據(jù)采集工廠,每天大概有50萬條的高質(zhì)量數(shù)據(jù)從這里采集出來。
就像大語言模型依賴大規(guī)模文本語料,機(jī)器人要從“會想”邁向“會做”,同樣離不開海量真實世界的經(jīng)驗數(shù)據(jù)做訓(xùn)練。能實時記錄觸覺、力覺和動作細(xì)節(jié)的特制“數(shù)采手套”,就是連接真實世界和數(shù)據(jù)世界的介質(zhì)。
帕西尼感知科技創(chuàng)始人 許晉誠:雙手搭載了接近4000個觸覺傳感器,其實已經(jīng)接近人類的27個自由度,它就可以大量實時檢測在抓取時的物理反饋。我們其實也創(chuàng)造出來全世界最小的角度編碼器,基本小于4毫米左右。在手指彎曲的時候,它的角度的幅度都可以去實時地做檢測。
數(shù)采手套能將“手上的感覺”完整記錄下來,配合數(shù)十組攝像頭和其它傳感器的同步捕捉,就生成了一條包含視覺、觸覺、音頻、軌跡、時間等多維要素的數(shù)據(jù)片段。這樣的數(shù)據(jù)讓機(jī)器人在訓(xùn)練中既能“看見”動作,還能“感受”細(xì)節(jié)。
帕西尼感知科技創(chuàng)始人 許晉誠:包含像超市方面的工序,它可以訓(xùn)練成一個專有的專業(yè)的模型,就可以給到機(jī)器人,讓它在超市這個領(lǐng)域或工位上可以去做到更好的工作,泛化性也更高。
在機(jī)器人數(shù)據(jù)訓(xùn)練領(lǐng)域,如何提升數(shù)據(jù)質(zhì)量、降低采集成本,讓數(shù)據(jù)適配更多本體訓(xùn)練,是機(jī)器人數(shù)據(jù)采集的難點。他們將進(jìn)一步利用這些真實數(shù)據(jù)訓(xùn)練各類模型,從而推動機(jī)器人加速走向真實世界。
多地政策資源加碼 具身智能產(chǎn)業(yè)發(fā)展加速
目前,我國具身智能機(jī)器人產(chǎn)業(yè)正在從硬科技突破和場景化落地雙向發(fā)力,不少地方都在政策和資源方面,積極布局推動。
在北京亦莊,以“國家地方共建具身智能機(jī)器人創(chuàng)新中心”為代表的創(chuàng)新平臺,已集聚機(jī)器人生態(tài)企業(yè)300余家,產(chǎn)業(yè)鏈規(guī)模超百億。
上海成立了“國家地方共建人形機(jī)器人創(chuàng)新中心”,計劃到2027年推動核心產(chǎn)業(yè)規(guī)模突破500億元。
粵港澳大灣區(qū)作為全球具身智能機(jī)器人供應(yīng)鏈的重要集聚地,占據(jù)全球供應(yīng)鏈約24%的份額。今年深圳宣布針對AI與機(jī)器人產(chǎn)業(yè)新增45億元專項投資,聚焦人形機(jī)器人、核心零部件、智能算力芯片等關(guān)鍵領(lǐng)域。
此外,浙江、安徽、湖北、四川等地也成立了省級人形機(jī)器人創(chuàng)新中心,集聚區(qū)域產(chǎn)業(yè)優(yōu)勢力量,推動技術(shù)共享與聯(lián)合攻關(guān)。