南通颐猩文化传播有限公司

當(dāng)前位置:首頁 >  科技 >  IT業(yè)界 >  正文

經(jīng)緯創(chuàng)投:人形機(jī)器人的新起點(diǎn)

 2024-08-28 09:51  來源: 互聯(lián)網(wǎng)   我來投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競價(jià),好“米”不錯(cuò)過

8月21日,2024年世界機(jī)器人大會在北京正式開幕,與以往最大的不同在于,今年是人形機(jī)器人參展企業(yè)最多的一屆 ,共有27家人形機(jī)器人整機(jī)企業(yè)、30多家產(chǎn)業(yè)鏈上下游企業(yè)亮相。

隨著AI突飛猛進(jìn),具身智能成為了今年資本市場上最熱的領(lǐng)域之一,那些曾經(jīng)僅存在于科幻電影中的機(jī)器人,正離現(xiàn)實(shí)生活越來越近,變得“看得見、摸得著”。

在開幕前后,也有多家機(jī)器人公司發(fā)布了新產(chǎn)品,比如經(jīng)緯創(chuàng)投投資的宇樹科技發(fā)布了G1量產(chǎn)版本,起售價(jià)為9.9萬元,這款產(chǎn)品在世界機(jī)器人大會上首次展出,更強(qiáng)性能、終極外觀,最關(guān)鍵的是可以大批量生產(chǎn)了。

宇樹G1機(jī)器人身手敏捷,不僅可以空中劈腿,還可以自由地上下樓梯,輕巧敏捷

英偉達(dá)科學(xué)家Erwin Coumans迫不及待想搞一臺來做實(shí)驗(yàn)

智元機(jī)器人則是一口氣發(fā)布了五款商用人形機(jī)器人產(chǎn)品,包括3款適用于不同場景的遠(yuǎn)征系列(A2、A2-W、A2-Max),2款模塊化機(jī)器人系列產(chǎn)品(靈犀X1和X1-W,后者面向?qū)I(yè)數(shù)據(jù)采集)。

星塵智能則發(fā)布了新一代AI機(jī)器人助理Astribot S1,這款產(chǎn)品也在2024世界機(jī)器人大會上正式亮相。

星塵智能的機(jī)器人助理Astribot S1,正在烘烤華夫餅

今天隨著人形機(jī)器人越來越走進(jìn)現(xiàn)實(shí),也迎來了群雄逐鹿的時(shí)刻,但技術(shù)路線仍不確定、應(yīng)用場景皆有可能。 經(jīng)緯創(chuàng)投在幾年前就系統(tǒng)性地關(guān)注通用智能機(jī)器人賽道,在機(jī)器人軟硬件一體化領(lǐng)域,投資了宇樹科技、智元機(jī)器人、銀河通用、星塵智能 ,它們都是優(yōu)秀的全技術(shù)棧型創(chuàng)業(yè)公司,但各自的技術(shù)切入方向并不相同,切入的應(yīng)用場景也不盡相同,有工業(yè)、倉儲物流、零售、生物制藥等等場景。短期目標(biāo)都是快速占領(lǐng)各自的應(yīng)用場景,誰先把一個(gè)細(xì)分場景做好,積累出足夠多的數(shù)據(jù),就有可能繼續(xù)拓展新的延展領(lǐng)域,最終走向通用化。

除了機(jī)器人軟硬件一體化外,在產(chǎn)業(yè)鏈上游的兩個(gè)重要方向(數(shù)據(jù)、一體化關(guān)節(jié)) ,經(jīng)緯創(chuàng)投也投資了AI仿真數(shù)據(jù)領(lǐng)域的光輪智能 ,正在為行業(yè)提供海量的高真實(shí)性、高效用性的訓(xùn)練數(shù)據(jù);而在一體化關(guān)節(jié)/執(zhí)行器領(lǐng)域,經(jīng)緯則投資了鈦虎機(jī)器人 ,鈦虎有非常高效和全面的產(chǎn)品系列,覆蓋了從靈巧手到全身上下的所有關(guān)節(jié)……

相比于AI大模型,人形機(jī)器人更需要工程層面的實(shí)踐與突破。 比如1990 年出生的王興興,并不是履歷亮眼的學(xué)霸型創(chuàng)業(yè)者,他是一個(gè)典型的理科偏才。“大家可能覺得很多頂尖院校的人很厲害,但實(shí)際上大家都是普通人,在機(jī)器人這個(gè)行業(yè)里,很多人只做軟件,完全沒碰過硬件,而硬件是實(shí)踐出來的,你知道就是知道,不知道就是不知道。” 宇樹科技創(chuàng)始人兼CEO王興興說,在大學(xué)時(shí)代他就發(fā)現(xiàn),只要集合最好的零部件,并且用上最先進(jìn)的軟件,就可以做出一個(gè)更好產(chǎn)品,組合式創(chuàng)新。

與王興興有著類似的經(jīng)歷,鈦虎創(chuàng)始人易港是一位95后,早在大學(xué)宿舍就搞起了3D打印機(jī)和焊臺,大一就做出了假肢原型機(jī),還在中美創(chuàng)客大賽中獲獎(jiǎng);大二又做出了一套主從式外骨骼,手部擁有17個(gè)自由度。他總結(jié)自己為什么能在大學(xué)時(shí)期的很多獎(jiǎng)項(xiàng)中,打敗名校的參賽項(xiàng)目,最核心的就是自己的產(chǎn)品“看得到、摸得著、能體驗(yàn),對社會有直接價(jià)值,而不是漂亮的PPT。”

隨著AI大模型的突破,今天的人形機(jī)器人,正越來越逼近臨界點(diǎn)。 有越來越多之前不敢想的任務(wù),如今都可以實(shí)現(xiàn)了。特別是隨著“世界模型”的提出,機(jī)器人的真機(jī)數(shù)據(jù)越來越具備實(shí)用價(jià)值。

“下一個(gè)十年,最值得做的就是人形機(jī)器人。” 星塵智能創(chuàng)始人來杰說,他曾是騰訊RoboticsX機(jī)器人實(shí)驗(yàn)室的一號員工、百度“小度機(jī)器人”團(tuán)隊(duì)負(fù)責(zé)人,在去年底離職創(chuàng)業(yè)。

“人工智能的黎明已經(jīng)迅速臨近,我預(yù)計(jì)在明年年底之前,全球至少會有一家公司能夠推出相對通用的機(jī)器人AI模型 ,發(fā)展速度之快令人矚目。” 王興興說,“我在年初提出了這一觀點(diǎn),至今仍然堅(jiān)信,明年年底實(shí)現(xiàn)這一目標(biāo)是非常有可能的。”

一、“軟與硬”的結(jié)合

不同技術(shù)路線、不同應(yīng)用場景,逐鹿方始

今天的機(jī)器人與以往最大的區(qū)別在于,隨著AI的爆發(fā),智能泛化能力大幅加強(qiáng),這讓通用機(jī)器人成為可能。 傳統(tǒng)機(jī)器人并不需要對外界自主響應(yīng),所以這是一個(gè)自動化設(shè)備,不斷地重復(fù)之前預(yù)設(shè)的程序。而現(xiàn)在有了智能泛化能力的突破,甚至只需要語音控制,機(jī)器人就能實(shí)現(xiàn)新功能,這是從自動化到智能化的底層轉(zhuǎn)變。

而AI大模型的能力,不僅體現(xiàn)在規(guī)劃層面,也開始進(jìn)入感知和控制環(huán)節(jié),機(jī)器人發(fā)展了50多年,第一次出現(xiàn)這樣由學(xué)習(xí)算法驅(qū)動、以及一個(gè)非常大的預(yù)訓(xùn)練模型來推動控制環(huán)節(jié)的變化,這也是過去一年里,我們看到技術(shù)層面最大的突破。

“最終我們會有大腦大模型、小腦大模型,一起把本體串起來,構(gòu)成一個(gè)通用機(jī)器人系統(tǒng)。” 北大-銀河通用具身智能聯(lián)合實(shí)驗(yàn)室主任王鶴說。他認(rèn)為,通用機(jī)器人應(yīng)該由基石層和能力層支撐,在基石層最關(guān)鍵的是去打造一個(gè)通用的本體,數(shù)據(jù)依賴于本體,本體也決定了它能產(chǎn)生什么樣的數(shù)據(jù),兩者相互綁定。基于本體和數(shù)據(jù),進(jìn)而發(fā)展出機(jī)器人能力,主要是“大腦”和“小腦”,前者主要解決感知和決策問題,后者把大腦的感知和決策轉(zhuǎn)換成動作。

比如智元機(jī)器人也遵循了這樣的思考邏輯。“稚暉君”彭志輝從華為離職創(chuàng)業(yè)后,與上海交通大學(xué)博士生導(dǎo)師閆維新,組建了創(chuàng)始團(tuán)隊(duì),其中閆維新負(fù)責(zé)人形機(jī)器人的“身體”,彭志輝負(fù)責(zé)人形機(jī)器人的“大腦”。“過去,他們在工作中有一些交集,創(chuàng)始人(彭志輝)提出這個(gè)想法之后,大家一拍即合。”

遠(yuǎn)征A1,是智元機(jī)器人的第一代產(chǎn)品,已于去年8月亮相。其步行速度為7公里/小時(shí),依靠視覺傳感器和多線激光雷達(dá)可自主避障。它的靈巧手有5根手指,能像人類一樣抓取物品。應(yīng)用場景專注于工廠、生物實(shí)驗(yàn)室、家庭護(hù)理與陪伴等。

而一年之后,8月18日上午,智元機(jī)器人一口氣發(fā)布了“遠(yuǎn)征”與“靈犀”兩大家族共計(jì)五款商用人形機(jī)器人新品:交互服務(wù)機(jī)器人遠(yuǎn)征A2、柔性智造機(jī)器人遠(yuǎn)征A2-W、重載特種機(jī)器人遠(yuǎn)征A2-Max、智元X-Lab孵化的首個(gè)全棧開源機(jī)器人靈犀X1、專業(yè)數(shù)采機(jī)器人靈犀X1-W。

智元在發(fā)布會現(xiàn)場,搭建了一個(gè)攝影棚,機(jī)器人當(dāng)場秀了一次在語音指令下,動手調(diào)飲料的操作

對于機(jī)器人這樣,離不開硬件做最終執(zhí)行的賽道,“軟硬一體”的能力尤其重要,像宇樹科技、智元、銀河通用、星塵等等公司都非常重視這一思路。 如果我們看電動車與自動駕駛行業(yè)的歷史,2015年第一批電動車創(chuàng)業(yè)公司創(chuàng)立至今,在這個(gè)過程中,自動駕駛創(chuàng)業(yè)公司的數(shù)量,并不少于電動車創(chuàng)業(yè)公司。但在今天,單純做自動駕駛的創(chuàng)業(yè)公司基本上都處于掙扎狀態(tài),鮮有獲得業(yè)務(wù)突破,哪怕曾經(jīng)獲得過巨額融資。

但從電動車企的角度,不僅“蔚小理”等一眾新興電動車企崛起,先有了“硬件”、產(chǎn)生數(shù)據(jù)閉環(huán),再切入自動駕駛,反而有很大的業(yè)務(wù)進(jìn)展,各家的城市NOA越來越智能。如果一個(gè)行業(yè)離不開硬件支撐,并且這個(gè)硬件仍處于快速迭代期,單純做這行業(yè)的軟件是要冒極大風(fēng)險(xiǎn)的。

類似于新能源汽車核心的三電系統(tǒng),彭志輝將機(jī)器人的核心系統(tǒng)分為:動力域(電機(jī)關(guān)節(jié)、伺服控制、電源管理)、感知域(傳感器模塊、感知算法)、通信域(網(wǎng)絡(luò)接口、數(shù)據(jù)傳輸協(xié)議、中間件框架)、控制域(通用算力、AI算力單元、運(yùn)控算法、具身算法)。

“整個(gè)機(jī)器人其實(shí)是一個(gè)軟硬件極其復(fù)雜的系統(tǒng),既涉及到內(nèi)部各個(gè)硬件模塊的協(xié)同和部署,同時(shí)也需要軟件跟算法高效配合。” 彭志輝說。

另一方面,雖然最終的目標(biāo)是通用化,但在當(dāng)下早期的發(fā)展階段,機(jī)器人的產(chǎn)品定義并不明確。 由于勞動力和任務(wù)需求是多元的,人形機(jī)器人公司短期內(nèi)也不會只有唯一的巨頭,將會有很多公司圍繞不同細(xì)分市場,走不同的技術(shù)方向,積累該場景下的數(shù)據(jù)護(hù)城河,這種“條條大路通羅馬”的局面會維持一段時(shí)間。

一些公司選擇把主要精力放在機(jī)器人的“上半身”。 比如銀河通用選擇的落地場景是無人值守藥店(特別是夜班),其首代產(chǎn)品蓋博特機(jī)器人,“下半身”就采取了輪式底盤+折疊本體的設(shè)計(jì)。之所以采取這樣的設(shè)計(jì),首先因?yàn)檩喪降妆P在零售場景里,已經(jīng)完全可以覆蓋絕大部分應(yīng)用。而折疊的設(shè)計(jì),往上可以摸到2.4米,可以覆蓋最高的貨架,機(jī)器人可以拿到所有貨物。

往下也可以摸到地面,比如當(dāng)有產(chǎn)品不小心掉到地面上時(shí),機(jī)器人也可以自己撿起來。這些都是目前機(jī)器人的雙腿結(jié)構(gòu),比較難解決的問題,而在當(dāng)下集中精力先研發(fā)“手”,可能能夠率先實(shí)現(xiàn)應(yīng)用價(jià)值。

星塵智能創(chuàng)始人來杰則將自己的機(jī)器人產(chǎn)品定義為“助理” ,輔助人,而非替代人。首要的場景就是那些腦力勞動更多,但卻經(jīng)常陷入一些重復(fù)操作的事情上。最典型的例子就是生物醫(yī)療和化學(xué)實(shí)驗(yàn),這些都是需要高智力勞動,但卻繞不開重復(fù)操作的領(lǐng)域。此時(shí)一個(gè)合格的機(jī)器人助理,可以解放這些教授、博士們雙手,他們只需要設(shè)計(jì)實(shí)驗(yàn),而所有操作都可以讓機(jī)器人準(zhǔn)確無誤、不分晝夜的去完成。如果給一位生物教授配10個(gè)機(jī)器人助理,他用于創(chuàng)造的時(shí)間甚至可以翻幾倍。

來杰也非常重視“軟硬一體”的能力。 得益于在騰訊RoboticsX機(jī)器人實(shí)驗(yàn)室的經(jīng)歷,他非常重視架構(gòu),“我們與騰訊RoboticsX機(jī)器人實(shí)驗(yàn)室的架構(gòu)就很相似,一半主攻機(jī)器人軟硬件一體化,另一半強(qiáng)調(diào)用AI算法去做感知和運(yùn)動控制,以此來探索AI和機(jī)器人的強(qiáng)耦合。”

星塵融合了觸覺感知進(jìn)行力控抓取,并結(jié)合規(guī)模化數(shù)據(jù)綜合訓(xùn)練 ,包括人體動作視頻演示、動捕、遙操作采集等方案。來杰非常重視傳動結(jié)構(gòu)中的剛、柔結(jié)合 ,也裝入了一些傳感器以在傳動過程中,能一直監(jiān)測力的傳輸。比如機(jī)器人在削黃瓜時(shí),星塵的機(jī)器人并不是去估算軌跡,而是與人類一樣,通過感知削皮刀在壓到黃瓜上時(shí),力量的大小,來控制力量的輸出,這種特殊的傳動結(jié)構(gòu),能使精度更上一層樓。

“當(dāng)下,離我們想要的具身智能之間,還有兩個(gè)重要的Gap(差距)沒有解決。”星塵智能創(chuàng)始人來杰說。

第一個(gè)Gap是AI大模型和機(jī)器人之間 ,有時(shí)候一些問題的產(chǎn)生,并不是單純靠擴(kuò)大數(shù)據(jù)規(guī)模,或是算法就可以解決,而是需要在機(jī)器人層面去進(jìn)行提升,這是硬件帶來的。

第二個(gè)Gap是在硬件本身的表達(dá)能力足夠的前提下,AI如何更好地結(jié)合硬件的能力。 比如說AI是否可能完全自主地進(jìn)行學(xué)習(xí)和嘗試?假設(shè)有一個(gè)機(jī)器人在辦公環(huán)境下,它本來什么都不知道,只知道一些基礎(chǔ)動作,然后讓它自己去建語義地圖,自己去理解環(huán)境,自己去觀察其他人的操作,然后把所有動作學(xué)會,這就跟我們?nèi)祟惡芟?。?dāng)然,這也是Yann LeCun所提出的“世界模型”。

彭志輝在最近的發(fā)布會上,對整個(gè)具身技術(shù)成熟度等級,做了從G1-G5的劃分,這類似于自動駕駛的L1-L5:

“我們在過去一年里,同時(shí)在G2落地和G3預(yù)研兩個(gè)方向,都取得了一些階段性突破。在G2階段實(shí)現(xiàn)了一系列zero-shot和few-shot的一些通用原子能力,比如通用的位姿估計(jì)模型UniPose。目前也正在與多家制造業(yè)和服務(wù)業(yè)領(lǐng)軍企業(yè),進(jìn)行聯(lián)合的場景POC,今年晚些時(shí)候有望全流程跑通,讓機(jī)器人能夠正式在客戶場景中部署干活。” 彭志輝說。

二、“大部分人對社會的成本結(jié)構(gòu)一無所知”

硬件與中國供應(yīng)鏈

低成本是人形機(jī)器人大規(guī)模運(yùn)用的前提。 今年5月,宇樹在發(fā)布G1人形機(jī)器人時(shí),把最低售價(jià)打到了9.9萬元。但這款機(jī)器人的參數(shù)一個(gè)不差,身高約127厘米,體重約35公斤,具有超越常人的靈活性,小跑速度大于2m/s,擁有廣闊的關(guān)節(jié)運(yùn)動空間,23至43個(gè)關(guān)節(jié),最大關(guān)節(jié)扭矩達(dá)到120N.m,可進(jìn)行高難度的動態(tài)動作。比行業(yè)整體便宜80%的售價(jià),再一次成為人形機(jī)器人領(lǐng)域的焦點(diǎn)。

“大部分人對社會的成本結(jié)構(gòu)一無所知。” 王興興說,“低成本的原因其實(shí)很簡單,以前很多學(xué)術(shù)或公司主要靠去買工業(yè)電機(jī),但它們很大、很貴、很重,所以做出來的效果也不太好。但我后來發(fā)現(xiàn),其實(shí)可以對航模電機(jī)加以改造,所以后來的電機(jī)驅(qū)動器全是我自己做的,可以做到很小很便宜,再結(jié)合最新的運(yùn)動控制技術(shù),就可以把整體性能做得非常好。其實(shí)整個(gè)社會大部分創(chuàng)新,是組合式創(chuàng)新,我們需要把各個(gè)行業(yè)的一些想法、技術(shù)組合做新的實(shí)踐,保證它是最前沿的,其實(shí)你就可以實(shí)現(xiàn)很多目標(biāo)。”

G1采用3指力控靈巧手,通過力位混合控制,能模擬人手的各種精準(zhǔn)操作

在2013年-2015年讀研究生期間,王興興沒什么資源和資金,卻做出了一款當(dāng)時(shí)特別火爆的產(chǎn)品XDog,拿到上海機(jī)器人設(shè)計(jì)大賽二等獎(jiǎng),這幾乎是他一個(gè)人從頭設(shè)計(jì)硬件、控制算法,自制驅(qū)動電機(jī)做出來的。相比之下波士頓動力的四足機(jī)器人,還是純液壓方案,雖然性能不錯(cuò),但是很大、很貴、很重,那時(shí)候純電機(jī)驅(qū)動方案還是比較領(lǐng)先的。

“在制造成本方面,我甚至認(rèn)為機(jī)器人其實(shí)與家里的電風(fēng)扇本質(zhì)是一樣的,都可以通過各種方法將成本做到極致。”王興興說,他認(rèn)為大部分產(chǎn)品都可以分為“材料成本+加工成本”,如果能優(yōu)化整個(gè)流程,找到合適的加工方法,其實(shí)可以省很多錢。

與王興興讀研期間做了XDog類似,鈦虎創(chuàng)始人易港也在大學(xué)時(shí)期,東拼西湊了4-5萬元,在大學(xué)宿舍里買了3D打印機(jī)和焊臺,自學(xué)3D建模和編程,模仿德國骨科隱形冠軍企業(yè)奧托博克的產(chǎn)品,制作出了一款假肢原型機(jī),并在中美創(chuàng)客大賽中獲獎(jiǎng)。

“做機(jī)器人,充滿了工程方面的問題,很多時(shí)候不是憑智商,而是看你對這個(gè)東西是不是真的感興趣,能不能去一點(diǎn)點(diǎn)鉆研,嘗試各種各樣的方法去解決技術(shù)難題,而且還要在一定的量產(chǎn)與成本可控的條件下。”易港說。如今,鈦虎主攻高性能一體化關(guān)節(jié)/執(zhí)行器,延展到輕量級協(xié)作機(jī)械臂、人形機(jī)器人/外骨骼、靈巧手等,其產(chǎn)品主打高扭矩密度、體積小、重量輕,具備無框電機(jī)、減速器、驅(qū)動器、編碼器自研設(shè)計(jì)能力,擁有機(jī)器人所需要的所有關(guān)節(jié),可以說是最為全面的產(chǎn)品線。

如果從更全局的角度來看,人形機(jī)器人最核心的是軟件+執(zhí)行器,軟件負(fù)責(zé)感知和決策,本質(zhì)上與自動駕駛類似,都需要先感知環(huán)境,然后做路徑規(guī)劃和決策。 而在硬件層面,也就是機(jī)械設(shè)計(jì)層面,最關(guān)鍵的就是執(zhí)行器,它相當(dāng)于機(jī)器人的“關(guān)節(jié)和肌肉”,讓機(jī)器人可以做出各種動作,尤其是人形機(jī)器人,它的執(zhí)行器數(shù)量要遠(yuǎn)遠(yuǎn)高于傳統(tǒng)工業(yè)機(jī)器人,也是人形機(jī)器人的設(shè)計(jì)難點(diǎn)和重要成本項(xiàng)。

如果我們按功能拆解特斯拉Optimus Gen2的BoM成本,按Morgan Stanley的分析

“按分部”與“按功能”劃分BoM成本

如果只看機(jī)器人的硬件成本,其中占比最大的就是一體化關(guān)節(jié), 它集成了伺服電機(jī)、驅(qū)動器、減速器和一些控制模塊等。在傳統(tǒng)工業(yè)機(jī)器人中,這些伺服電機(jī)、驅(qū)動器、減速器等部件并不需要太集成,它們可以在空間上各自分立,通過各種線纜和連接件進(jìn)行連接,體積重量大。但人形機(jī)器人不可能這么做,而一體化關(guān)節(jié)/執(zhí)行器的定位,就是在設(shè)計(jì)層面,將它們集成為一體化,實(shí)現(xiàn)更小體積、更輕重量、更強(qiáng)扭矩性能。

鈦虎的關(guān)節(jié)產(chǎn)品

人形機(jī)器人還有一個(gè)特殊的核心零部件——靈巧手。 它高度仿人手,是人形機(jī)器人執(zhí)行動作的最終零件,十分重要且復(fù)雜,面臨的最大難題是要在極小的空間內(nèi),驅(qū)動自由度極多、配備功率密度高、控制精度高的電機(jī),對其性能要求極高。

比如特斯拉Optimus機(jī)器人,和人手一樣同樣使用5個(gè)手指,擁有11個(gè)自由度,拇指采用雙電機(jī)驅(qū)動彎曲和側(cè)擺,其它四指各用一個(gè)電機(jī)帶動。電機(jī)采用蝸桿傳動機(jī)構(gòu)的目的,與腿部直線伺服如出一轍,采用機(jī)構(gòu)自鎖降低能耗。為追求形態(tài)美觀及自適應(yīng)性,手指采用拉線的傳動機(jī)構(gòu),擁有負(fù)重20磅(9KG),和自適應(yīng)抓取(能夠抓取不同形狀、尺寸的物體)的能力,可完成搬運(yùn)、澆花等動作。這基本上就復(fù)制了人類手掌的功能設(shè)計(jì)。

4年前,易港還自主研發(fā)了一款靈巧手,“我也沒想到這款產(chǎn)品在今天那么受歡迎,如今回頭看,其實(shí)這是現(xiàn)在三大主流結(jié)構(gòu)中的一個(gè),我們當(dāng)時(shí)為了做假肢,結(jié)果相當(dāng)于開創(chuàng)了一個(gè)結(jié)構(gòu)派系。”

在靈巧手的傳動結(jié)構(gòu)中,有奧托博克式的直線推桿方案,這個(gè)方案在2008年就實(shí)現(xiàn)了量產(chǎn)。另一種主流結(jié)構(gòu)是拉繩式,類似于模仿人體的筋腱,拖一根繩子來傳動。還有一種鈦虎的專利,基于平行齒輪、錐齒,再加上三連桿的結(jié)構(gòu)。“如果從美觀度、抗沖擊性、裝配難易程度、成本等各個(gè)方面來看,第三種方案有其優(yōu)勢。”易港認(rèn)為。

鈦虎的靈巧手產(chǎn)品

機(jī)器人上半身的發(fā)展,直接決定了它現(xiàn)在能做什么。 當(dāng)然靈巧手的設(shè)計(jì)和應(yīng)用并不容易,在這項(xiàng)技術(shù)成熟之前,采取夾爪(“兩爪”、“三爪”)的方案也未嘗不可,需要有選擇性。比如銀河通用在便利店場景的實(shí)際應(yīng)用中,給機(jī)器人裝上了吸盤和夾爪兩種末端執(zhí)行器,機(jī)器人可以自主決策需要用哪個(gè),例如在需要拿礦泉水瓶時(shí),夾爪就可以完成任務(wù),但在抓取零食時(shí),吸盤會更合適。

同時(shí),銀河通用還在針對靈巧手展開研究,因?yàn)槊鎸^寬(夾爪的夾距有限)或光滑的物體,以及柔性物體(比如晾曬衣服,需要用衣架把衣服插起來)、復(fù)雜場景(擰瓶蓋)時(shí),靈巧手或許才是終極解決方案。

相比于AI大模型,在人形機(jī)器人領(lǐng)域,硬件的快速迭代也有很重要的影響。 拿電動車產(chǎn)業(yè)舉例子,傳統(tǒng)燃油車至少需要三年時(shí)間的研發(fā)、七年時(shí)間的全球銷售,才能收回成本開始盈利。但現(xiàn)在中國的智能電動車企業(yè),已經(jīng)能做到兩年就迭代一個(gè)平臺,因?yàn)槿绻荒茉趦赡曛畠?nèi)迭代一個(gè)平臺的話,這個(gè)車型無論是在智能化方面,還是在續(xù)航里程方面就都跟不上。在光伏產(chǎn)業(yè)也類似,每隔幾年就會有一個(gè)重要的技術(shù)迭代。一個(gè)新產(chǎn)線如果不能在兩年之內(nèi)實(shí)現(xiàn)產(chǎn)能交付,基本上也會被淘汰。

而機(jī)器人硬件水平每迭代一次,很多核心性能都會躍升一個(gè)臺階,而這恰恰是中國供應(yīng)鏈的優(yōu)勢。 比如減速器、電機(jī)的升級,對精度、力控都有決定性影響,這能極大升級機(jī)器人的可操作性。一旦研發(fā)成熟,到達(dá)制造環(huán)節(jié),根據(jù)大多數(shù)制造業(yè)的規(guī)律,每當(dāng)產(chǎn)量翻倍,成本將會降低10-30%,這在光伏和鋰電池行業(yè)中,均有所體現(xiàn)。

“展望未來,整個(gè)機(jī)器人產(chǎn)業(yè)鏈,很可能比現(xiàn)在的汽車產(chǎn)業(yè)鏈更高一個(gè)量級。” 易港說。

三、“人形機(jī)器人比自動駕駛更缺數(shù)據(jù)”

真機(jī)數(shù)據(jù)、仿真數(shù)據(jù)與機(jī)器人的數(shù)據(jù)饑渴癥

“數(shù)據(jù)是AI下一個(gè)發(fā)展階段的最大助推力,但真實(shí)世界的數(shù)據(jù)是遠(yuǎn)遠(yuǎn)不夠的,這需要仿真數(shù)據(jù)來彌補(bǔ)。” 光輪智能聯(lián)合創(chuàng)始人兼COO楊海波說,“我們認(rèn)為很快就能找到Scaling Law,那么機(jī)器人也將很快變成數(shù)據(jù)驅(qū)動,這也是我們做仿真合成數(shù)據(jù)的初衷。”

GPT-3.5之所以能產(chǎn)生劃時(shí)代的突破,核心在于Scaling law,而這離不開數(shù)以百億的訓(xùn)練數(shù)據(jù)。訓(xùn)練AI大模型的數(shù)據(jù)在互聯(lián)網(wǎng)上容易獲取,但對于機(jī)器人來說,直接可用的數(shù)據(jù)幾乎為零。

能否獲得高質(zhì)量且足夠便宜的數(shù)據(jù),是當(dāng)下制約機(jī)器人發(fā)展的瓶頸,也是拉開公司之間競爭的重要手段。 前車之鑒是Everyday Robots,它曾是谷歌的明星獨(dú)立項(xiàng)目,但在今年2月被谷歌因成本控制而解散,并入谷歌其他部門。

造成Everyday Robots成本高昂的一個(gè)重要原因,就是數(shù)據(jù)采集成本過于昂貴。OpenAI曾經(jīng)也有一個(gè)機(jī)器人部門,但后來放棄了,問題也出在數(shù)據(jù)收集上。

為什么采集成本這么高?主要是因?yàn)镋veryday Robots基于真實(shí)環(huán)境來收集數(shù)據(jù)。谷歌為了訓(xùn)練PaLM-E,用了13臺機(jī)器人,收集了17個(gè)月,才拿到足夠的數(shù)據(jù)量,如果是在更復(fù)雜的工業(yè)場景,數(shù)據(jù)采集成本會更高。

機(jī)器人的遙操作

“目前對于人形機(jī)器人來說,主流的數(shù)據(jù)獲取手段分為兩種:一種是真實(shí)數(shù)據(jù),另一種是仿真數(shù)據(jù)。” 楊海波認(rèn)為。

真實(shí)數(shù)據(jù)就是構(gòu)建一個(gè)采集數(shù)據(jù)的基地,在里邊搭建相關(guān)設(shè)備,比如遙操作、動作捕捉等等,比如家庭場景里的做飯,捕捉方方面面的動作數(shù)據(jù),然后再對合并數(shù)據(jù)進(jìn)行一些泛化,以及清洗,最終給到模型。

仿真數(shù)據(jù)則是完全在模擬器中進(jìn)行的。首先用虛擬建模的方式,把環(huán)境場景搭建起來,然后再把機(jī)器人虛擬化放進(jìn)去,形成一個(gè)動態(tài)的場景。這里面的一切物體,建模都要盡量接近真實(shí),比如需要做一個(gè)蘋果,那就要制作出大量不同的具體形態(tài),比如不同的光照條件、不同的位置條件、不同的摩擦力情況等等。

從這樣動態(tài)場景提取出來的數(shù)據(jù),其實(shí)是一張張類似于“圖片”的數(shù)據(jù)集,在這些“圖片”上也需要補(bǔ)充針對性的標(biāo)注,再給到機(jī)器人公司做算法訓(xùn)練。這個(gè)訓(xùn)練過程,就有點(diǎn)像特斯拉在訓(xùn)練FSD時(shí),拿人類司機(jī)的真實(shí)駕駛視頻訓(xùn)練。

仿真數(shù)據(jù)最核心的要求,就是盡可能的接近真實(shí),真實(shí)度、泛化度都是重要指標(biāo)。 如何符合物理規(guī)律,是目前的一個(gè)難點(diǎn),比如一個(gè)物體是軟還是硬,這就需要更復(fù)雜的參數(shù)設(shè)計(jì)。

由于仿真數(shù)據(jù)多數(shù)是通過視覺,訓(xùn)練過程往往是,首先需要判斷出來這個(gè)物體是什么材質(zhì),比如是個(gè)杯子,然后再去設(shè)計(jì)多大的力量,這個(gè)過程也可以加入大語言模型的能力。但這與在機(jī)器人的傳動結(jié)構(gòu)中,加一個(gè)力觸覺是不同的技術(shù)方向。

所以,仿真數(shù)據(jù)與遙操作各有優(yōu)劣 。遙操作的優(yōu)勢在于,在將采集到的數(shù)據(jù)用于訓(xùn)練機(jī)器人后,這一項(xiàng)任務(wù)的成功率會很高。但劣勢也很明顯,機(jī)器人的能力缺乏泛化性。

比如在特斯拉訓(xùn)練機(jī)器人分揀電池的例子中,就是通過人類帶著VR眼鏡,去遙控操作機(jī)器人采集而來的。通過這種方法訓(xùn)練出來的機(jī)器人,幾乎只會重復(fù)遙操作時(shí)的動作,比如把一個(gè)電池放到三乘三的盒子里,但當(dāng)你把電池?fù)Q成礦泉水瓶,同時(shí)將盒子換成更大的四乘六時(shí),機(jī)器人就不知道怎么辦了,這時(shí)候就又需要重新進(jìn)行遙操作再去訓(xùn)練。在沒有形成海量數(shù)據(jù)的時(shí)候,每做一個(gè)新動作都非常吃力,數(shù)據(jù)采集成本很高,并且難以在短時(shí)間獲取大量數(shù)據(jù)。

與遙操作對比,仿真數(shù)據(jù)的優(yōu)劣勢幾乎相反。 首先可以用低成本生產(chǎn)海量數(shù)據(jù),同時(shí)機(jī)器人在經(jīng)過訓(xùn)練以后,能力是泛化的,因?yàn)榭梢苑抡嬷圃煲幌盗兴枰膱鼍昂徒换?,以使機(jī)器人可以解決各種問題。

當(dāng)然,仿真數(shù)據(jù)的劣勢也很明顯,問題主要出在仿真還不夠接近真實(shí),當(dāng)把通過仿真數(shù)據(jù)訓(xùn)練的機(jī)器人用在真實(shí)場景中時(shí),存在一定的失敗率,比如在抓取任務(wù)中,因?yàn)楣庹?、環(huán)境等各種因素的改變,機(jī)器人可能以為抓到了,但其實(shí)沒抓到。

提高數(shù)據(jù)規(guī)模,嘗試將大模型訓(xùn)練中的Scaling Law,應(yīng)用在機(jī)器人仿真訓(xùn)練數(shù)據(jù)中,可能是準(zhǔn)確率不足的解決之道。

在王鶴看來,他在一開始嘗試用仿真數(shù)據(jù)時(shí),也遭遇了準(zhǔn)確率不足的問題。不過他很快意識到,當(dāng)時(shí)只用了一個(gè)百萬級的數(shù)據(jù)集,如果把規(guī)模擴(kuò)大會怎樣?

“我們自己的實(shí)驗(yàn)發(fā)現(xiàn),比如在抓取這個(gè)任務(wù)上,在用靈巧手抓取沒有見過的、隨機(jī)亂放的物體時(shí),在有十億次抓取數(shù)據(jù)的情況下,機(jī)器人的成功率能到 86%,如果數(shù)據(jù)量縮到萬分之一,也就是 10 萬次抓取時(shí),成功率就只有 58%。這說明具身智能也有清晰的 scaling law,它對數(shù)據(jù)有更大渴求。”王鶴說。

“傳統(tǒng)的仿真是以測試為中心的,而為具身智能服務(wù)的仿真,則是需要以訓(xùn)練為中心。”光輪智能CEO謝晨說,他認(rèn)為好的仿真數(shù)據(jù)首先要有自我真實(shí)性、效用性評測能力,如果沒有這些,仿真數(shù)據(jù)也很難讓客戶的算法有所提升。謝晨曾在英偉達(dá)負(fù)責(zé)自動駕駛仿真,國際首創(chuàng)將生成式AI融入仿真,從0-1開發(fā)落地仿真數(shù)據(jù),后選擇回國創(chuàng)立光輪智能。

“仿真數(shù)據(jù)不會取代真實(shí)數(shù)據(jù),而是放大它。” 他認(rèn)為終極的Data for AI,會是真實(shí)的人的示范數(shù)據(jù),與仿真數(shù)據(jù)能力的乘積。

==========================

過去10年,AI給太多行業(yè)帶來過希望和失望。而今天的人形機(jī)器人,正越來越逼近臨界點(diǎn)。 雖然機(jī)器人至今沒有清晰的產(chǎn)品形態(tài),但經(jīng)緯創(chuàng)投看到每一家機(jī)器人創(chuàng)業(yè)公司都在嘗試各自的應(yīng)用場景,像已經(jīng)投資的四家機(jī)器人軟硬件一體化公司(宇樹科技、智元機(jī)器人、銀河通用、星塵智能),再配合著產(chǎn)業(yè)鏈上游的核心一體化關(guān)節(jié)(鈦虎機(jī)器人)、仿真數(shù)據(jù)(光輪智能),都在不同場景下有非常好的應(yīng)用。

這一波人形機(jī)器人公司的短期目標(biāo),都是快速占領(lǐng)各自的應(yīng)用場景,誰先把一個(gè)細(xì)分場景做好,積累出足夠多的數(shù)據(jù),就能建立護(hù)城河,再去拓展新領(lǐng)域,最終走向通用化。

而機(jī)器人的發(fā)展離不開硬件。與歐美市場對比,經(jīng)緯創(chuàng)投看到國內(nèi)很多初創(chuàng)公司的硬件迭代能力,比海外要快很多,成本控制能力更好,在某些硬件細(xì)節(jié)方面超越了海外同行。

全球化幾乎是中國通用機(jī)器人公司的必選戰(zhàn)略,且與電動車行業(yè)不同,其在全球化中遇到的障礙會更小。 其中一個(gè)原因是,幾乎沒有一個(gè)國家具備有規(guī)模的機(jī)器人產(chǎn)業(yè),此時(shí)出海不會沖擊當(dāng)?shù)氐漠a(chǎn)業(yè)結(jié)構(gòu),只要產(chǎn)品質(zhì)量和應(yīng)用體驗(yàn)足夠好,出海溢價(jià)可能達(dá)到國內(nèi)的5倍以上,這將為中國通用機(jī)器人企業(yè)提供廣闊的國際市場。

人形機(jī)器人能發(fā)展到今天的位置,來之不易。“我記得在2016年的時(shí)候,那時(shí)我還在百度,有一次參加完一個(gè)NLP的會議,結(jié)束之后充滿了挫敗感,感覺好像這輩子都看不到真正的應(yīng)用,你也不知道那時(shí)的投入到底是不是對的。”星塵創(chuàng)始人來杰回憶,“但我也經(jīng)常反思,從我過去十幾年對未來的預(yù)判里,我發(fā)現(xiàn)AI和機(jī)器人整體的發(fā)展速度,又是大大超出我的預(yù)期了。短期內(nèi)你永遠(yuǎn)會看到很多困難,但這么多聰明的頭腦,其實(shí)在解決一個(gè)又一個(gè)問題,產(chǎn)生了一個(gè)又一個(gè)技術(shù)突破,就像有一只巨大的手在促使這個(gè)行業(yè)往上升,這給我?guī)砗艽蟮哪芰浚屛乙恢眻?jiān)守在這個(gè)行業(yè)里。”

“技術(shù)是一個(gè)日新月異的事兒,你無論是在做你的老本行,還是做一件新事,你都有可能明天就被更新的技術(shù)給‘卷’了,AI和機(jī)器人行業(yè)尤其如此。與其說按兵不動,還不如主動的去創(chuàng)造變化。” 光輪智能創(chuàng)始人兼CEO謝晨說,“所以在我看來,現(xiàn)在的創(chuàng)業(yè)成本其實(shí)比之前要低太多了,因?yàn)楝F(xiàn)在不變的成本太高了。

申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)文章

熱門排行

信息推薦