對(duì)話(huà)稚暉君:具身智能創(chuàng)業(yè)窗口轉(zhuǎn)瞬即逝,打擂瞄準(zhǔn)偶像馬斯克

量子位 2023/9/6 14:12:26 責(zé)編:汪淼

馬斯克是我偶像,很榮幸能有機(jī)會(huì)在這個(gè)賽道和他同臺(tái)競(jìng)技。

說(shuō)出這話(huà)的稚暉君,十分清楚他離開(kāi)華為創(chuàng)業(yè)要做什么:

對(duì)標(biāo)馬斯克,做通用機(jī)器人,競(jìng)品擎天柱,既面向星辰大海也奔著商用落地,產(chǎn)品目標(biāo)最終定價(jià)不超過(guò) 20 萬(wàn)人民幣。

換成最流行的說(shuō)法,他在做大模型和機(jī)器人結(jié)合的具身智能。

想法始于他學(xué)生時(shí)期的探索。

早在他還沒(méi)成B站up 主的 2015 年,學(xué)生身份的稚暉君就參與組織了一群打比賽認(rèn)識(shí)的小伙伴,準(zhǔn)備“做個(gè)人吧”:

當(dāng)時(shí),普通人對(duì) AI 的切身感受還是人臉識(shí)別或美顏這類(lèi)應(yīng)用,大模型概念還沒(méi)誕生,“要讓機(jī)器人具備像人一樣的思考和行動(dòng)能力”這個(gè)命題,似乎離實(shí)現(xiàn)還有點(diǎn)過(guò)于遙不可及。

因此,畢業(yè)后的稚暉君沒(méi)繼續(xù)只在機(jī)器人身上折騰,而是選擇進(jìn)入 AI 賽道,成為大廠(chǎng)的 AI 算法工程師,在軟件算法領(lǐng)域干了好幾年。

直到 ChatGPT 石破天驚,大模型智能涌現(xiàn),OpenAI 證明大力堆疊真的可以產(chǎn)生質(zhì)變。

回看自己的機(jī)器人夢(mèng)想,稚暉君又看到了這條路的可行性。所以,離開(kāi)菊廠(chǎng),投身創(chuàng)業(yè)。

于是半年時(shí)間,他帶著團(tuán)隊(duì)拿出了一套有模有樣的原型機(jī)。

8 月發(fā)布會(huì)上,被稚暉君自豪請(qǐng)上臺(tái)的自家機(jī)器人步伐穩(wěn)健,行走效果可以比肩去年馬斯克擎天柱 Optimus 的初亮相。

就是憑借這樣一款作品,他的初創(chuàng)公司智元機(jī)器人,在投資者冷靜但賽道又火爆的當(dāng)下,成為了少數(shù)幾個(gè)拿到 VC 和大廠(chǎng)戰(zhàn)投重金押注的標(biāo)的。

發(fā)布會(huì)結(jié)束后和量子位的會(huì)面,他表露出對(duì)發(fā)布會(huì)、團(tuán)隊(duì)和整體進(jìn)展還算滿(mǎn)意,也表露出沿著這條路往未來(lái)走的信心。

還在他的工位前告訴我們,他的桌面壁紙已經(jīng)換了很久了:

全身心投入人形機(jī)器人創(chuàng)業(yè),他會(huì)怎么看待自己公司的高估值?智元的下一步規(guī)劃是什么?商業(yè)化落地場(chǎng)景將在何方?創(chuàng)業(yè)過(guò)后這個(gè)百大 up 主的B站賬號(hào)咋辦?

量子位問(wèn),稚暉君答,一切都在這次對(duì)話(huà)中。

再晚點(diǎn),也許就不用出來(lái)創(chuàng)業(yè)了

稚暉君算是最早感知到這一波大環(huán)境變化,并且付諸實(shí)踐的那撥人。

外界看來(lái),他去年年底宣布創(chuàng)業(yè)時(shí),機(jī)器人和大模型都是科技領(lǐng)域的大熱議題,尤其是 ChatGPT 剛出道,帶給大家暴力美學(xué)的震撼。

那個(gè)時(shí)間節(jié)點(diǎn),賽道遠(yuǎn)沒(méi)有今天擁擠。技術(shù)從業(yè)者聞風(fēng)而動(dòng),不算意外。但稚暉君第一次透露了他當(dāng)時(shí)的心態(tài):

要是選擇再晚一點(diǎn),也許就沒(méi)必要出來(lái)創(chuàng)業(yè)做這事了。

為了解釋這句話(huà),他給競(jìng)品特斯拉擎天柱拉出一條時(shí)間線(xiàn):

去年 9 月展示原型機(jī),今年 5 月展示識(shí)別周?chē)h(huán)境存儲(chǔ)記憶和準(zhǔn)確控制物品拿放的能力,7 月表示已經(jīng)生產(chǎn) 10 臺(tái),預(yù)計(jì) 11 月進(jìn)行行走測(cè)試,明年在特斯拉自己的工廠(chǎng)進(jìn)行實(shí)用性測(cè)試。

動(dòng)作很快,實(shí)際效果也哇噻。

馬斯克,一個(gè)從不按套路出牌的男人,自從宣布入局機(jī)器人賽道,就用火箭般的速度推進(jìn)量產(chǎn)節(jié)奏,在他的口中,未來(lái)機(jī)器人的數(shù)量會(huì)超過(guò)人類(lèi)。

稚暉君看到這一切,心潮澎湃。與此同時(shí),他也觀(guān)察到機(jī)器人和大模型結(jié)合的潛力。

微軟的 ChatGPT for Robotics,谷歌的 Palm-E、RT-1、RT-2,還有 VoxPoser、RoboCat 等眾多工作,都在嘗試把圖像語(yǔ)言大模型的能力和知識(shí)遷移到機(jī)器人領(lǐng)域。

其中轟動(dòng)最大的谷歌 RT(Robot Transformer)系列,在論文闡述和 demo 視頻中,都展示出抓取領(lǐng)域非常優(yōu)秀的泛化能力。

要做到這一點(diǎn)并不容易,核心門(mén)檻,在于數(shù)據(jù)。光是訓(xùn)練它,谷歌就花了 17 個(gè)月,收集 13 臺(tái)機(jī)器人的 13 萬(wàn)條機(jī)器人真實(shí)數(shù)據(jù) —— 這大概也是 RT 模型開(kāi)源而數(shù)據(jù)暫時(shí)閉源的一個(gè)小小心機(jī)。

稚暉君坦言,雖然也從一開(kāi)始就在準(zhǔn)備自家的動(dòng)作任務(wù)數(shù)據(jù)集,但目前能用來(lái)訓(xùn)練自家產(chǎn)品的數(shù)據(jù),“只有上千”。

一對(duì)比,差距之大,顯而易見(jiàn)。

數(shù)字上的直觀(guān)差距,足以解釋稚暉君對(duì)量子位說(shuō)的,“當(dāng)前節(jié)點(diǎn),遠(yuǎn)征 A1 最需要提升的地方,是數(shù)據(jù)帶來(lái)的 AI 泛化能力”,足以解釋這為什么“會(huì)是一個(gè)相對(duì)長(zhǎng)期的布局”。

也能部分解釋發(fā)布機(jī)器人時(shí),直播間網(wǎng)友對(duì)展示時(shí)間較短、展示能力不如想象炫酷的疑問(wèn)。

“我覺(jué)得要想達(dá)到真正理想的實(shí)用效果,還是需要大量的真實(shí)場(chǎng)景數(shù)據(jù)。我們時(shí)間太短了,這方面還沒(méi)有做夠積累?!敝蓵熅缡钦f(shuō)。

競(jìng)爭(zhēng)對(duì)手不會(huì)給你多留喘息的機(jī)會(huì)。正因如此,稚暉君表示團(tuán)隊(duì)接下來(lái)的工作重心之一,是建立自己的數(shù)據(jù)中心。計(jì)劃未來(lái)幾個(gè)月內(nèi)落地臨港,主要目的是搭建場(chǎng)景和仿真平臺(tái),填補(bǔ)運(yùn)動(dòng)數(shù)據(jù),提高泛化能力。

數(shù)據(jù)是如何生成的?稚暉君的總結(jié)有三:

  • 監(jiān)督學(xué)習(xí)數(shù)據(jù)??咳俗鍪痉?,控制機(jī)器人做分揀等各種操作,在過(guò)程中采集真實(shí)數(shù)據(jù)。

  • 仿真數(shù)據(jù)。需要自己搭建仿真平臺(tái),有一個(gè)比較好的渲染引擎、物理引擎,以及比較好的人機(jī)交互流程裝置。

  • AIGC 生成數(shù)據(jù)。主要是真實(shí)數(shù)據(jù)的補(bǔ)充擴(kuò)充,是低成本數(shù)據(jù)增強(qiáng)的一個(gè)重要手段。

建數(shù)據(jù)中心是工作重點(diǎn)之一,另一個(gè)重點(diǎn)則是對(duì)硬件結(jié)構(gòu)進(jìn)行迭代重構(gòu),加強(qiáng)機(jī)器人本體運(yùn)動(dòng)性能。按稚暉君的說(shuō)法,團(tuán)隊(duì)會(huì)用做軟件敏捷開(kāi)發(fā)的速度和效率去迭代硬件。

這是非常顛覆并且有挑戰(zhàn)性的一件事情。

此處送上小八卦一則。

今年 4 月,稚暉君在投稿B站的自制雙足機(jī)器人哪吒,并在視頻結(jié)尾表示,“如果不出意外的話(huà),哪吒會(huì)成為發(fā)布會(huì)的彩蛋”。

當(dāng)然了,按照經(jīng)典劇情,不出意外的話(huà)果然就出意外了:D,哪吒并沒(méi)有上發(fā)布會(huì)。

就是它 ↓

量子位幫大家打聽(tīng)到,原因是哪吒上面用到的幾個(gè)電機(jī)被供應(yīng)商鴿了,3 月下的訂單 7 月才收到貨,導(dǎo)致開(kāi)發(fā)時(shí)間不夠。

稚暉君說(shuō)道:“后面有空還是會(huì)繼續(xù)完成這個(gè)項(xiàng)目的,鴿王有坑必填。”

半年成獨(dú)角獸,背后還有另一條商業(yè)化隱線(xiàn)

讀到這里大概能察覺(jué),智元人形機(jī)器人項(xiàng)目的機(jī)器人本體,還需要迭代幾版;而 AI 能力受限于當(dāng)前訓(xùn)練數(shù)據(jù)不足,也還需要積累一段時(shí)間。

總體來(lái)說(shuō),產(chǎn)品離落地似乎還有一段距離的樣子。

然而就是這樣一個(gè)創(chuàng)業(yè)項(xiàng)目,半年估值直奔 10 億美元開(kāi)外。這合理嗎???

聽(tīng)到這個(gè)問(wèn)題,稚暉君并沒(méi)有直接回答到底“值或不值”,只是回答道,其實(shí)融資思路也不是一開(kāi)始就定型的,期間參考了很多行業(yè)大佬和前輩的建議。

團(tuán)隊(duì)最初的設(shè)想很單純,就是先做出 Demo,然后順其自然地提高估值。

“但創(chuàng)業(yè)顯然不是那么單純的事情,大經(jīng)濟(jì)環(huán)境不算景氣的背景下,要整合資源、吸引人才,無(wú)一不需資本的背書(shū)。”稚暉君表示,“這并不是一件壞事?!?/p>

高效實(shí)干,快速調(diào)整思路和策略,以結(jié)果導(dǎo)向推進(jìn)事情,這是稚暉君的行事風(fēng)格。他的風(fēng)格最終也決定了智元,至少是智元研發(fā)團(tuán)隊(duì)的工作風(fēng)格。

技術(shù)團(tuán)隊(duì)每個(gè)早期成員都是他親自面進(jìn)公司的,30 多號(hào)人基本都是自來(lái)卷,卷得一天睡五、六個(gè)小時(shí)的稚暉君都心生感慨:

之前大家都覺(jué)得我是時(shí)間管理大師,現(xiàn)在我可以很慚愧地講,我們公司像我這么肝的,還有一堆……

整個(gè)交流過(guò)程中,量子位關(guān)注到他強(qiáng)調(diào)了兩個(gè)關(guān)鍵詞,“壓成本”和“應(yīng)用場(chǎng)景”。

這倆是目前整個(gè)賽道的普遍痛點(diǎn)。團(tuán)隊(duì)如何解決痛點(diǎn),必然是他們獲得高瓴、鼎暉、經(jīng)緯、高榕、藍(lán)馳、BV 百度風(fēng)投等頭部資方重金押注的關(guān)鍵。

來(lái)聽(tīng)聽(tīng)稚暉君的看法 ——

先說(shuō)壓低成本。現(xiàn)在智元對(duì)外喊出的口號(hào)是,人形機(jī)器人落地控價(jià) 20 萬(wàn)元內(nèi)。

這約與馬斯克放話(huà)的 7 萬(wàn)美元售價(jià)持平,而國(guó)內(nèi)類(lèi)似人形機(jī)器人的售價(jià)水平在 50 萬(wàn) RMB 上下,大家喜聞樂(lè)見(jiàn)的波士頓動(dòng)力 Atlas,成本則在 200 萬(wàn)美元。

稚暉君直言不諱:“不是我們希望做到 20 萬(wàn)元,而是如果做不到 20 萬(wàn)元的價(jià)格,就根本沒(méi)辦法實(shí)現(xiàn)商業(yè)落地。”

至于為什么是 20 萬(wàn),他表示,以新能源汽車(chē)制造業(yè)為例,20 萬(wàn)的機(jī)器人替代部分人工崗位的話(huà),可以做到 1~2 年的投資回報(bào)期。

稚暉君也大致描述了一下智元為量產(chǎn)控制成本的方法。

一是盡最大可能采取自研路線(xiàn),降本增效

如關(guān)節(jié)電機(jī)和靈巧手等部件占硬件成本一半以上,而且市場(chǎng)現(xiàn)有供應(yīng)還存在特性不匹配的情況,自主研發(fā)核心部件能讓成本降低一半以上。

二是采用類(lèi)似特斯拉造車(chē)的部分思路,用軟件和算法補(bǔ)硬件方面的精度要求,降低硬件成本。

如放棄諧波減速器而選擇行星減速器,靈巧手上面使用的視覺(jué)閉環(huán)方案等等。

再說(shuō)落地應(yīng)用場(chǎng)景。稚暉君表示,預(yù)計(jì)明年下半年商業(yè)化落地,先應(yīng)用在工業(yè)制造領(lǐng)域,家庭等服務(wù)型應(yīng)用場(chǎng)景都往后排,現(xiàn)階段突出一個(gè)“場(chǎng)景相對(duì)簡(jiǎn)單,任務(wù)相對(duì)復(fù)雜”。

“這條路線(xiàn)是邊走邊摸索出來(lái)的,還是最初就定下的目標(biāo)?”

“團(tuán)隊(duì)還不到 10 個(gè)人時(shí)候的最早期,我們就基本敲定了這條落地方案?!蓖瑫r(shí)表示:

很多人會(huì)拿我們或者特斯拉的機(jī)器人去跟波士頓動(dòng)力對(duì)比,其實(shí)是不合適的。

奔著商業(yè)化落地去做,正確的邏輯應(yīng)該是:在滿(mǎn)足應(yīng)用場(chǎng)景功能和性能需求的前提下,以盡量最低的成本去實(shí)現(xiàn)方案。

所以能走著去搬東西的場(chǎng)景下,就沒(méi)有必要非得讓它有能力后空翻。

現(xiàn)在,這條半年前定下的路線(xiàn),最終落地跡象愈發(fā)明晰。

最新工商動(dòng)態(tài)顯示,比亞迪入股了智元下屬公司,加上此前量子位從智元方面獲悉,公司已與國(guó)產(chǎn)頭部智能汽車(chē)廠(chǎng)商和 3C 廠(chǎng)商等密切洽談。

由此在官宣前推測(cè)一波,遠(yuǎn)征 A1 在工業(yè)制造領(lǐng)域的首發(fā)打工地點(diǎn),不出意外,就是比亞迪汽車(chē)工廠(chǎng)。

除成本和落地場(chǎng)景這兩點(diǎn)外,隨著團(tuán)隊(duì)對(duì)具身智能的愈發(fā)深入,智元手里還握了些其它差異化的牌。

比如,量子位就從稚暉君口中挖到公司商業(yè)化的一條隱線(xiàn) ——

如果說(shuō)通用人形機(jī)器人是商業(yè)落地的中長(zhǎng)期計(jì)劃和最終愿景,那么在邁向這個(gè)終點(diǎn)的過(guò)程中,團(tuán)隊(duì)也會(huì)有一些“沿途下蛋”的產(chǎn)品形態(tài)

具體是什么形態(tài)呢?稚暉君一如既往地口風(fēng)很?chē)?yán),賣(mài)了個(gè)關(guān)子,但還是有所透露。

他聽(tīng)到過(guò)很多次疑問(wèn),問(wèn)為什么要把機(jī)器人做成人類(lèi)形態(tài),相比于其他專(zhuān)用形態(tài)(機(jī)械臂、輪式),是不是費(fèi)力不討好?

針對(duì)這個(gè)問(wèn)題,稚暉君有兩方面思考。

一方面,這會(huì)是一個(gè)長(zhǎng)期投入的過(guò)程,大家不要高估短期的價(jià)值,也不要低估長(zhǎng)期的價(jià)值。人形是智元以終為始、面向終極形態(tài)邁出的第一步,這也是為什么給這款機(jī)器人取名叫“遠(yuǎn)征”。

另一方面,選擇做這件事情(人形)并不是因?yàn)樗菀?,反而是因?yàn)樗芾щy。

通用人形機(jī)器人牽涉到最全面的機(jī)器人技術(shù)棧,它的實(shí)現(xiàn)過(guò)程中各種前沿技術(shù)(視覺(jué)伺服、MPC、SLAM、LLM / VLM、中間件等各種技術(shù)的自研和優(yōu)化)的沿途下蛋,可以催生很多創(chuàng)新性專(zhuān)用形態(tài)的機(jī)器人產(chǎn)品,“大家未來(lái)會(huì)陸續(xù)看到這些成果的”。

“網(wǎng)友們放心,B站賬號(hào)不會(huì)變成公司專(zhuān)用營(yíng)銷(xiāo)號(hào)”

過(guò)人的技術(shù),漂亮的簡(jiǎn)歷,大廠(chǎng)的光環(huán),百萬(wàn)計(jì)的粉絲,又恰逢新技術(shù)爆發(fā)周期:大模型、具身智能、AIGC…… 攢局創(chuàng)業(yè)后,出任團(tuán)隊(duì) CTO,帶領(lǐng)公司迅速壯大,半年時(shí)間,公司人數(shù)近百,市場(chǎng)估值超 10 億美元。

一系列附帶光環(huán)的故事砸過(guò)來(lái),圍觀(guān)者不由得在這個(gè)時(shí)候,重新審視稚暉君。他又會(huì)怎樣定義現(xiàn)在的自己?量子位把這個(gè)問(wèn)題拋給了稚暉君本人。

稚暉君倒沒(méi)表現(xiàn)出什么遲疑,只是說(shuō),他給自己的定位并沒(méi)有太大變化。

首先是個(gè)工程師,其次才是創(chuàng)業(yè)者

我可能屬于一個(gè)非典型創(chuàng)業(yè)者,做這些事情的動(dòng)力都是基于個(gè)人興趣,也很幸運(yùn)取得了一些小成就:早期在大廠(chǎng)里發(fā)光發(fā)熱,頂了一些光環(huán),又在網(wǎng)上獲得了不小的知名度,然后又突然跑出來(lái)創(chuàng)業(yè)。一開(kāi)始身邊的人都覺(jué)得挺震驚的。

我一直認(rèn)為自己是一個(gè)樂(lè)觀(guān)主義者。

還有句話(huà),他說(shuō)得毫不猶豫 ——

“既然人生沒(méi)有后悔的機(jī)會(huì),那么就堅(jiān)持相信自己到現(xiàn)在的每一步,都是我做的最正確的選擇?!?/p>

“每一步都是正確的選擇”,可能也包括不少人為之唏噓的離開(kāi)華為,脫離“天才”tag。

在量子位面前,他沒(méi)有掩飾曾經(jīng)在華為工作取得榮譽(yù)的感激,也提到:

老東家在做一些很偉大的事情,但是像機(jī)器人這樣面向更未來(lái)領(lǐng)域的探索,可能更適合在小的創(chuàng)新團(tuán)隊(duì)中去做。

希望自己能繼承‘散是滿(mǎn)天星’的優(yōu)良傳統(tǒng)吧。

然后,又像他常常做的那樣,再次強(qiáng)調(diào)自己既不是天才,也不再是少年。

能感受到,稚暉君更希望外界把對(duì)他的關(guān)注從一個(gè)具體的 tag,轉(zhuǎn)移到他想做的事情本身。

有趣的是,他又勸大伙兒不要太早創(chuàng)業(yè)?!皩?duì)于學(xué)生來(lái)說(shuō),建議還是要先工作幾年,接受一下社會(huì)的毒打,才對(duì)社會(huì)、公司運(yùn)作的方式有一個(gè)清晰的了解哈哈?!?/p>

當(dāng)時(shí)在發(fā)布會(huì)上,他也表達(dá)了自己的觀(guān)點(diǎn):檢驗(yàn)一家科技公司價(jià)值最有效的方式之一,就看它能否實(shí)現(xiàn)商用落地

不然技術(shù)做得再好也容易陷入自嗨。

聊到這兒,稚暉君表露心跡,既然正兒八經(jīng)創(chuàng)業(yè)了,項(xiàng)目也不能單純按照個(gè)人的奇思妙想隨意自嗨了。組了人、拿了錢(qián),就需要在公司戰(zhàn)略發(fā)展方向上多做考慮,“要為公司這么多兄弟姐妹們負(fù)責(zé)”。

但顯然,他自有自嗨處:B站。

“個(gè)人號(hào)?。窟@陣子太忙了(所以沒(méi)更新)。”稚暉君解釋到,稱(chēng)自己絕對(duì)沒(méi)有挖坑就跑的意思,“后面稍微閑下來(lái)一點(diǎn),還是會(huì)更新的。”

至于之后的B站投稿,還會(huì)是原來(lái)的風(fēng)格,原來(lái)的味道,可能偶爾夾雜一些創(chuàng)業(yè)日常。但他保證,不會(huì)變成純粹公司的營(yíng)銷(xiāo)窗口

(他暗示,畢竟智元有單獨(dú)的官方賬號(hào),歡迎大家關(guān)注~)

“也是向馬斯克學(xué)習(xí)嘛,他在公司管理運(yùn)營(yíng)和個(gè)人賬號(hào)運(yùn)作之間,就做得很好?!?/p>

One More Thing

話(huà)趕話(huà)聊到這兒,怎么能不追問(wèn)鴿王,下次B站視頻更新,在啥時(shí)候?

“今年一定,年底之前一定?!?/p>

內(nèi)容與什么相關(guān)?

“還是機(jī)器人吧,之前挖過(guò)的某個(gè)坑,下個(gè)視頻就是這個(gè)?!?/p>

好的,經(jīng)本人授權(quán),我們替他把話(huà)放在這兒了。

咕咕咕。

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:機(jī)器人,稚暉君具身智能

軟媒旗下網(wǎng)站: IT之家 最會(huì)買(mǎi) - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買(mǎi) 要知