設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

對話稚暉君:具身智能創(chuàng)業(yè)窗口轉(zhuǎn)瞬即逝,打擂瞄準偶像馬斯克

量子位 2023/9/6 14:12:26 責編:汪淼

馬斯克是我偶像,很榮幸能有機會在這個賽道和他同臺競技。

說出這話的稚暉君,十分清楚他離開華為創(chuàng)業(yè)要做什么:

對標馬斯克,做通用機器人,競品擎天柱,既面向星辰大海也奔著商用落地,產(chǎn)品目標最終定價不超過 20 萬人民幣。

換成最流行的說法,他在做大模型和機器人結(jié)合的具身智能。

想法始于他學生時期的探索。

早在他還沒成B站up 主的 2015 年,學生身份的稚暉君就參與組織了一群打比賽認識的小伙伴,準備“做個人吧”:

當時,普通人對 AI 的切身感受還是人臉識別或美顏這類應(yīng)用,大模型概念還沒誕生,“要讓機器人具備像人一樣的思考和行動能力”這個命題,似乎離實現(xiàn)還有點過于遙不可及。

因此,畢業(yè)后的稚暉君沒繼續(xù)只在機器人身上折騰,而是選擇進入 AI 賽道,成為大廠的 AI 算法工程師,在軟件算法領(lǐng)域干了好幾年。

直到 ChatGPT 石破天驚,大模型智能涌現(xiàn),OpenAI 證明大力堆疊真的可以產(chǎn)生質(zhì)變。

回看自己的機器人夢想,稚暉君又看到了這條路的可行性。所以,離開菊廠,投身創(chuàng)業(yè)

于是半年時間,他帶著團隊拿出了一套有模有樣的原型機。

8 月發(fā)布會上,被稚暉君自豪請上臺的自家機器人步伐穩(wěn)健,行走效果可以比肩去年馬斯克擎天柱 Optimus 的初亮相。

就是憑借這樣一款作品,他的初創(chuàng)公司智元機器人,在投資者冷靜但賽道又火爆的當下,成為了少數(shù)幾個拿到 VC 和大廠戰(zhàn)投重金押注的標的。

發(fā)布會結(jié)束后和量子位的會面,他表露出對發(fā)布會、團隊和整體進展還算滿意,也表露出沿著這條路往未來走的信心。

還在他的工位前告訴我們,他的桌面壁紙已經(jīng)換了很久了:

全身心投入人形機器人創(chuàng)業(yè),他會怎么看待自己公司的高估值?智元的下一步規(guī)劃是什么?商業(yè)化落地場景將在何方?創(chuàng)業(yè)過后這個百大 up 主的B站賬號咋辦?

量子位問,稚暉君答,一切都在這次對話中。

再晚點,也許就不用出來創(chuàng)業(yè)了

稚暉君算是最早感知到這一波大環(huán)境變化,并且付諸實踐的那撥人。

外界看來,他去年年底宣布創(chuàng)業(yè)時,機器人和大模型都是科技領(lǐng)域的大熱議題,尤其是 ChatGPT 剛出道,帶給大家暴力美學的震撼。

那個時間節(jié)點,賽道遠沒有今天擁擠。技術(shù)從業(yè)者聞風而動,不算意外。但稚暉君第一次透露了他當時的心態(tài):

要是選擇再晚一點,也許就沒必要出來創(chuàng)業(yè)做這事了。

為了解釋這句話,他給競品特斯拉擎天柱拉出一條時間線:

去年 9 月展示原型機,今年 5 月展示識別周圍環(huán)境存儲記憶和準確控制物品拿放的能力,7 月表示已經(jīng)生產(chǎn) 10 臺,預計 11 月進行行走測試,明年在特斯拉自己的工廠進行實用性測試。

動作很快,實際效果也哇噻。

馬斯克,一個從不按套路出牌的男人,自從宣布入局機器人賽道,就用火箭般的速度推進量產(chǎn)節(jié)奏,在他的口中,未來機器人的數(shù)量會超過人類。

稚暉君看到這一切,心潮澎湃。與此同時,他也觀察到機器人和大模型結(jié)合的潛力。

微軟的 ChatGPT for Robotics,谷歌的 Palm-E、RT-1、RT-2,還有 VoxPoser、RoboCat 等眾多工作,都在嘗試把圖像語言大模型的能力和知識遷移到機器人領(lǐng)域。

其中轟動最大的谷歌 RT(Robot Transformer)系列,在論文闡述和 demo 視頻中,都展示出抓取領(lǐng)域非常優(yōu)秀的泛化能力。

要做到這一點并不容易,核心門檻,在于數(shù)據(jù)。光是訓練它,谷歌就花了 17 個月,收集 13 臺機器人的 13 萬條機器人真實數(shù)據(jù) —— 這大概也是 RT 模型開源而數(shù)據(jù)暫時閉源的一個小小心機。

稚暉君坦言,雖然也從一開始就在準備自家的動作任務(wù)數(shù)據(jù)集,但目前能用來訓練自家產(chǎn)品的數(shù)據(jù),“只有上千”。

一對比,差距之大,顯而易見。

數(shù)字上的直觀差距,足以解釋稚暉君對量子位說的,“當前節(jié)點,遠征 A1 最需要提升的地方,是數(shù)據(jù)帶來的 AI 泛化能力”,足以解釋這為什么“會是一個相對長期的布局”。

也能部分解釋發(fā)布機器人時,直播間網(wǎng)友對展示時間較短、展示能力不如想象炫酷的疑問。

“我覺得要想達到真正理想的實用效果,還是需要大量的真實場景數(shù)據(jù)。我們時間太短了,這方面還沒有做夠積累。”稚暉君如是說。

競爭對手不會給你多留喘息的機會。正因如此,稚暉君表示團隊接下來的工作重心之一,是建立自己的數(shù)據(jù)中心。計劃未來幾個月內(nèi)落地臨港,主要目的是搭建場景和仿真平臺,填補運動數(shù)據(jù),提高泛化能力。

數(shù)據(jù)是如何生成的?稚暉君的總結(jié)有三:

  • 監(jiān)督學習數(shù)據(jù)??咳俗鍪痉?,控制機器人做分揀等各種操作,在過程中采集真實數(shù)據(jù)。

  • 仿真數(shù)據(jù)。需要自己搭建仿真平臺,有一個比較好的渲染引擎、物理引擎,以及比較好的人機交互流程裝置。

  • AIGC 生成數(shù)據(jù)。主要是真實數(shù)據(jù)的補充擴充,是低成本數(shù)據(jù)增強的一個重要手段。

建數(shù)據(jù)中心是工作重點之一,另一個重點則是對硬件結(jié)構(gòu)進行迭代重構(gòu),加強機器人本體運動性能。按稚暉君的說法,團隊會用做軟件敏捷開發(fā)的速度和效率去迭代硬件。

這是非常顛覆并且有挑戰(zhàn)性的一件事情。

此處送上小八卦一則。

今年 4 月,稚暉君在投稿B站的自制雙足機器人哪吒,并在視頻結(jié)尾表示,“如果不出意外的話,哪吒會成為發(fā)布會的彩蛋”。

當然了,按照經(jīng)典劇情,不出意外的話果然就出意外了:D,哪吒并沒有上發(fā)布會。

就是它 ↓

量子位幫大家打聽到,原因是哪吒上面用到的幾個電機被供應(yīng)商鴿了,3 月下的訂單 7 月才收到貨,導致開發(fā)時間不夠。

稚暉君說道:“后面有空還是會繼續(xù)完成這個項目的,鴿王有坑必填?!?/p>

半年成獨角獸,背后還有另一條商業(yè)化隱線

讀到這里大概能察覺,智元人形機器人項目的機器人本體,還需要迭代幾版;而 AI 能力受限于當前訓練數(shù)據(jù)不足,也還需要積累一段時間。

總體來說,產(chǎn)品離落地似乎還有一段距離的樣子。

然而就是這樣一個創(chuàng)業(yè)項目,半年估值直奔 10 億美元開外。這合理嗎???

聽到這個問題,稚暉君并沒有直接回答到底“值或不值”,只是回答道,其實融資思路也不是一開始就定型的,期間參考了很多行業(yè)大佬和前輩的建議。

團隊最初的設(shè)想很單純,就是先做出 Demo,然后順其自然地提高估值。

“但創(chuàng)業(yè)顯然不是那么單純的事情,大經(jīng)濟環(huán)境不算景氣的背景下,要整合資源、吸引人才,無一不需資本的背書?!敝蓵熅硎?,“這并不是一件壞事?!?/p>

高效實干,快速調(diào)整思路和策略,以結(jié)果導向推進事情,這是稚暉君的行事風格。他的風格最終也決定了智元,至少是智元研發(fā)團隊的工作風格。

技術(shù)團隊每個早期成員都是他親自面進公司的,30 多號人基本都是自來卷,卷得一天睡五、六個小時的稚暉君都心生感慨:

之前大家都覺得我是時間管理大師,現(xiàn)在我可以很慚愧地講,我們公司像我這么肝的,還有一堆……

整個交流過程中,量子位關(guān)注到他強調(diào)了兩個關(guān)鍵詞,“壓成本”和“應(yīng)用場景”

這倆是目前整個賽道的普遍痛點。團隊如何解決痛點,必然是他們獲得高瓴、鼎暉、經(jīng)緯、高榕、藍馳、BV 百度風投等頭部資方重金押注的關(guān)鍵。

來聽聽稚暉君的看法 ——

先說壓低成本。現(xiàn)在智元對外喊出的口號是,人形機器人落地控價 20 萬元內(nèi)。

這約與馬斯克放話的 7 萬美元售價持平,而國內(nèi)類似人形機器人的售價水平在 50 萬 RMB 上下,大家喜聞樂見的波士頓動力 Atlas,成本則在 200 萬美元。

稚暉君直言不諱:“不是我們希望做到 20 萬元,而是如果做不到 20 萬元的價格,就根本沒辦法實現(xiàn)商業(yè)落地?!?/p>

至于為什么是 20 萬,他表示,以新能源汽車制造業(yè)為例,20 萬的機器人替代部分人工崗位的話,可以做到 1~2 年的投資回報期。

稚暉君也大致描述了一下智元為量產(chǎn)控制成本的方法。

一是盡最大可能采取自研路線,降本增效。

如關(guān)節(jié)電機和靈巧手等部件占硬件成本一半以上,而且市場現(xiàn)有供應(yīng)還存在特性不匹配的情況,自主研發(fā)核心部件能讓成本降低一半以上。

二是采用類似特斯拉造車的部分思路,用軟件和算法補硬件方面的精度要求,降低硬件成本

如放棄諧波減速器而選擇行星減速器,靈巧手上面使用的視覺閉環(huán)方案等等。

再說落地應(yīng)用場景。稚暉君表示,預計明年下半年商業(yè)化落地,先應(yīng)用在工業(yè)制造領(lǐng)域,家庭等服務(wù)型應(yīng)用場景都往后排,現(xiàn)階段突出一個“場景相對簡單,任務(wù)相對復雜”。

“這條路線是邊走邊摸索出來的,還是最初就定下的目標?”

“團隊還不到 10 個人時候的最早期,我們就基本敲定了這條落地方案。”同時表示:

很多人會拿我們或者特斯拉的機器人去跟波士頓動力對比,其實是不合適的。

奔著商業(yè)化落地去做,正確的邏輯應(yīng)該是:在滿足應(yīng)用場景功能和性能需求的前提下,以盡量最低的成本去實現(xiàn)方案。

所以能走著去搬東西的場景下,就沒有必要非得讓它有能力后空翻。

現(xiàn)在,這條半年前定下的路線,最終落地跡象愈發(fā)明晰。

最新工商動態(tài)顯示,比亞迪入股了智元下屬公司,加上此前量子位從智元方面獲悉,公司已與國產(chǎn)頭部智能汽車廠商和 3C 廠商等密切洽談。

由此在官宣前推測一波,遠征 A1 在工業(yè)制造領(lǐng)域的首發(fā)打工地點,不出意外,就是比亞迪汽車工廠。

除成本和落地場景這兩點外,隨著團隊對具身智能的愈發(fā)深入,智元手里還握了些其它差異化的牌。

比如,量子位就從稚暉君口中挖到公司商業(yè)化的一條隱線 ——

如果說通用人形機器人是商業(yè)落地的中長期計劃和最終愿景,那么在邁向這個終點的過程中,團隊也會有一些“沿途下蛋”的產(chǎn)品形態(tài)。

具體是什么形態(tài)呢?稚暉君一如既往地口風很嚴,賣了個關(guān)子,但還是有所透露。

他聽到過很多次疑問,問為什么要把機器人做成人類形態(tài),相比于其他專用形態(tài)(機械臂、輪式),是不是費力不討好?

針對這個問題,稚暉君有兩方面思考。

一方面,這會是一個長期投入的過程,大家不要高估短期的價值,也不要低估長期的價值。人形是智元以終為始、面向終極形態(tài)邁出的第一步,這也是為什么給這款機器人取名叫“遠征”。

另一方面,選擇做這件事情(人形)并不是因為它容易,反而是因為它很困難。

通用人形機器人牽涉到最全面的機器人技術(shù)棧,它的實現(xiàn)過程中各種前沿技術(shù)(視覺伺服、MPC、SLAM、LLM / VLM、中間件等各種技術(shù)的自研和優(yōu)化)的沿途下蛋,可以催生很多創(chuàng)新性專用形態(tài)的機器人產(chǎn)品,“大家未來會陸續(xù)看到這些成果的”。

“網(wǎng)友們放心,B站賬號不會變成公司專用營銷號”

過人的技術(shù),漂亮的簡歷,大廠的光環(huán),百萬計的粉絲,又恰逢新技術(shù)爆發(fā)周期:大模型、具身智能、AIGC…… 攢局創(chuàng)業(yè)后,出任團隊 CTO,帶領(lǐng)公司迅速壯大,半年時間,公司人數(shù)近百,市場估值超 10 億美元。

一系列附帶光環(huán)的故事砸過來,圍觀者不由得在這個時候,重新審視稚暉君。他又會怎樣定義現(xiàn)在的自己?量子位把這個問題拋給了稚暉君本人。

稚暉君倒沒表現(xiàn)出什么遲疑,只是說,他給自己的定位并沒有太大變化。

首先是個工程師,其次才是創(chuàng)業(yè)者。

我可能屬于一個非典型創(chuàng)業(yè)者,做這些事情的動力都是基于個人興趣,也很幸運取得了一些小成就:早期在大廠里發(fā)光發(fā)熱,頂了一些光環(huán),又在網(wǎng)上獲得了不小的知名度,然后又突然跑出來創(chuàng)業(yè)。一開始身邊的人都覺得挺震驚的。

我一直認為自己是一個樂觀主義者。

還有句話,他說得毫不猶豫 ——

“既然人生沒有后悔的機會,那么就堅持相信自己到現(xiàn)在的每一步,都是我做的最正確的選擇。”

“每一步都是正確的選擇”,可能也包括不少人為之唏噓的離開華為,脫離“天才”tag。

在量子位面前,他沒有掩飾曾經(jīng)在華為工作取得榮譽的感激,也提到:

老東家在做一些很偉大的事情,但是像機器人這樣面向更未來領(lǐng)域的探索,可能更適合在小的創(chuàng)新團隊中去做。

希望自己能繼承‘散是滿天星’的優(yōu)良傳統(tǒng)吧。

然后,又像他常常做的那樣,再次強調(diào)自己既不是天才,也不再是少年。

能感受到,稚暉君更希望外界把對他的關(guān)注從一個具體的 tag,轉(zhuǎn)移到他想做的事情本身。

有趣的是,他又勸大伙兒不要太早創(chuàng)業(yè)。“對于學生來說,建議還是要先工作幾年,接受一下社會的毒打,才對社會、公司運作的方式有一個清晰的了解哈哈。”

當時在發(fā)布會上,他也表達了自己的觀點:檢驗一家科技公司價值最有效的方式之一,就看它能否實現(xiàn)商用落地。

不然技術(shù)做得再好也容易陷入自嗨。

聊到這兒,稚暉君表露心跡,既然正兒八經(jīng)創(chuàng)業(yè)了,項目也不能單純按照個人的奇思妙想隨意自嗨了。組了人、拿了錢,就需要在公司戰(zhàn)略發(fā)展方向上多做考慮,“要為公司這么多兄弟姐妹們負責”。

但顯然,他自有自嗨處:B站。

“個人號???這陣子太忙了(所以沒更新)?!敝蓵熅忉尩剑Q自己絕對沒有挖坑就跑的意思,“后面稍微閑下來一點,還是會更新的?!?/p>

至于之后的B站投稿,還會是原來的風格,原來的味道,可能偶爾夾雜一些創(chuàng)業(yè)日常。但他保證,不會變成純粹公司的營銷窗口

(他暗示,畢竟智元有單獨的官方賬號,歡迎大家關(guān)注~)

“也是向馬斯克學習嘛,他在公司管理運營和個人賬號運作之間,就做得很好。”

One More Thing

話趕話聊到這兒,怎么能不追問鴿王,下次B站視頻更新,在啥時候?

“今年一定,年底之前一定?!?/p>

內(nèi)容與什么相關(guān)?

“還是機器人吧,之前挖過的某個坑,下個視頻就是這個。”

好的,經(jīng)本人授權(quán),我們替他把話放在這兒了。

咕咕咕。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:機器人,稚暉君,具身智能

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知