IT之家 10 月 23 日消息,英偉達日前公布了一個名為 Eureka 的 AI 系統(tǒng),該系統(tǒng)以 OpenAI 的 GPT-4 為基礎,能夠讓機器人執(zhí)行例如“轉筆”、“開抽屜”、“拿剪刀”、“雙手互傳球”等 30 多種復雜動作。
IT之家經(jīng)過查詢得知,英偉達研究院主導開發(fā)了 Eureka,該 AI 系統(tǒng)可令開發(fā)者配合英偉達自家物理模擬軟件 Isaac Gym 進行強化學習(reference learning)。
英偉達 AI 研究部門資深總監(jiān) Anima Anandkumar 認為,過去 10 年以來“強化式學習”雖然有所進展,但仍存在不少挑戰(zhàn),例如“獎賞設計”等環(huán)節(jié),現(xiàn)在還停留在“試錯”階段。而目前英偉達公布的 Eureka,則是為執(zhí)行困難的任務而設計,結合生成式 AI 與強化式學習算法,進行首次嘗試。
Eureka 利用 GPT-4 生成出的“獎賞設計”方案可助力機器人的“試錯(trial-and-error)”學習,并能夠起到接替 80% 人類專家的任務,從而使機器人平均訓練效率提升超過 50%。
據(jù)悉,在 Eureka 生成“獎賞設計”方案時,開發(fā)者不需要額外輸入任務提示或撰寫預定義的獎賞范本,再結合人工修正獎賞,最終使機器人動作更符合開發(fā)人員的意圖。
該 AI 系統(tǒng)配合 Issac Gym 時,可利用 GPU 加速進行模擬,并針對大量批次的候選回饋快速評估品質,從而提升訓練效率,并根據(jù)訓練結果的作出統(tǒng)計摘要,從而改良“獎賞方案”,在提升機器人反應水平的同時,令 AI 系統(tǒng)適用的機器人類型更為廣泛,例如“走獸型”(四足)、“人型(兩足)”、“四軸飛行器”、手臂型等機器人都可以搭載 Eureka 系統(tǒng)。
英偉達將 Eureka 進行了“開源靈敏性標竿測試”,在評估 20 種任務訓練結果后,得出了令人滿意的結果。
據(jù)此,英偉達認為 Eureka 可實現(xiàn)靈巧的機器人控制,并為動畫作者提供“生成逼真實體動作”的新方法。
廣告聲明:文內(nèi)含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。