設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

Transformer 作者創(chuàng)業(yè)后首個成果亮相!用文本指揮 AI 做表格發(fā)郵件,這是先給自己造了個員工?

量子位 2022/9/24 15:35:23 責(zé)編:遠(yuǎn)生

集結(jié)了 Transformer 作者、前 OpenAI 工程副總裁的創(chuàng)業(yè)團(tuán)隊(duì),不到半年就亮出首個大模型 ——

Action Transformer(ACT-1)。

簡單來說,這是一個會使用瀏覽器、Excel 等軟件工具的 AI。

基于 Transformer 的自然語言處理能力,它能理解人類給出的命令,并完成相應(yīng)操作。

比如,想要在 Excel 表格中加上利潤、利潤率,只需把這段話輸入給 AI,它就能自己在對應(yīng)行列創(chuàng)建公式完成任務(wù)了。

想要在網(wǎng)上找房子,也不用自己搜索再設(shè)置各種篩選條件了。

只需要告訴 AI:幫我在休斯頓找一套四口之家住的房子,預(yù)算在 60 萬。

然后 AI 就能一氣呵成找到目標(biāo)范圍內(nèi)的房源了。

整個過程非常絲滑連貫,看上去比自己手動操作要快上很多。

最大的好處就是不用自己來操作了,“吆喝”一聲即可,屬實(shí)是懶癌福音。

團(tuán)隊(duì)表示,他們認(rèn)為人類在電腦上的各種操作,通用人工智能也能搞定,ACT-1 正是他們朝這個方向邁出的第一步。

讓 AI 來幫助人機(jī)交互

從官方目前公布的功能來看,這個 AI 像是 Siri、微軟小娜的究極加強(qiáng)版。

它的優(yōu)勢在于幫人們省去了很多繁雜的操作,比如在網(wǎng)頁上填信息表格,鼠標(biāo)不操作個十幾次很難搞定。

但是如果用 AI,只需輸入一句話。

而且 AI 的操作并不局限在一個網(wǎng)頁。

讓它找個一千塊以下的冰箱并聯(lián)系賣家,AI 先從購物平臺上檢索,然后自己打開郵箱寫郵件。

遇到自己不懂的事情,還知道上維基百科搜索一番。

即便是操作失誤了,也能根據(jù)人類給出的教程指導(dǎo)快速學(xué)習(xí)。

這不,一開始弄成亂碼的 Excel 表格,在學(xué)習(xí)了正確的公式后,AI 很快給出了正確的操作。

總之就是把日常我們用電腦時的一些繁瑣小事,交給 AI 來辦。

正如公司創(chuàng)始人兼 CEO David Luan 所說,他們希望由 AI 來完成一些瑣碎的基礎(chǔ)電腦操作,讓人類更專注于自己的工作。

研發(fā)團(tuán)隊(duì)表示,他們是通過將 ACT-1 連接在一個 Chrome 擴(kuò)展程序上,讓它來觀察瀏覽器的一些操作,比如點(diǎn)擊、輸入、滾動等。

目前來看 ACT-1 還有很多進(jìn)步空間。團(tuán)隊(duì)希望它最終的操作速度可以達(dá)到人類察覺不到的水平。

值得一提的是,想讓 AI 來充當(dāng)人類電腦操作助手的,并非 Adept 一家。

今年 2 月,DeepMind 發(fā)表了一篇論文,表示他們利用數(shù)據(jù)驅(qū)動的方法,讓 AI 學(xué)習(xí)到人類操作電腦的方式,從而讓它們完成訂機(jī)票等任務(wù)。

DeepMind 表示,他們訓(xùn)練的 AI 可以完成 100 多項(xiàng)任務(wù),并且都達(dá)到了人類水平。

此外,由 DeepMind 聯(lián)合創(chuàng)始人穆斯塔法等人創(chuàng)立的 Inflection AI,也是想以 AI 的方式,重新定義人機(jī)交互。

超豪華主創(chuàng)團(tuán)隊(duì)

ACT-1 的打造者是 Adept,今年 4 月官宣成立。

天使輪便拿下 6500 萬美元融資,投資人包括 Uber CEO、特斯拉自動駕駛負(fù)責(zé)人、Airtable 創(chuàng)始人等。

創(chuàng)始團(tuán)隊(duì)陣容非常豪華。

首席科學(xué)家是 Ashish Vaswani。他是《Attention is all you need》的第一作者,平??凑撐臅r經(jīng)常出現(xiàn)的“(Vaswani et al., 2017)”就是這位大佬。

他博士畢業(yè)于南加州大學(xué),在谷歌大腦工作已有 5 年。

Transformer 的另一位作者 Niki Parmar 也加入了該團(tuán)隊(duì)。

她在印度上完大學(xué)后,同樣在南加州大學(xué)讀完碩士,在谷歌工作了近 7 年。

創(chuàng)始人兼 CEO David Luan,是前 OpenAI 加州實(shí)驗(yàn)室工程副總裁,參與過 GPT-2、GPT-3、CLIP、DALL-E 等模型的開發(fā),后來加入谷歌,曾任谷歌大腦大模型研究的 Director。

除了以上幾位,團(tuán)隊(duì)人員還包括:

Kelsey Schroeder,斯坦福大學(xué)計(jì)算數(shù)學(xué)(computational mathematics )專業(yè)碩士,前谷歌大模型生產(chǎn) infra 的產(chǎn)品負(fù)責(zé)人;

Anmol Gulati,在谷歌主要做語音識別模型;

Augustus Odena,在谷歌領(lǐng)導(dǎo)大型語言模型相關(guān)的工作,也有不少圖像合成方面的研究;

Erich Elsen,機(jī)器學(xué)習(xí)和高性能計(jì)算交叉領(lǐng)域的研究人員,前 Deepmind 員工,主要研究大模型,在更早之前,還分別在谷歌和百度(硅谷 AI Lab)干了兩年;

Fred Bertsch,谷歌數(shù)據(jù)和協(xié)作人工智能系統(tǒng)方面的專家。

最后一位,Maxwell Nye,是剛從 MIT 畢業(yè)的一位博士生,研究重點(diǎn)為自動代碼生成。

總的來說,可謂大佬云集,且各有專攻。

目前,Adept 的最新成果 ACT-1 還沒有對外開放使用,但可以在官網(wǎng)排隊(duì)了~

以及團(tuán)隊(duì)正在招聘人才,感興趣的小伙伴可以關(guān)注一下子。

參考鏈接:

  • [1]https://twitter.com/AdeptAILabs/status/1570144499187453952

  • [2]https://techcrunch.com/2022/04/26/2304039/

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:AI

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會買 要知