設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

估值飆至 138 億美元,27 歲天才少年再獲融資:數(shù)據(jù)標(biāo)注會是下一個風(fēng)口?

新智元 2024/5/25 21:43:11 責(zé)編:清源

【新智元導(dǎo)讀】Alexandr Wang 創(chuàng)辦的 Scale AI 是一個為 AI 模型提供訓(xùn)練數(shù)據(jù)的數(shù)據(jù)標(biāo)注平臺,近期完成新一輪 10 億美元融資,估值飆升至 138 億美元。該公司表示將利用新資金生產(chǎn)豐富的前沿數(shù)據(jù),為通向 AGI 鋪平道路。

Scale AI 為想要訓(xùn)練機(jī)器學(xué)習(xí)模型的公司提供數(shù)據(jù)標(biāo)注服務(wù),已從亞馬遜和 Meta 等眾多知名機(jī)構(gòu)和企業(yè)投資者那里籌集了 10 億美元的 F 輪融資。

本輪融資由 Accel 領(lǐng)投,它之前還領(lǐng)投了 Scale AI 的 A 輪融資,并參與了后續(xù)的風(fēng)險投資。

這輪融資讓 Scale AI 的身價飆升。盡管去年年初裁員 20%,但公司目前估值已經(jīng)達(dá)到了 138 億美元。

Scale AI 聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Alexandr Wang

除了亞馬遜和 Meta 之外,Scale AI 還吸引了各種各樣的新投資者:思科、英特爾、AMD 等風(fēng)險投資部門參與其中,而且很多注資過的公司也回歸了,包括英偉達(dá)、Coatue、Y Combinator 等等。

天才少年輟學(xué)創(chuàng)辦獨(dú)角獸

Scale AI 由 Alexandr Wang 和 Lucy Guo 于 2016 年創(chuàng)立,由著名創(chuàng)業(yè)孵化器 Y Combinator 投資。該公司使用機(jī)器學(xué)習(xí)來標(biāo)記和分類大量數(shù)據(jù),以便客戶用于訓(xùn)練模型。

Scale AI 的客戶包括 Meta、微軟、英偉達(dá)、OpenAI、豐田和哈佛醫(yī)學(xué)院。

在創(chuàng)始人基金領(lǐng)投的 1 億美元 C 輪融資之后,Scale AI 在 2019 年獲得了獨(dú)角獸的地位,總共從 Index Ventures、Coatue、Tiger Global 等知名投資者處籌集了 6.026 億美元。

2022 年,持有 15% 股份的 Alexandr Wang 成為全球最年輕的白手起家的億萬富翁。

創(chuàng)業(yè)之前,Wang 從小到大的履歷也讓人印象深刻。

1997 年出生于新墨西哥州,父母都是在新墨西哥州洛斯阿拉莫斯國家實(shí)驗(yàn)室的物理學(xué)家。

高中階段開始通過網(wǎng)絡(luò)自學(xué)編程,并報名參加了一些世界級的編程大賽,比如美國計算機(jī)奧林匹克競賽(USACO)。

17 歲,成為美國知名問答網(wǎng)站 Quora 的全職碼農(nóng);

18 歲,考入麻省理工學(xué)院攻讀機(jī)器學(xué)習(xí);

在 MIT 大一剛結(jié)束后的暑假,他就和 Guo 一起創(chuàng)辦了 Scale,并且拿到了 Y Combinator 的投資。

Wang 跟爸媽說,「這就是我夏天隨便玩玩的事。」

Scale AI 剛起步時,有些人確實(shí)覺得這就是一個笑話,畢竟公司當(dāng)時只有三名員工。

不過,在不斷地融資和發(fā)展之下,Scale AI 發(fā)展飛速,到 2021 年已經(jīng)成長為價值 73 億美元的獨(dú)角獸企業(yè),2023 年初公司規(guī)模也擴(kuò)展到了 700 人。

Wang 在接受《財富》雜志獨(dú)家采訪時透露,隨著企業(yè)客戶競相訓(xùn)練生成式 AI 模型,Scale AI 的這方面業(yè)務(wù)快速增長。

2023 年,公司年度經(jīng)常性收入(企業(yè)長期為數(shù)據(jù)服務(wù)支付的費(fèi)用)增加了兩倍,預(yù)計 2024 年底將達(dá)到 14 億美元。

由于 Scale AI 的驚人成就,Alexandr Wang 在 2021 年入選福布斯企業(yè)技術(shù)領(lǐng)域「30 under 30」排行榜,他本人在硅谷也被稱為「下一個扎克伯格」。

AI 模型的「數(shù)據(jù)工廠」

AI 領(lǐng)域公認(rèn)的三個基本支柱 —— 數(shù)據(jù)、算法和算力。

算法領(lǐng)域,前有谷歌、微軟的大型研究院,后有推出過 Sora 和 GPT 系列模型的 OpenAI;算力領(lǐng)域有供貨全球的英偉達(dá),但在 Scale AI 還未誕生的 2016 年,數(shù)據(jù)領(lǐng)域仍處于空白。

19 歲的 Alexandr Wang 在看到這一點(diǎn)后,做出了輟學(xué)創(chuàng)業(yè)的決定,「我創(chuàng)辦 Scale 的原因是為了解決人工智能中的數(shù)據(jù)問題」。

大部分?jǐn)?shù)據(jù)都是非結(jié)構(gòu)化的,AI 很難直接學(xué)習(xí)這些數(shù)據(jù);而且大型數(shù)據(jù)集的標(biāo)注一項(xiàng)資源密集型工作,因此,「數(shù)據(jù)」被很多人認(rèn)為是科技領(lǐng)域最辛苦、最卑微的部分。

但 Scale AI 卻在短時間內(nèi)就獲得了巨大成功。他們可以為不同行業(yè)的企業(yè)客戶量身定制數(shù)據(jù)服務(wù)。

在自動駕駛領(lǐng)域,Cruise 和 Waymo 等公司通過攝像頭和傳感器收集了大量數(shù)據(jù),Scale AI 將機(jī)器學(xué)習(xí)與「人機(jī)回路」(human-in-loop)監(jiān)督相結(jié)合,管理和標(biāo)注這些數(shù)據(jù)。

他們曾經(jīng)開發(fā)的「自治數(shù)據(jù)引擎」推動了 L4 級別自動駕駛技術(shù)的發(fā)展。

2019 年,Scale AI 幫助 OpenAI 團(tuán)隊(duì)一同訓(xùn)練 GPT-2,進(jìn)行了 RLHF 的首次實(shí)驗(yàn),并將這些技術(shù)擴(kuò)展到 InstructGPT 等其他 LLM 上。

CEO Wang 在接受《財富》雜志采訪時表示,Scale AI 將自己定位為整個 AI 生態(tài)的基礎(chǔ)設(shè)施供應(yīng)商,構(gòu)建「數(shù)據(jù)鑄造廠」,而不僅僅是在子公司 Remotasks 中雇傭大量的合同工進(jìn)行人工標(biāo)注。

Scale AI 已經(jīng)開始與不同領(lǐng)域的專家合作,比如博士級學(xué)者、律師、會計師、作家等。

給聊天機(jī)器人的回復(fù)進(jìn)行打分,這樣的工作為什么能讓博士級別的專家參與其中?

Wang 的回應(yīng)是,原因有很多:「如果你是一名博士,習(xí)慣于做一些非常小眾、深奧的研究,也許世界上只有少數(shù)人能夠理解。但這個工作中,你可以幫助改進(jìn)和構(gòu)建這些人工智能系統(tǒng)的前沿數(shù)據(jù),有機(jī)會產(chǎn)生真正的社會影響?!?/p>

同時,Wang 也認(rèn)為,這些專家所能提供的高質(zhì)量數(shù)據(jù)對 AI 的未來非常重要。

他補(bǔ)充說,來自專家的、包含復(fù)雜推理的數(shù)據(jù)是未來人工智能的必備條件。「你不能隨便把舊數(shù)據(jù)輸入給算法中,然后期待著它會自我改進(jìn)」。

傳統(tǒng)的數(shù)據(jù)來源,比如從 Reddit 等社區(qū)的評論中抓取數(shù)據(jù)存在局限性。Scale AI 構(gòu)建了一些流程,模型先輸出一些內(nèi)容,例如撰寫研究論文,在此基礎(chǔ)上,人類專家可以改進(jìn)這些內(nèi)容,從而改進(jìn)模型的輸出。

關(guān)于 AI 生成并注釋的數(shù)據(jù),有人持積極態(tài)度,認(rèn)為可以消除對人類注釋數(shù)據(jù)注釋,但 Wang 的觀點(diǎn)并沒有這么單純。

他說,合成數(shù)據(jù)以及人類創(chuàng)建的數(shù)據(jù),這兩個方面 Scale AI 都有投入?!鸽m然人工智能生成的數(shù)據(jù)很重要,但想要獲得有一定質(zhì)量和準(zhǔn)確性的數(shù)據(jù),唯一方法是通過人類專家的驗(yàn)證?!?/p>

數(shù)據(jù)日益重要

數(shù)據(jù)是人工智能的命脈,因此數(shù)據(jù)管理和處理領(lǐng)域的公司正站在風(fēng)口上。

就在上周,印度的數(shù)據(jù)平臺 Weka 表示,它以 16 億美元的投后估值籌集了 1.4 億美元,以幫助公司為其人工智能應(yīng)用程序構(gòu)建數(shù)據(jù)管道。

人工智能數(shù)據(jù)的主要問題仍然存在。Scaling Law 的存在意味著,隨著模型變大,對數(shù)據(jù)的需求也呈現(xiàn)指數(shù)級增長,越來越多的人擔(dān)心大模型會耗盡可用數(shù)據(jù)。

Alexandr Wang 在 Scale AI 的官網(wǎng)上這樣寫道,「數(shù)據(jù)豐富不是默認(rèn)情況,而是一種選擇,它需要匯集工程、運(yùn)營和 AI 方面最優(yōu)秀的人才」

Scale AI 的愿景之一是「數(shù)據(jù)豐富」,從而將前沿 LLM 擴(kuò)展到更大數(shù)量級,「為通向 AGI 鋪平道路。在達(dá)到 GPT-10 的過程中,我們不應(yīng)該受到數(shù)據(jù)的限制」。

參考資料:

  • https://techcrunch.com/2024/05/21/data-labeling-startup-scale-ai-raises-1b-as-valuation-doubles-to-13-8b/

  • https://fortune.com/2024/05/21/scale-ai-funding-valuation-ceo-alexandr-wang-profitability/

  • https://scale.com/blog/scale-ai-series-f

本文來自微信公眾號:新智元 (ID:AI_era)

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會買 要知