設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

蘋果取得技術(shù)突破:有望在 iPhone 上運(yùn)行大型語言模型

2023/12/21 20:05:28 來源:IT之家 作者:遠(yuǎn)洋 責(zé)編:遠(yuǎn)洋

IT之家 12 月 21 日消息,蘋果的人工智能研究人員表示,他們已取得一項(xiàng)重大突破,通過一種創(chuàng)新的閃存利用技術(shù),成功地在內(nèi)存有限的蘋果設(shè)備上部署了大型語言模型(LLM)。這一成果有望讓更強(qiáng)大的 Siri、實(shí)時(shí)語言翻譯以及融入攝影和增強(qiáng)現(xiàn)實(shí)的尖端 AI 功能登陸未來 iPhone

近年來,像 ChatGPT 和 Claude 這樣的 LLM 聊天機(jī)器人風(fēng)靡全球。它們能夠進(jìn)行流暢的對(duì)話、撰寫不同風(fēng)格的文本,甚至生成代碼,展現(xiàn)出強(qiáng)大的語言理解和生成能力。然而,這些模型有一個(gè)致命弱點(diǎn):它們極其“吃”數(shù)據(jù)和內(nèi)存,普通手機(jī)根本無法滿足其運(yùn)行需求。

為了突破這一瓶頸,蘋果研究人員開辟了一條新路,將目光投向了手機(jī)中普遍存在的閃存,也就是儲(chǔ)存應(yīng)用和照片的地方。在題為“閃存中的 LLM:利用有限內(nèi)存實(shí)現(xiàn)高效的大型語言模型推理(LLM in a flash: Efficient Large Language Model Inference with Limited Memory)”的論文中,研究人員提出了一種巧妙的閃存利用技術(shù),將 LLM 模型的數(shù)據(jù)存儲(chǔ)在閃存中。作者指出,與傳統(tǒng)用于運(yùn)行 LLM 的 RAM 相比,閃存在移動(dòng)設(shè)備中容量要大得多。

IT之家注意到,他們的方法巧妙地利用兩種關(guān)鍵技術(shù)繞過限制,從而最小化數(shù)據(jù)傳輸并最大化閃存內(nèi)存吞吐量:

  • 窗口化(Windowing):可以將其視為一種回收利用的方法。AI 模型不會(huì)每次都加載新數(shù)據(jù),而是會(huì)重復(fù)使用部分已處理的數(shù)據(jù)。這減少了頻繁讀取內(nèi)存的需要,讓整個(gè)過程更加流暢高效。

  • 行-列捆綁(Row-Column Bundling): 這種技術(shù)類似于你讀一本書時(shí),不是逐字逐句地閱讀,而是成段地閱讀。通過更有效地分組數(shù)據(jù),可以從閃存中更快地讀取數(shù)據(jù),從而加速 AI 理解和生成語言的能力。

論文指出,這項(xiàng)技術(shù)可以讓 AI 模型的運(yùn)行規(guī)模達(dá)到 iPhone 可用內(nèi)存的兩倍。在這項(xiàng)技術(shù)的加持之下,LLM 的推理速度在 Apple M1 Max CPU 上提高了 4-5 倍,在 GPU 上提高了 20-25 倍。“這一突破對(duì)于在資源有限的環(huán)境中部署先進(jìn)的 LLM 至關(guān)重要,極大地?cái)U(kuò)展了它們的適用性和可訪問性,” 研究人員寫道。

更快更強(qiáng)的 iPhone AI

人工智能效率的突破為未來的 iPhone 開辟了新的可能性,例如更先進(jìn)的 Siri 功能、實(shí)時(shí)語言翻譯以及攝影和增強(qiáng)現(xiàn)實(shí)中復(fù)雜的 AI 驅(qū)動(dòng)功能。該技術(shù)還為 iPhone 在設(shè)備上運(yùn)行復(fù)雜的人工智能助手和聊天機(jī)器人奠定了基礎(chǔ),據(jù)悉蘋果已經(jīng)開始著手這項(xiàng)工作。

蘋果開發(fā)的生成式 AI 最終可能被整合到其 Siri 語音助手中。2023 年 2 月,蘋果舉辦了人工智能峰會(huì),并向員工介紹了其大型語言模型工作。據(jù)彭博社報(bào)道,蘋果的目標(biāo)是打造一個(gè)更智能的 Siri,與 AI 深度集成。蘋果計(jì)劃更新 Siri 與信息應(yīng)用程序的交互方式,讓用戶能夠更有效地處理復(fù)雜問題和自動(dòng)完成句子。除此之外,傳聞蘋果還計(jì)劃將 AI 添加到盡可能多的蘋果應(yīng)用程序中。

Apple GPT:口袋里的超級(jí)大腦

據(jù)報(bào)道,蘋果正在研發(fā)自己的生成式 AI 模型,代號(hào)為“Ajax”,旨在與 OpenAI 的 GPT-3 和 GPT-4 競(jìng)爭(zhēng),擁有 2000 億個(gè)參數(shù),暗示其在語言理解和生成方面具有高度復(fù)雜性和強(qiáng)大的能力。Ajax 在內(nèi)部被稱為“Apple GPT”,旨在統(tǒng)一蘋果機(jī)器學(xué)習(xí)開發(fā),這表明蘋果將 AI 更深入地整合到其生態(tài)系統(tǒng)中。

據(jù)最新報(bào)道,Ajax 被認(rèn)為比早期的 ChatGPT 3.5 更加強(qiáng)大。然而,一些消息人士也指出,OpenAI 的新模型可能已經(jīng)超越了 Ajax 的能力。

The Information 和分析師 Jeff Pu 均聲稱,蘋果將在 2024 年底左右,也就是 iOS 18 發(fā)布之時(shí),在 iPhone 和 iPad 上提供某種形式的生成式 AI 功能。Pu 在 10 月份表示,蘋果將在 2023 年建設(shè)數(shù)百臺(tái) AI 服務(wù)器,2024 年還將建設(shè)更多服務(wù)器。據(jù)報(bào)道,蘋果將提供云端 AI 和設(shè)備端處理 AI 相結(jié)合的解決方案。

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:蘋果,iPhone大型語言模型

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知