IT之家 3 月 7 日消息,科技媒體 patentlyapple 昨日(3 月 6 日)發(fā)布博文,報(bào)道稱蘋果最新獲批一項(xiàng)技術(shù)專利,涉及基于視覺的手勢定制技術(shù)。
該專利通過引入元學(xué)習(xí)(Meta-Learning)框架,解決了手勢識別中的“少樣本學(xué)習(xí)”(Few-Shot Learning, FSL)難題,讓用戶能夠自定義手勢,提升交互效率和個(gè)性化體驗(yàn)。
技術(shù)背景與挑戰(zhàn)
手勢識別技術(shù)近年來在虛擬現(xiàn)實(shí)、游戲和智能家居等領(lǐng)域得到廣泛應(yīng)用,但自動(dòng)識別手勢仍面臨諸多挑戰(zhàn)。傳統(tǒng)技術(shù)僅能識別預(yù)定義手勢,無法滿足用戶個(gè)性化需求。
此外,少樣本學(xué)習(xí)(FSL)問題也限制了手勢識別的靈活性,即模型需要在有限數(shù)據(jù)下快速學(xué)習(xí)新手勢,同時(shí)避免過擬合。
解決方案:元學(xué)習(xí)與圖變換器
蘋果的專利技術(shù)通過結(jié)合元機(jī)器學(xué)習(xí)(meta-learning)和圖變換器(Graph Transformer),構(gòu)建了一個(gè)全面的手勢定制框架。該技術(shù)利用 RGB 攝像頭等成像傳感器,支持靜態(tài)、動(dòng)態(tài)、單手和雙手等多種手勢類型。
用戶只需演示一次手勢,系統(tǒng)即可通過捕捉幀序列完成定制。此外,專利還整合了遷移學(xué)習(xí)和元增強(qiáng)技術(shù),進(jìn)一步提升了模型的泛化能力。
該技術(shù)不僅提高了電子設(shè)備的手勢識別精度,還為個(gè)性化交互開辟了新路徑。例如,用戶可以根據(jù)自身需求定義專屬手勢,提升操作效率和記憶性。同時(shí),該技術(shù)對特定需求群體(如殘障人士)更具包容性,為人機(jī)交互的普及化提供了技術(shù)支持。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。