IT之家 7 月 31 日消息,阿里旗下達(dá)摩院日前與大連理工大學(xué)合作,推出了一款名為 HQTrack 的 AI 框架。該框架主要由視頻多目標(biāo)分割器(VMOS)和掩模優(yōu)化器 (MR) 組成,旨在“實(shí)現(xiàn)對(duì)視頻中任何目標(biāo)的高質(zhì)量跟蹤”。
研究團(tuán)隊(duì)表示,HQTrack 基于開(kāi)源框架 DeAOT、HQ-SAM,在此之上進(jìn)行了一定改進(jìn),實(shí)現(xiàn)了“在視頻中分割各目標(biāo)”的可能性。
同時(shí),研究團(tuán)隊(duì)使用 Intern-T 作為特征提取器,提高框架對(duì)不同類型物體的區(qū)分能力,同時(shí)加入了一個(gè)門(mén)控傳播模塊(GPM),以便于框架在復(fù)雜環(huán)境中感知更多微小物體,生成高質(zhì)量的即時(shí)目標(biāo)遮罩。
據(jù)悉,在 VOTS2023 競(jìng)賽中,HQTrack 以 0.615 的質(zhì)量得分獲得第二名,研究團(tuán)隊(duì)表示,該 AI 框架可以應(yīng)用于人臉識(shí)別、智能駕駛、監(jiān)控追蹤等領(lǐng)域,并有望在未來(lái)商業(yè)應(yīng)用中落地。
該項(xiàng)目目前已經(jīng)在 GitHub 中開(kāi)放,感興趣的小伙伴們可以在此訪問(wèn),IT之家將 HQTrack 核心功能轉(zhuǎn)錄于下方:
1. 多目標(biāo)追蹤:HQTrack 可以同時(shí)追蹤多個(gè)目標(biāo)對(duì)象,適用于復(fù)雜場(chǎng)景下的目標(biāo)追蹤任務(wù)。
2. 目標(biāo)分割:HQTrack 能夠準(zhǔn)確地分割視頻中的目標(biāo)對(duì)象,并生成高質(zhì)量的目標(biāo)遮罩,可用于目標(biāo)識(shí)別和分析。
3. 高質(zhì)量輸出:HQTrack 的追蹤結(jié)果具有高質(zhì)量和高準(zhǔn)確性,能夠滿足各種應(yīng)用場(chǎng)景的需求。
4. 簡(jiǎn)單易用:HQTrack 提供了簡(jiǎn)潔的接口和使用指南,用戶可以輕松地使用和集成該工具。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。