設置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

愛奇藝發(fā)起首個基于劇本的角色情感識別挑戰(zhàn)賽:愛、樂、驚、怒、恐、哀

2021/9/23 22:59:14 來源:IT之家 作者:騎士 責編:騎士

IT之家 9 月 23 日消息 近期,CCF 大數(shù)據(jù)與計算智能大賽第九屆正式啟動,愛奇藝攜手中國計算機學會,發(fā)起劇本角色情感識別挑戰(zhàn),誠邀全球英才組隊參與,探討技術難題和行業(yè)痛點,這也是業(yè)內(nèi)首個基于劇本的角色情感識別挑戰(zhàn)賽。

IT之家獲悉,基于劇本的角色情感識別主要是依托劇本中每句對白和動作描述,對相關角色進行多維度分析,并識別出情感。相對于常見的新聞、評論性文本的情感分析,有其獨有的業(yè)務特點和挑戰(zhàn)。

本賽題也基于愛奇藝業(yè)務場景提出,需要參賽者利用自然語言處理和相關的技術手段,來對劇本中存在的多種情感元素進行綜合判斷和識別。

劇本所富含的情感是劇本的靈魂,一個好的劇本總包含著充分的情感釋放,情感分析正是劇本評估中非常有意義的一個方面。

賽題概覽

愛奇藝為本次挑戰(zhàn)賽準備了一部分劇本場景作為訓練集,訓練集數(shù)據(jù)已由人工進行標注,參賽隊伍需要對劇本場景中每句對白和動作描述中涉及到的每個角色的情感從多個維度進行分析和識別。

本賽題的情感定義共 6 類(按順序):愛、樂、驚、怒、恐、哀;選手可以根據(jù)上述 6 類情感按固定順序?qū)那楦兄?,情感值范圍?[0, 1, 2, 3],0-沒有,1-弱,2-中,3-強,以英文半角逗號分隔;本賽題算法評分將采用常用的均方根誤差(RMSE)來計算評分,按照“文本內(nèi)容 + 角色名”識別出的 6 類情感對應的情感值來統(tǒng)計。

和其他類文體相比,劇本類文本行文風格和通常的新聞類語料差別較大,更加口語化,同時,劇本場景中的對白和動作描述都涉及到角色的情感,而且要從 6 個維度進行識別,難度也更高;再加上劇本中角色情感不僅僅取決于當前的文本,對前文語義可能有深度依賴,很容易出現(xiàn)識別錯誤。

賽題賽程

CCF 大數(shù)據(jù)與計算智能賽(CCF Big Data & Computing Intelligence Contest,簡稱 CCF BDCI)由中國計算機學會于 2013 年創(chuàng)辦,是大數(shù)據(jù)與人工智能領域的算法、應用和系統(tǒng)大型挑戰(zhàn)賽事。本次 2021 年 CCF BDCI 第九屆大賽以“數(shù)引創(chuàng)新,競促匯智”為主題,立足余杭、面向全球,歡迎各路精英選手前來參賽。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關文章

關鍵詞:愛奇藝,劇本,情感識別

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應用 魔方 最會買 要知