感謝IT之家網友 軟媒新友1943660 的線索投遞!
IT之家 10 月 12 日消息,IT之家從中國移動官方獲悉,在今天召開的 2024 中國移動全球合作伙伴大會期間,中國移動聯合電子標準院及 16 家重點央企共同開展大模型評測體系建設工作,并發(fā)布《通用大模型評測標準》。
據介紹,該標準是大模型評測體系建設的重要成果,為產業(yè)界遴選優(yōu)質大模型提供重要參考依據。第一階段將圍繞通用領域和 4 個重點行業(yè)領域,從評測標準制定、評測基地建設、評測試點應用等方面開展工作。
通用大模型評測標準基于“2-4-6”框架如下:
“2”:兩類評測視角,以重點行業(yè)實際使用需求為導向,與國標對模型能力要求拉齊,將評測任務劃分為理解和生成兩類視角。
“4”:四類評測要素,從評測全生命周期中提取出評測工具、評測數據、評測方式和評測指標四類關鍵要素,確保評測工作可實施性。
“6”:六大評測維度,綜合考慮大模型應用過程中的核心能力,設定功能性、準確性、可靠性、安全性、交互性和應用性六大維度。
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。