設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

商湯發(fā)布日日新 5.0 大模型:推理上下文窗口 200K,號(hào)稱對(duì)標(biāo) GPT-4 Turbo

2024/4/24 19:30:24 來(lái)源:IT之家 作者:清源 責(zé)編:清源
感謝IT之家網(wǎng)友 華南吳彥祖Louis9998、Diixx飛翔的企鵝哈、風(fēng)見(jiàn)暉一、袁山野人 的線索投遞!

IT之家 4 月 24 日消息,4 月 23 日,商湯科技發(fā)布了日日新 5.0 大模型。據(jù)介紹,該模型采用 MOE 混合專(zhuān)家架構(gòu),在知識(shí)、數(shù)學(xué)、推理和代碼能力方面大幅提升。

該模型基于超過(guò) 10TB tokens 訓(xùn)練,具備 200K 推理上下文窗口(IT之家注:相當(dāng)于 36.5 萬(wàn)個(gè)漢字),推理時(shí)上下文窗口達(dá)到 200K 左右,更號(hào)稱“全面對(duì)標(biāo) GPT-4 Turbo”。其提供自然語(yǔ)言處理、圖片生成、自動(dòng)化數(shù)據(jù)標(biāo)注、自定義模型訓(xùn)練等多種大模型及能力

文科能力方面,其在創(chuàng)意寫(xiě)作、推理總結(jié)等方面能力均有提升,可為教育、內(nèi)容產(chǎn)業(yè)等垂直應(yīng)用場(chǎng)景提供輔助;理科能力方面,其數(shù)理、代碼及推理等方面能力也進(jìn)行了增強(qiáng),官方表示可為金融、數(shù)據(jù)分析等場(chǎng)景落地提供基礎(chǔ)。

目前,日日新 5.0 大模型已經(jīng)正式面向全網(wǎng)用戶開(kāi)放,點(diǎn)此直達(dá)

商湯方面表示,在小米汽車(chē) SU7 的智能座艙內(nèi)也應(yīng)用了商湯大模型技術(shù),小愛(ài)同學(xué)采用了基于商湯端云大模型的解決方案,可為車(chē)主提供智能化交互體驗(yàn)。

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:商湯商量大模型,日日新商湯

軟媒旗下網(wǎng)站: IT之家 最會(huì)買(mǎi) - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買(mǎi) 要知