設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

OpenAI 的 GPT-4 變身考證能手:無額外訓(xùn)練通過日本理療師考試,正確率 73.4%

2024/8/31 9:02:36 來源:IT之家 作者:故淵 責(zé)編:故淵

IT之家 8 月 31 日消息,一項新的同行評審研究表明,OpenAI 的 GPT-4 大語言模型無需任何額外訓(xùn)練,即可通過日本國家理療考試。

最新發(fā)表在《Cureus》雜志上的新研究,測試了 GPT-4 的文字和視覺技能。

IT之家注:日本國家物理理療師考試包括 160 道綜合題和 40 道實踐題,測試記憶、理解、應(yīng)用、分析和評估能力。

研究人員在 GPT-4 中輸入了 1000 個問題,并將答案對比了官方解決方案。

GPT-4 通過了所有五個測試部分,正確回答了 73.4% 的問題。不過,人工智能在處理技術(shù)性問題和包含圖片或表格的問題時顯得有些吃力。

該模型在常規(guī)問題上的表現(xiàn)(正確率為 80.1%)遠(yuǎn)遠(yuǎn)好于實際問題(正確率為 46.6%)。

同樣,GPT-4 在處理純文本問題(正確率為 80.5%)時的表現(xiàn)也遠(yuǎn)好于那些帶有圖片和表格的問題(正確率為 35.4%)。這些發(fā)現(xiàn)與之前有關(guān) GPT-4 視覺理解局限性的研究結(jié)果一致。

有趣的是,問題難度和文本長度對 GPT-4 的性能影響不大。盡管該模型主要以英語數(shù)據(jù)為基礎(chǔ)進(jìn)行訓(xùn)練,但在使用日語輸入時也表現(xiàn)出色。

IT之家附上參考地址

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:ChatGPTOpenAI,GPT4AI

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知