5 月 25 日消息,在本月下旬最新一期的《自然-人類行為》期刊上,刊登了一篇關于 AI 的研究論文,其中提到,在測試追蹤他人心理狀態能力的任務中,兩類 AI 大語言模型在特定情況下,具備與人類相似甚至超越人類的表現。
作為人類溝通交流、產生共鳴的關鍵,心理狀態能力(也稱心智理論)對人類的社交互動來說非常重要。該論文的第一作者 —— 德國漢堡-埃彭多夫大學醫學中心的 James W. A. Strachan 與同事及合作者一起,選擇能測試心理理論不同方面的任務,包括發現錯誤想法、理解間接言語以及識別失禮等。
注:該團隊選用了 GPT 和 LLaMA2 模型進行試驗,并與 1907 人進行對比。
結果顯示,GPT 模型在識別間接要求、錯誤想法和誤導的表現能達到有時甚至超越人類平均水平,而 LLaMA2 的表現遜于人類水平;在識別失禮方面,LLaMA2 強于人類,但 GPT 表現不佳。
據中新社報道,該作者表示,LLaMA2 的成功被證明是因為回答“偏見程度”較低,并非真的對失禮敏感,GPT“表現不佳”則是因為對堅持結論具有“超保守”的態度,而非推理錯誤。
附論文地址:《Testing theory of mind in large language models and humans》
本文鏈接:http://www.www897cc.com/showinfo-45-4451-0.html《自然》雜志研究:AI 追蹤他人心理狀態能力與人類相當或超越人類
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com