科技日報記者 張佳欣
德國亥姆霍茲慕尼黑研究中心開發(fā)出一款名為“半人馬”(Centaur)的人工智能(AI)模型,能在幾乎所有心理學(xué)實驗中準(zhǔn)確預(yù)測人類行為,甚至超越了科學(xué)家數(shù)十年來打造的傳統(tǒng)認(rèn)知模型,堪稱“數(shù)字讀心術(shù)”。這項研究發(fā)表在最新一期《自然》雜志上,被認(rèn)為是AI與心理學(xué)融合的重要突破。
心理學(xué)家長期以來渴望找到一種既能解釋人類思維方式,又能準(zhǔn)確預(yù)測人類行為的工具。現(xiàn)有模型往往局限于其中之一,“半人馬”的出現(xiàn)改變了這一現(xiàn)狀。
“半人馬”的核心是Psych-101,這是一個包含160項心理實驗中6萬多人作出的超1000萬個決策的數(shù)據(jù)集。這些決策涵蓋從簡單的記憶任務(wù)到復(fù)雜的道德困境。每個實驗都經(jīng)過精心標(biāo)準(zhǔn)化,并用自然語言重寫,以便AI能夠理解并從中學(xué)習(xí)。
在模型構(gòu)建上,團(tuán)隊選用了Meta公司最新的Llama 3.1語言模型,并基于海量人類決策數(shù)據(jù)集進(jìn)行了微調(diào),使其能預(yù)測一系列典型的行為,而不僅僅是單一行為。團(tuán)隊用Psych-101數(shù)據(jù)集對模型進(jìn)行訓(xùn)練,整個過程在高端計算機(jī)處理器上僅耗時5天。
訓(xùn)練完成后,團(tuán)隊將“半人馬”模型與十余種行為預(yù)測模型進(jìn)行了比較,測試對象是未參與最初訓(xùn)練集的全新受試者。在32項任務(wù)中,“半人馬”在31項中都是預(yù)測最有效的模型,唯一的例外是一個語法判斷任務(wù),即參與者需判斷句子的語法是否正確。
“半人馬”與眾不同之處在于其“舉一反三”的泛化能力,也就是說,它在面對全新場景時仍能給出準(zhǔn)確預(yù)測,無論是情境設(shè)定變化(如將“太空尋寶”改為“魔毯探險”)、任務(wù)結(jié)構(gòu)調(diào)整(從雙選變?yōu)槿x),還是完全陌生的推理任務(wù),表現(xiàn)都很出色。
團(tuán)隊還發(fā)現(xiàn),“半人馬”的內(nèi)部處理機(jī)制與人類大腦活動驚人一致。盡管模型從未接觸過腦神經(jīng)數(shù)據(jù),但其內(nèi)部狀態(tài)與執(zhí)行同類任務(wù)時的人類腦電圖有高度相關(guān)性。這意味著在學(xué)習(xí)預(yù)測人類行為的過程中,AI演化出了類似人腦的信息處理方式。
除了行為預(yù)測,“半人馬”還能用于模擬人類決策過程,幫助發(fā)現(xiàn)新的心理學(xué)策略。在一項模擬實驗中,它甚至提出了一種比現(xiàn)有理論更優(yōu)的探索策略,展現(xiàn)出輔助科學(xué)發(fā)現(xiàn)的潛力。
總編輯圈點
心理學(xué)是研究人類心理活動及其規(guī)律的學(xué)科。既然有規(guī)律可循,那就有可能將海量心理學(xué)知識和規(guī)律納入數(shù)據(jù)集,用來對人工智能進(jìn)行訓(xùn)練,讓人工智能也“學(xué)會”這些知識和規(guī)律。在心理健康日益受到重視的今天,人工智能在心理學(xué)領(lǐng)域的應(yīng)用潛力巨大。比如,可以推廣專業(yè)又靠譜的AI心理咨詢師,幫助用戶解答日常的心理困惑和疑問;也可以讓聊天和陪伴機(jī)器人掌握心理學(xué)知識,為用戶提供更多“情緒價值”。期待看到人工智能為人類心理健康貢獻(xiàn)更多力量。