強化學習,又稱為再勵學習,其原理是動物學習了某種行為得到獎勵導致出現(xiàn)該行為的趨勢加強。之前的研究表明,當動物獲得意想不到的獎勵時,多巴胺神經(jīng)元興奮性增強。因此,研究人員認為這些多巴胺信號在強化學習方面發(fā)揮著重要的作用。
你有否想過,人為什么會有思想,會有感覺,會對一些事物熱烈追求,這可能都只不過是來自我們大腦內(nèi)一些微小物質(zhì)的化學作用而已。麻省理工學院的一項新研究 表明,神經(jīng)遞質(zhì)多巴胺就發(fā)揮著這樣的作用,它是一種代表獲得獎勵的信號。從另外一個角度來說,也許正在因為多巴胺水平過低,缺乏動力,帕金森病人才難以完 成大腦的指令。
在現(xiàn)實生活中,并不是所有的獎勵都能立即兌現(xiàn):為了生存,自然界的動物必須有一個長遠的目標,保持積極性,花費大量的時間和精力才可能尋找到食物。人也如此,要想到達一個目的地,必須要有堅持的動力。
麻省理工學院麥戈文腦科學研究所(McGovern Institute for Brain Research)研究員 Ann Graybiel 教授領(lǐng)導的研究小組決定研究強化學習是如何影響多巴胺水平變化的。每次實驗時,研究人員將老鼠置于水迷宮中,并播放一個指示其在路口左轉(zhuǎn)或者右轉(zhuǎn)的提示音,當老鼠到達目的地時給予巧克力牛奶作為獎勵。為了測定大腦釋放多巴胺的量,而不只是簡單測定多巴胺神經(jīng)元的活性,麻省理工和華盛頓大學的研究人員將微型碳纖維電極植入小鼠體內(nèi),利用快速掃描循環(huán)伏安法(FSCV)進行對多巴胺含量的持續(xù)性測定。FSCV 法測定老鼠經(jīng)過四個不同地點時,大腦中多巴胺的水平。每一個探針測定腦組織內(nèi)一個微小體積內(nèi)的胞外多巴胺濃度,其可能反應數(shù)以千計的神經(jīng)末梢的活性。"
研究人員驚奇地發(fā)現(xiàn),當接近目的地時,老鼠體內(nèi)的多巴胺水平平穩(wěn)上升,這似乎在表明,它在期待著獎勵。當越接近目標,多巴胺的含量越多。并且,多巴胺的水平高低與預期獎勵的豐厚程度成正比。當對老鼠進行訓練后,期待較多巧克力牛奶的老鼠,其多巴胺水平上升得更快。而在一些T型迷宮實驗中,動物需要多費一些周折才能到達目的地獲得獎勵。相應地,其多巴胺的水平是呈斜坡狀逐漸增加的。
Ann Graybiel 教授表示,正是由于帕金森病人的多巴胺水平過低,不能因大腦指令形成增加趨勢,導致患者精神萎靡。 "這意味著,多巴胺的水平可以幫助動物在選擇途徑接近目標上做出選擇,并且估計起點到終點的距離。"Salk 研究所計算神經(jīng)科學家 Terrence Sejnowsk 說。
意見反饋 關(guān)于我們 隱私保護 版權(quán)聲明 友情鏈接 聯(lián)系我們
Copyright 2002-2024 Iiyi.Com All Rights Reserved