什么是啞口套和窗套(什么是啞口) WIN10電流麥解決方法(win10電腦電流麥怎么解決方法) 平時多吃什么食物補腎效果最好(平時多吃什么食物補腎效果最好女性) 哈倫褲適合什么年齡穿(哈倫褲適合什么人穿) 魔獸世界前夕稀有精英位置一覽 看完就知道了(魔獸世界9.0前夕稀有精英位置與掉落) 如何實現(xiàn)創(chuàng)業(yè)成功(如何實現(xiàn)創(chuàng)業(yè)成功發(fā)展) QQ空間如何添加大圖模塊(qq空間怎么添加圖片模塊) 夢幻西游挖礦賺錢(挖礦賺錢) 剖腹產(chǎn)的好處(剖腹產(chǎn)的好處有哪些) 如圖已知ab為圓o的直徑弦cd⊥ab垂足為h(如圖 已知AB是圓O的直徑 弦CD垂直AB 垂足為H) 深圳上下沙租房攻略(深圳下沙哪里租房便宜) 被2345和hao123主頁篡改修復方法 2015(2345是怎樣篡改主頁的以及如何徹底刪除) nba歷史得分榜百度一下(nba歷史得分榜百度百科) 如何防霧霾 什么口罩防霧霾效果好(什么口罩可以防霾) 制作手工的材料有哪些(制作手工的材料有哪些簡單) 天使等級 北京商標注冊流程圖(北京商標注冊流程圖解析) Galaxy S4 發(fā)布 全面解析新旗艦 圖(galaxy s4 上市時間) 土大黃根主要治什么?。ㄍ链簏S與大黃的區(qū)別) vivo手機怎么定位(vivo手機怎么定位查找) dnf更新失敗怎么辦 安裝文件寫入失敗怎么辦(為什么dnf更新寫入失敗) 隔玻璃曬太陽能起作用(隔著玻璃曬太陽能補鈣) steam國服怎么玩apex(steam國服怎么玩最終幻想14) 納雍縣是哪個市 蜂蜜可以放冰箱嗎(蜂蜜可以放冰箱嗎可以放多久) 電腦怎么連熱點(聯(lián)想電腦怎么連熱點) 石器時代寵物攻略(石器時代寵物大全) 經(jīng)濟管理出版社地址(經(jīng)濟管理出版社) 芒果tv怎么看湖南衛(wèi)視(芒果tv怎么看湖南衛(wèi)視回放) iPhone13如何在微店購物?(iphone13直營店可以直接買到嗎) 淘寶海外版叫什么(淘寶海外版) 幽門螺桿菌抗體(幽門螺桿菌抗體偏高是怎么回事) iOS7.1.1固件下載(ios7.0.4固件下載) 紙的來源視頻(紙的來源) QQ農(nóng)場怎么出售種子精華(QQ農(nóng)場種子精華) 玉兔出宮怎么畫(玉兔出宮怎么畫簡單) 光電信息科學與工程是干什么工作(光電信息科學與工程是干什么的) 卡通簽名頭像怎么制作(卡通簽名頭像怎么制作軟件) 比賽規(guī)則有哪些(比賽規(guī)則) 黑夾子的小妙用(黑夾子的小妙用有哪些) dear sir or madam要大寫嗎(dear sir or madam) 保衛(wèi)蘿卜——天際2攻略(保衛(wèi)蘿卜天際2關攻略) XP輸入法狀態(tài)條不見了怎么辦(xp輸入法不顯示) 語言能力描述范文100字(語言能力描述) 電腦顯示器總是黑屏怎么辦(電腦顯示器總是黑屏怎么辦恢復) 銀屑病怎么治療最好呢(治療銀屑病有什么好辦法) 東非高原動物大遷徙(東非高原) 茶葉怎樣利用微波進行了快速殺青處理(茶葉怎樣利用微波進行了快速殺青處理工藝) Java:將數(shù)組排序并使用二分法判斷數(shù)組元素(java對二維數(shù)組排序) 密不可分的英語短語(密不可分的英語)
您的位置:首頁 >行業(yè)觀察 >

研究人員開發(fā)指標來量化動物對獎勵反饋的反應信息

導讀 日常生活充滿了選擇。幾十年來,研究人員一直著迷于人類和其他動物如何決定在相互競爭的優(yōu)先事項之間分配時間和精力。心理學家發(fā)現(xiàn),大多數(shù)

日常生活充滿了選擇。幾十年來,研究人員一直著迷于人類和其他動物如何決定在相互競爭的優(yōu)先事項之間分配時間和精力。心理學家發(fā)現(xiàn),大多數(shù)動物會根據(jù)從選項中獲得的獎勵來分配時間,并根據(jù)獎勵反饋相應地調(diào)整它們的行為,這是一種稱為“匹配”的行為法則。達特茅斯領導的研究團隊開發(fā)了衡量獎勵反饋響應信息內(nèi)容的指標,并使用這些指標來預測匹配行為。結果發(fā)表在《自然通訊》上。

“匹配是我們?nèi)绾卧诳捎眠x項之間進行選擇的基礎,”共同第一作者 Ethan Trepka '22 說,他是達特茅斯計算和認知神經(jīng)科學實驗室的學生。“它控制著我們在雜貨店選擇哪條收銀臺,或者我們在不同的學?;蚬ぷ黜椖可匣ㄙM多少時間。一個人選擇在給定選項上花費多少時間取決于相對于其他選項從該選項中獲得獎勵的頻率。”

達特茅斯的一個團隊與其他研究人員合作,重新分析了分別在約翰霍普金斯大學和美國國立衛(wèi)生研究院收集的小鼠和猴子的行為數(shù)據(jù)。在實驗中,老鼠和猴子在兩個選項或行動之間做出選擇,并根據(jù)他們的選擇獲得獎勵——老鼠的水和猴子的蘋果汁。具有更高獎勵概率的選項可能會改變,因此動物在做出選擇時必須跟蹤之前的獎勵。結果表明,小鼠和猴子都表現(xiàn)出不匹配,一般傾向于選擇比匹配法規(guī)定的更少的更好的選項。

為了預測這種與匹配法則的偏差,研究人員開發(fā)了一套新的指標,用于衡量動物根據(jù)獎勵結果繼續(xù)或從當前選項轉(zhuǎn)換的趨勢中的“驚喜”或不一致。這些指標基于“信息論”中的“熵”概念,這是一種數(shù)學框架,可用于量化系統(tǒng)中的不確定性或意外的數(shù)量。先前關于選擇行為的研究通常依賴于計算模型,這些模型需要對從每個獎勵反饋中學到的東西做出假設,但新的指標不需要這樣的假設。這些指標還提供了一種量化自適應行為的新方法,可用于改進以前的學習和決策計算模型。

“當我們面臨不同的選擇時,我們會使用之前選擇的結果來做出未來的決定,這應該讓我們在大多數(shù)情況下選擇更好(更有價值)的選擇,”資深作者Alireza Soltani說。,心理和腦科學副教授,達特茅斯計算和認知神經(jīng)科學實驗室的首席研究員。“然而,我們并沒有像我們應該的那樣經(jīng)常選擇更好的選擇,最終結果不匹配。雖然選擇劣質(zhì)選項可以在不斷變化的環(huán)境中發(fā)現(xiàn)新的機會,但當對劣質(zhì)選項的獎勵反饋被忽視并且反應不一致時,匹配不足會顯著增加。由于匹配不足通常會減少可以獲得的總獎勵,因此被認為是不可取的。”

標簽:

免責聲明:本文由用戶上傳,如有侵權請聯(lián)系刪除!

最新文章