Dopamine Bonuses

Kakade, Sham; Dayan, Peter

Dopamine Bonuses

Files

1872_dopamine_bonuses.pdf (1.46 MB)

Penn collection

Statistics Papers

Subject

Applied Statistics
Biostatistics

Permalink

https://repository.upenn.edu/handle/20.500.14332/47862

View all metadata

Author

Kakade, Sham

Dayan, Peter

Abstract

Substantial data support a temporal difference (TD) model of dopamine (DA) neuron activity in which the cells provide a global error signal for reinforcement learning. However, in certain circumstances, DA activity seems anomalous under the TD model, responding to non-rewarding stimuli. We address these anomalies by suggesting that DA cells multiplex information about reward bonuses, including Sutton's exploration bonuses and Ng et al's non-distorting shaping bonuses. We interpret this additional role for DA in terms of the unconditional attentional and psychomotor effects of dopamine, having the computational role of guiding exploration.

Publication date

2000-01-01

Journal title

Advances in Neural Information Processing Systems

Collection

Articles