脳の価値判断ー報酬の予測とドーパミン神経系ー
価値は脳内の報酬系が関与する
前回は報酬を獲得するとドーパミン神経の活動が高まることを見てきました。
今回はもう少しドーパミン神経の活動を見ていきます。
ドーパミン神経は報酬の予測でも活動する
サルが報酬を獲得すると、ドーパミン神経の活動が上がます(下図(a))。
この報酬を獲得したときに反応したドーパミンの活動は実際にはどのような情報を処理していることが反映されているのでしょうか?
次にサルに音刺激を提示して一定時間後にジュースを与えました(下図(b))。
しばらくこの手続きを繰り返すと、サルは音刺激を聞いた段階でジュースが与えられることを予測できるようになります。
この現象は条件付けとして知られ、音刺激を条件付け刺激といいます。
このようにサルが音刺激によって報酬が予測できるようになると、ドーパミン神経は音刺激が提示された段階で活動し、ジュースを獲得した時には活動しなくなります(下図(b))。
このことは、
- 脳が音刺激がジュースと同様の価値を持つことを学習したこと
- 脳が音刺激が提示された段階でジュースを獲得できると判断していること
を示唆します。
予測した報酬が得られないとドーパミン神経は抑制される
さらにこの実験では、音刺激ー報酬の関係を学習した後に、音刺激を提示した後にジュースを与えない場合のドーパミン神経の活動を検討しています。
この条件では音刺激が提示された際にドーパミン神経の活動は上がりますが、音刺激提示後の通常であればジュースが与えられるタイミングになると、ドーパミン神経の活動は抑制されます(下図(c))。
参考:Schultz et al., Science 1997
報酬の予測と実際の報酬
サルの条件付け実験の結果をまとめると、
ということがわかりました。
上記を言い換えると、
- 報酬が予測された時点で(実際に報酬は得ていなくても)、その報酬の価値を得たと感じる
- 予測された報酬を実際に獲得した時点では、その報酬の価値を感じない
- 予測された報酬が得られないと、損失を感じる
ということです。
この報酬予測と報酬獲得に見られるドーパミン神経の活動から、脳がどのように価値を判断しているのかが見えてきます。この点については、次回の記事で見ていきます。
参考文献
- Schultz W, Dayan P, Montague PR. A neural substrate of prediction and reward. Science. 1997 Mar 14;275(5306):1593-9. doi: 10.1126/science.275.5306.1593.
- Tsai HC, Zhang F, Adamantidis A, Stuber GD, Bonci A, de Lecea L, Deisseroth K. Phasic firing in dopaminergic neurons is sufficient for behavioral conditioning. Science. 2009 May 22;324(5930):1080-4. doi: 10.1126/science.1168878. Epub 2009 Apr 23.
Photo by Riccardo Annandale on Unsplash