~とある湖畔から~

脳と意思決定の研究の記録

目標指向行動と海馬

目標指向行動とは、目的や目標に向けて、試行錯誤や計画によって行われる柔軟な行動である。この目標指向行動と記憶に関連する脳部位の海馬の関連を検討した論文。

 

Goal-directed actions transiently depend on dorsal hippocampus.

Bradfield, L.A., Leung, B.K., Boldt, S. et al.

Nat Neurosci 23, 1194–1197 (2020).

目標指向行動は背側海馬に過渡的に依存する

 

概要

海馬の目標指向行動への関与は、一致した見解はなく不明確である。

先行研究による結果の相違は、実験に用いる課題のトレーニング期間の違いによる可能性がある。

本論文では、outcome devaluation task(価値低下課題)を用いて、海馬の目標指向行動への関与と課題トレーニング期間との関係を検討した。

 

結果

outcome devaluation taskは、ラットに2つのレバーを押すと報酬を獲得できることを学習させるトレーニングと、2つのレバーを選択させるテストの段階からなる。トレーニングでは、一方のレバーを押す(A1: Action1)と報酬1(Outcome1: O1)が獲得でき、もう一方のレバーを押すと(A2: Action2)と報酬1(Outcome2: O2)が獲得できることを学習させる。次の日のテストの開始前に、ラットに一方の報酬(例えばO1)を自由に食べさせておく。そうすると、テストで2つのレバーを選ばせると、ラットはO1よりもO2が獲得できるレバーを多く押す。つまり、O1の価値が低下したためにA1への反応が低下し、O2の価値が高くなりA2への反応が高くなる。これは、自分の状態に応じて好ましい目標に向た行動をとったことを示す。

 

2日間トレーニング行った後に、価値低下テストを行った。テストの際に海馬の神経活動を抑制すると、価値低下させた報酬に関連づいたレバーへの反応低下が起こらなかった(Fig1f)。

上記のテストの後に4日間トレーニングを追加し、再度価値低下テストを行うと、テストの際に海馬の神経活動を抑制すると、価値低下させた報酬に関連づいたレバーへの反応低下が起こった(Fig.1g)。

これらの結果は、トレーニング期間が短い時のみ、海馬が目標指向行動に関連することを示す。

 

次に価値低下テストの際に、トレーニングとは異なる部屋で行った。

2日間のトレーニング後に価値低下テストを行う場合、テストを行う部屋を変えると価値低下が起こらなかった(Fig.2b)。

6日間のトレーニング後に価値低下テストを行う場合、テストを行う部屋を変えると価値低下が起こった(Fig.2c)。

さらに、

2日間のトレーニングをして1日後に価値低下テストを行う場合、テストを行う部屋を変えたことによる価値低下の抑制が起こらなかった(Fig.2e)。

2日間のトレーニングをして7日後に価値低下テストを行う場合、テストを行う部屋を変えたことによる価値低下の抑制が起こった(Fig.2e)。

 

結論と考察

海馬は目標指向行動に過渡的・一時的に関与する。この現象は、海馬に保持された環境情報を使用するために現れた。

記憶情報は最初海馬に保持され、時間の経過にともなって記憶情報は大脳皮質へ移行し貯蔵される(system consolidation)。このために、学習の直後の海馬の抑制によって、記憶情報が正しく使えず、目標指向行動が阻害されたと考えられる。

 

感想

結果後半のテストの環境を変えることによる価値低下の変化を見ると(Fig.2bc)、記憶のgeneralizationが起こったように見える。記憶のgeneralizationは海馬から皮質への情報の移行で起こることなのか、皮質から情報を引き出す際に起こることなのか興味深い。