運動学習と繰り返し〜ヘブ則と非ヘブ則を考える〜
- Nagashima Kazuhiro
- 10月16日
- 読了時間: 6分
「運動学習には、一定の動作を10万回繰り返す必要がある」と耳にしました。
面白い言葉ですよね。
ただ、この話を聞いたときに、少し“科学的ではないな”という印象を持ったのです。
回数だけが独り歩きしていて、その背後にある条件や背景が見えにくい気がしたのですね。
というわけで、ちょっと調べてみたのです。
おそらくではありますが、運動学習とその頻度について研究されていたのは、おそらく運動学習の論理的基盤としてヘブ則が研究されている時期だと考えられます。
ヘブ則とは、1949年にドナルド・ヘッブによって提唱された「細胞Aの軸索が細胞Bを発火させるのに十分近くにあり、繰り返しあるいは絶え間なくその発火に参加するとき、いくつかの成長過程あるいは代謝変化が一方あるいは両方の細胞に起こり、細胞Bを発火させる細胞の1つとして細胞Aの効率が増加する。」という仮説です。
これは脳の可塑性を示す重要な科学的な仮説のひとつです。この考え方は後に、1973年にBlissとLømoによって海馬で発見された長期増強(LTP)という現象によって、生理学的にも裏付けられました。
”細胞Aの軸索が細胞Bを発火させるのに十分近くにあり、繰り返しあるいは絶え間なくその発火に参加するとき”にシナプスレベルでの効率が増加することを提唱していて、この”絶え間なくその発火に参加するとき”というのが繰り返しの重要性を示しているものと思います。
ところがヘブ則は、いくつかの問題点があることが知られています。例えば、絶え間なくその発火に参加すると理論上シナプス接続の効率が際限なく増加してしまうため、安定化メカニズムが想定されていない点が課題とされました。また、いったん運動学習されたパターンと異なるパターンを学習する際には、以前学習されたパターンのシナプス接続を弱化させる必要があることが知られているのですが、ヘブ則にはこのメカニズムは想定されていません。つまり、ヘブ則は『強化』は説明できても、『弱化』や『再編』といった可塑性の可逆性までは説明できないということになります。
その後、1990年代に入ると、スパイク時系列依存可塑性(STDP)や塚田による時空間学習則など、ヘブ則を拡張する新しい学習モデルが提案され、現在の神経科学では『非ヘブ則』として研究が進められています。
さて、そうすると10万回繰り返す必要があるというお話は、1950年代〜1990年代に出たのではないかと推測しました。
この頃、Dr .Nudoが盛んに運動学習について研究をされておられますね。
目についたのはこの論文です。
「Neural Substrates for the Effects of Rehabilitative Training(1996)」
この論文は有料なので全文は読めてないのですが、これ猿に脳梗塞を作って、リハビリ訓練群と非訓練群に分けて脳のマッピングを見るような研究です。脳梗塞発症後5日目にリハビリ開始し、訓練時間は60分〜90分/日、期間は4〜5週間。一回のセッションで100〜200回の繰り返しがあった様子。トータルの回数は、数千回から1万回程度だろうと推測できます。これらの実験で、脳のマッピングに変化が起きたことを報告しています。
動作の回数と脳のマップの変化というところに着目されていて、おそらくこの回数の部分が人間に対して考えると10万回というあまり科学的ではない根拠で言われ始めたのではないかと思うのです。
この研究でもう一つ気になるのは、実験対象の猿は、新規の脳梗塞で、新たに回路を組み直していると推測できる点ですね。
先に述べた通り、何かしらの非効率的な運動学習が起きた後というわけではなさそうです。
つまり非効率的な運動や行動がある程度学習/定着してしまったような回復期以降のリハビリテーションの指標として考えるのは少し無理がありそうですよね。
そうした状況においては、学習/定着した運動プログラム(シナプスの接続)をいったん不安定にしないと新しい運動プログラムへ更新ができないわけですから、回数だけにこだわっていたら結局何も変化しないということも推測ができるわけです。
現代では、新しい学習の枠組みとして、さまざまな理論〜非ヘブ則と言われるヘブ則を拡張した理論が出てきています。
スパイク時系列依存可塑性(STDP)は、神経細胞Aが神経細胞Bを発火させた場合と見なせるケース──つまり、Aが発火したのちにBが発火した場合には長期増強(LTP)が起こり、逆にBが発火したのちにAが発火するような、A→Bの因果関係が否定されるケースでは長期抑圧(LTD)が起こるとする仮説です。
この仮説の優れている点は、ヘブ則のみで考えた場合に引き起こされる「シナプス接続が際限なく増加する」という問題に対し、シナプス結合を安定化させる仕組みを説明できる点です。
STDPはNMDA受容体を介したカルシウム流入量の変化によって生じることが知られていますが、なぜそのような発火パターン(とくにBが先に発火する状況)が生じるのかという分子メカニズムや、そのような発火タイミングを制御する上位神経機構については十分に説明されていません。
私の考えでは、これは前頭眼野(Frontal Eye Field)や前頭前野領域における注意・誤差検出・予測制御の働きが関与している可能性が高いと思います。
これらの領域が運動や感覚のタイミングを精密に同期させることで、プリシナプスとポストシナプスの発火タイミング差(Δt)を動的に変化させ、結果としてNMDA受容体を介したカルシウム流入量を調整していると考えると自然です。
また、前頭眼野/前頭前野の働きがLTDを引き起こすメカニズムを有するのであれば、シナプス接続をいったん不安定化させることで、既に学習されたパターンを上書き学習するための神経基盤の一端を成していると考えることができます。
もうひとつ、私が注目している仮説として、塚田稔らによって提唱された「時空間学習則(STLR)」があります。
これは、海馬CA1野などで観察された、複数の入力パルスが時間的・空間的に協調するときに可塑性が誘導されるという実験的知見を基盤とした理論です。
STLRの特徴を箇条書きにしますね。
• シナプス結合の変化は、入力ニューロン群の時空間的“協調性”と“時間的履歴”に依存する。
• 出力ニューロンが発火しなくても、入力パターンの相関により可塑性変化が生じる(発火依存ではない学習)。
• 入力系列の時空間構造が学習対象となるため、類似した入力系列を識別する能力(pattern discrimination)が高い。
面白いですよね。
海馬から始まったこの研究は、現在は前頭葉や運動前野でもこうした学習則が適応されるとされ始めています。
つまり、この仮説は出力回数への依存がヘブ則やSTDPより少ない学習のメカニズムで、入力ニューロン群の空間的荷重と、時間的荷重が学習を起こすというわけです。
リハビリテーションにおいて、多重感覚入力や新奇体験による広範な脳神経活動などが運動学習を促進するという魅力的な仮説といえます。
脳損傷リハビリテーションにおける即時効果はこうした仮説によって説明できる可能性がありますね。
ヘブ則では回数依存の学習モデルが提示されていたため、「10万回繰り返す必要がある」といった言説が生まれたのかもしれません。
しかし、現在の神経科学における新しい学習理論を見ると、必ずしも回数に依存しないケースも多く存在することがわかります。
ですから、「運動学習には10万回の反復が必要」というのは、少なくとも現代の科学的根拠に基づいた表現ではありません。
正確に言うなら、「運動学習には、動作や行為を繰り返す必要がある場合もある」くらいが妥当でしょう。
こうして見てみると、「繰り返し」という単純な量的概念から、「時間構造」や「文脈」を含む質的な学習へと、神経科学は大きくパラダイムシフトしてきたことがわかります。
リハビリテーションの現場で見られる“即時的な変化”や“文脈依存的な学習”も、この流れの延長線上にあるのかもしれません。




コメント