強化計画とは何ですか?

補強のスケジュールは学習にどのような影響を与えますか?

オペラント・コンディショニングは、新たな行動が結果と関連して取得され、変更される学習プロセスである。 ビヘイビアを強化すると、将来発生する可能性が高くなりますが、ビヘイビアを実行すると反復される可能性は低くなります。 オペラントコンディショニングでは、補強のスケジュールは学習プロセスの重要な要素です。

行動を強化する時期と頻度は、反応の強さと速度に劇的な影響を与える可能性があります。

強化計画とは何ですか?

それでは補強のスケジュールはどういうもので、調整プロセスではどのように機能しますか? 強化のスケジュールは、基本的にどの行動のインスタンスが強化されるかを示すルールです。 場合によっては、発生するたびに行動が強化されることがあります。

場合によっては、行動が全く強化されないこともあります。

状況に応じて、 正の強化または負の強化のいずれかを使用することができる。 どちらの場合でも、強化の目標は常に行動を強化し、将来起こる可能性を高めることです。

自然に発生する学習環境とより構造化された訓練状況の両方で学習がどのように行われるかを考えて、強化スケジュールがどのように機能するかをより良く感じることができます。

実際の環境では、行動が起こるたびに強化されるとは限りません。 教室やスポーツ、動物訓練などの行動を意図的に訓練し、強化しようとしている状況では、特定の強化スケジュールに従うことを選ぶかもしれません。

以下に示すように、一部のスケジュールは特定の種類のトレーニング状況に最も適しています。 いくつかのケースでは、トレーニングは1つのスケジュールで開始し、望ましい行動が教えられたら別のスケジュールに切り替えることを要求するかもしれません。 特定の状況では、特定の補強スケジュールがより効果的な場合があります。

強化スケジュールには2種類のタイプがあります。

継続的な強化スケジュール

継続的な補強では、所望の挙動が発生するたびに強化される 。 このスケジュールは、行動と応答との間に強い関連性を作り出すために、学習の初期段階で最もよく使用されます。

たとえば、犬に手を振るように教えようとしているとします。 学習の最初の段階では、行動を教えて確立するために、継続的な強化計画に固執するでしょう。 まず、動物の足をつかんで、振る舞いをしたり、「振る」と言ったり、この一連の手順を実行するたびに報酬を提示したりすることから始めることができます。 最終的に、犬は自分自身で行動を開始し、行動がうまく成立するまで、正しい反応を1つずつ補強し続けることを選択するかもしれません。

応答がしっかりと取り付けられていれば、補強は通常部分強化計画に切り替える。

部分的な強化スケジュール

部分的または間欠的な補強では、応答は時間の一部だけが強化されます。 学んだ行動は部分的な補強によってよりゆっくりと獲得されるが、応答は消滅に対してより耐性がある。

たとえば、犬を訓練していた先の例を考えてみましょう。 最初は連続したスケジュールを使用していましたが、動作のすべての単一のインスタンスを強化することは必ずしも現実的ではない場合があります。 最終的には、非常に多くの応答が発生したあと、またはあまりにも多くの時間が経過した後で強化を提供する部分的なスケジュールに切り替えることになります。

部分補強には4つのスケジュールがあります:

固定金利スケジュールは、指定された数の応答後にのみ応答が強化されるスケジュールです。 このスケジュールは、補強材を配達した後に一時的に停止するだけで、高く安定した反応を示します。 固定比率スケジュールの例は、バーを5回押した後、ラットに食餌ペレットを送達することである。

予測不可能な数の応答の後に応答が強化されると、 可変比率のスケジュールが発生します。 このスケジュールは高い安定した反応率を作り出します。 ギャンブルや宝くじのゲームは、変動率スケジュールに基づく報酬の良い例です。 実験室環境では、これは、1回のバープレス後、再び4回のバープレス後、および2回のバープレス後に3回目のペレット後に食物ペレットをラットに送達することを含む。

固定間隔スケジュールは、指定された時間が経過した後に初めて応答が返されるスケジュールです。 このスケジュールは、インターバルの終わり近くに大量の応答を引き起こすが、補強剤の送達直後の反応はずっと遅い。 実験室環境におけるこの例は、30秒の間隔が経過した後の第1のバープレスのためのラットペレットを用いてラットを補強することである。

予測不可能な時間が経過した後に応答が報酬を受け取ると、 可変間隔のスケジュールが発生します。 このスケジュールは、ゆっくりとした安定した応答をもたらします。 これの一例は、1分間隔で最初のバープレス後にラットに食物ペレットを送達すること、5分間隔で第1の応答のための別のペレット、および第1の応答のための第3の食物ペレットを3分間隔。

どのように補強のスケジュールを選んでいますか?

ビヘイビアをいつ強化するかは、いくつかの要因によって決まります。 特に新しい行動を教えようとしている場合は、しばしば継続的なスケジュールが良い選択です。

振る舞いが学習されたら、部分的なスケジュールに切り替える方が望ましい場合がよくあります。

日常生活において、部分的な補強のスケジュールは、連続するものよりもずっと頻繁に起こる。 たとえば、時間通りに働くようになるたびに報酬を受け取ったとします。 代わりに、そのような報酬は、予測がはるかに少ない部分補強スケジュールで通常は補われます。 これらのスケジュールははるかに現実的で実装が容易なばかりでなく、絶滅の影響を受けにくく、応答率も高くなる傾向があります。

現実的には、発生するたびに行動を強化するのは難しく、多くの注意とリソースが必要です。 部分的なスケジュールは、消滅に対してより耐性のある行動につながる傾向があるだけでなく、被験者が飽和状態になるリスクも低減する。 使用している補強材がもはや望ましくないか報酬を与えられていない場合、被験者は所望の挙動の実行を停止することができる。

たとえば、犬を座らせるように教えようとしているとします。 あなたが報酬として食べ物を使用している場合、犬は一度いっぱいになると行動を停止する可能性があります。 そのような場合、賞賛や注意のようなものがより効果的な強化者かもしれません。

からの言葉

オペラントコンディショニングは強力な学習ツールになります。 訓練とメンテナンスの過程で利用される補強のスケジュールは、行動の獲得の速さ、反応の強さ、行動の表示頻度に大きな影響を与えることがあります。 どのスケジュールが望ましいかを判断するためには、教えられている行動のタイプや必要な対応のタイプなど、状況のさまざまな側面を考慮することが重要です。

>出典:

> Cooper、J、Heron、T、&Heward、W. 応用行動分析 ニュージャージー:ピアソン教育; 2007。

> Nevid、JS。 心理学の要点:概念と応用。 ボストン、マサチューセッツ州:Cengage Learning; 2016年