オペラントコンディショニングとは何ですか?それはどのように機能しますか?

強化と罰が行動をどのように修正するか

オペラントコンディショニング( 器械コンディショニングと呼ばれることもある)は、行動の報酬と罰によって生じる学習方法です。 オペラントコンディショニングを介して、その行動に対する行動と結果との関連付けが行われる。

例えば、ラットラットが青色のボタンを押すと報酬として食べ物ペレットを受け取るが、赤いボタンを押すと軽い感電を受ける。

その結果、彼は青いボタンを押すが、赤いボタンは避けることを学ぶ。

しかし、オペラントコンディショニングは実験室の動物を訓練する間に実験的な環境で行われるものだけではありません。 それはまた、日々の学習においても強力な役割を果たします。 補強と処罰は、自然環境や教室やセラピーなどのより構造化された設定では、ほとんど毎日行われます。

オペラントコンディショニングがどのように発見されたか、それが心理学に与える影響、そして古い行動を変えて新しい行動を教えるためにどのように使用されるかを詳しく見てみましょう。

オペラントコンディショニングの歴史

オペラントのコンディショナーは、行動主義者のBFスキナーによって造られました。そのため、スキナーのコンディショニングと呼ばれることがあります。 行動主義者として、Skinnerは、行動を説明するために内部の考えや動機を見ることは本当に必要ではないと信じていました。 代わりに、彼は示唆したように、私たちは人間の行動の外見的、観察可能な原因を見るべきである。

20世紀の最初の部分を通して、行動主義は心理学の中で大きな力となっていました。 John B. Watsonのアイデアはこの考え方を早期に支配していました。 ワトソンは古典的なコンディショニングの原則に焦点を当てました。彼の背景に関係なく誰かを連れて、彼が選んだものになるように訓練することが有名になっています。

初期の行動主義者が連想学習に興味を持っていた場所では、Skinnerは人々の行動の影響がどのように行動に影響を与えたかに、より関心がありました。

スキナーは、「結果を生み出すために環境に作用する積極的な行動」を意味するためにオペラントという用語を使用しました。 言い換えれば、Skinnerの理論は、私たちが毎日展示する学習行動の範囲をどのように獲得するかを説明しました。

彼の理論は、効果法則と呼ばれるものを提案した心理学者Edward Thorndikeの研究の影響を強く受けていました。 この原則によれば、望まれる結果が続く行動は反復される可能性が高く、望ましくない結果が続く行動は反復されにくい。

オペラントのコンディショニングは、かなり単純な前提に基づいており、強化の後に続く行動は強化され、将来的には再び起こる可能性が高くなります。 あなたがクラスで面白い話をしてみんなが笑っているなら、あなたはたぶん将来その話を再現する可能性が高いでしょう。 質問をするために手を上げ、教師があなたの丁寧な行動を賞賛した場合は、次に質問やコメントをするときに手を挙げる可能性が高くなります。

この行動には補強や望ましい結果が続いたため、これまでの行動は強化されています。

逆に、刑罰や望ましくない結果をもたらす行為は弱まり、将来的には再び起こりにくいであろう。 あなたが別の授業で同じ話をもう一度話しても、誰もこの時間を笑っていないなら、あなたは将来この話をやり直す可能性は低くなります。 あなたがクラスで答えを叫ぶと、あなたの先生があなたを叱るならば、クラスを中断する可能性は低いでしょう。

行動の種類

スキナーは、2つの異なるタイプの行動

古典的な条件付けが回答者の行動を説明することができる一方で、Skinnerはそれが多くの学習を説明できないことに気付いた。 代わりに、Skinnerは、オペラントコンディショニングがはるかに重要であることを示唆した。

彼の少年時代にSkinnerはさまざまなデバイスを発明し、オペラント・コンディショニングの研究中にこれらのスキルを働かせるようにしました。

彼はオペラントコンディショニングチャンバーとして知られている装置を作りました。これは今日最もよくSkinnerボックスと呼ばれています 。 チャンバーは本質的に、ラットやハトのような小さな動物を収容できる箱であった。 この箱には、報酬を受け取るために動物が押すことができるバーまたはキーも含まれていました。

応答を追跡するために、Skinnerは累積レコーダーと呼ばれるデバイスも開発しました。 この装置は応答を行の上向きの動きとして記録し、その結果、行の勾配を見ることによって応答速度を読み取ることができた。

オペラントコンディショニングのコンポーネント

オペラントコンディショニングにはいくつかの重要な概念があります。

オペラントコンディショニングにおける強化

補強とは、それに続く行動を強化または増加させるあらゆる事象です。 補強材には2種類あります。

  1. ポジティブな補強は、その行動の後に提示される好ましいイベントまたはアウトカムです。 積極的な強化を反映する状況では、賞賛や直接報酬などの何かを加えることによって、対応や行動が強化されます。 例えば、あなたが職場でいい仕事をして、あなたのマネージャーがあなたにボーナスを与えたとします。
  2. 負の補強材は、行動の表示後に好ましくない出来事または結果の除去を伴う。 このような状況では、不愉快だと思われるものを取り除くことによって対応が強化されます。 たとえば、お子様が食料品店の真ん中で叫ぶのを始めたが、一度治療を受けたら停止すると、次に叫ぶようになったときに治療を受けられる可能性が高くなります。 あなたの行動は、不快な状態(子供が叫んでいる)を取り除き、あなたの行動を否定的に補強しました。

これらの補強の両方のケースでは、行動は増加する。

オペラントコンディショニングにおける罰

処罰は、それに続く行動の減少を引き起こす有害事象または結果の提示である。 罰には2種類あります。

  1. 正当な罰は刑罰とも呼ばれることもありますが、それに続く対応を弱めるために、好ましくない出来事や結果を示します。 不正行為のためのスパンキングは、アプリケーションによる罰の一例です。
  2. 除去による罰としても知られる否定的な罰は、行動が起こった後に有利な出来事または結果が取り除かれたときに起こります。 誤った行動の後に子供のビデオゲームを取り除くことは、否定的な刑罰の例です。

これらの刑罰の両方において、行動は減少する。

増強スケジュール

補強は必ずしも単純なプロセスではなく、新しいものがどのくらい早く、いかにうまく学習されるかに影響を与えるいくつかの要素があります。 スキナーは、行動が強化された時期頻度が、獲得のスピードと強さにどのような役割を果たしているかを見出しました。 言い換えれば、強化のタイミングと頻度は、新しい行動がどのように学習されたか、そしてどのように古い行動が修正されたかに影響を与えた。

Skinnerは、オペラントコンディショニングプロセスに影響を与える補強のいくつかの異なるスケジュールを特定した。

  1. 継続的強化は、応答が発生するたびに補充を行うことを含む。 学習は比較的早く起こる傾向がありますが、応答率はかなり低くなります。 補強が停止すると消滅も非常に迅速に起こります。
  2. 固定金利のスケジュールは部分的な補強の一種です。 応答は、特定の数の応答が発生した後でのみ強化されます。 これは、通常、かなり安定した応答率につながります。
  3. 固定間隔スケジュールは、部分補強の別の形式です。 強化は一定の時間が経過した後にのみ行われます。 応答率はかなり安定しており、強化時間が近づくにつれて増加し始めますが、補強が配信された直後は遅くなります。
  4. 変動比率スケジュールはまた、様々な応答数の後に補強行動を含む部分補強の一種である。 これは、高い応答速度と遅い消光速度の両方につながります。
  5. 可変間隔のスケジュールは、Skinnerが説明した部分補強の最終形式です。 このスケジュールは、可変時間が経過した後に補強を行うことを含む。 これはまた、応答速度が速く、消光速度が遅くなる傾向があります。

オペラントコンディショニングの例

オペラントコンディショニングの例は、私たちの周りの職場で見つけることができます。 親や教師からの報酬を得るために宿題を完成した子供や、賞賛や宣伝を受けるプロジェクトを終えた従業員を考えてみましょう。

オペラント調整のいくつかの例:

これらの例のいくつかでは、報酬の約束または可能性は行動の増加を引き起こすが、オペラントの状態調節を用いて行動を減少させることもできる。 望ましい結果または否定的な結果の適用の除去は、望ましくない行為を低減または防止するために使用することができる。 例えば、授業で順番に話していない場合、子供には憩いのぎをとる権利が失われると言われるかもしれません。 この処罰の可能性は、破壊的行動の減少につながる可能性があります。

からの言葉

行動主義は20世紀の初めに支配された支配の大部分を失ったかもしれないが、オペラントのコンディショニングは、学習と行動の改変プロセスにおいて重要かつ頻繁に利用されているツールである。 時には自然な結果が私たちの行動の変化につながります。 他の例では、報酬と刑罰が意識的に変更されて変更を生み出すことがあります。

オペラントのコンディショニングは、あなたの子供たちに良い行動を教えたり、家族の犬を訓練してあなたの好きなスリッパを噛むのをやめたりするあなたのアプローチにかかわらず、あなたの人生ですぐに認識できるものです。 覚えておくべき重要なことは、どんなタイプの学習でも時には時間がかかることがあるということです。 あなたのユニークな状況に最も適した補強や罰のタイプを考え、どのタイプの補強スケジュールが最良の結果につながるかを評価します。

>出典:

> Coon、D&Mitterer、JO。 心理学:旅。 ベルモント、カリフォルニア州:ワズワース; 2014年

> Domjan、M。学習と行動の原則、第7版。 スタンフォード、CT; Cengage Learning; 2015年