2.2 オペラント条件づけ

Operant Conditioning

Skinner (1938) が体系化したオペラント条件づけは、行動の結果（強化・罰）によって行動頻度が変化する学習である。

強化と罰の分類

@startuml
!theme plain
skinparam backgroundColor #FEFEFE

rectangle "刺激の出現" as Present {
    rectangle "正の強化\n行動↑" as PR #D1FAE5
    rectangle "正の罰\n行動↓" as PP #FEE2E2
}

rectangle "刺激の除去" as Remove {
    rectangle "負の強化\n行動↑" as NR #D1FAE5
    rectangle "負の罰\n行動↓" as NP #FEE2E2
}

note right of PR : 報酬付与
note right of NR : 嫌悪刺激除去
note right of PP : 嫌悪刺激付与
note right of NP : 好子除去

@enduml

図1: 強化と罰の4分類

「正」は刺激の出現、「負」は刺激の除去を意味する。「強化」は行動頻度の増加、「罰」は減少をもたらす [1]。負の強化は回避学習の基盤となる。

出典

[1] Skinner, B. F. (1938). The Behavior of Organisms. Appleton-Century.

発展学習
→ 応用行動分析: Cooper, J. O. et al. (2020). Applied Behavior Analysis (3rd ed.).