2.2 オペラント条件づけ
Operant Conditioning
Skinner (1938) が体系化したオペラント条件づけは、行動の結果(強化・罰)によって行動頻度が変化する学習である。
強化と罰の分類
@startuml
!theme plain
skinparam backgroundColor #FEFEFE
rectangle "刺激の出現" as Present {
rectangle "正の強化\n行動↑" as PR #D1FAE5
rectangle "正の罰\n行動↓" as PP #FEE2E2
}
rectangle "刺激の除去" as Remove {
rectangle "負の強化\n行動↑" as NR #D1FAE5
rectangle "負の罰\n行動↓" as NP #FEE2E2
}
note right of PR : 報酬付与
note right of NR : 嫌悪刺激除去
note right of PP : 嫌悪刺激付与
note right of NP : 好子除去
@enduml
図1: 強化と罰の4分類
「正」は刺激の出現、「負」は刺激の除去を意味する。「強化」は行動頻度の増加、「罰」は減少をもたらす [1]。負の強化は回避学習の基盤となる。
出典
[1] Skinner, B. F. (1938). The Behavior of Organisms. Appleton-Century.
発展学習
→ 応用行動分析: Cooper, J. O. et al. (2020). Applied Behavior Analysis (3rd ed.).
→ 応用行動分析: Cooper, J. O. et al. (2020). Applied Behavior Analysis (3rd ed.).