스키너의 행동주의 학습이론
본문 바로가기
교육

스키너의 행동주의 학습이론

by 건강리뷰 2021. 7. 21.
반응형

스키너의 행동주의 학습이론에 대해 알아봅시다.


1) 스키너의 생애
스키너는 1904년 3월 2일 펜실베이니아의 스키 하나에서 태어나 화목하고 안정된 가정에서 성장합니다. 스키너는 성장과정에서 썰매, 마차, 뗏목, 그네, 연, 롤러스케이터, 새총, 모형비행기 등 물건을 만드는 것을 즐깁니다. 심지어는 자신이 탈 글라이드를 만들려고 했습니다. 움직이는 기계를 디자인하고 만들어 보는 데 열중했던 스키너의 관심이 후에 관찰 행동을 변형시키는 데 대한 관심으로 열중되었습니다.

 

2) 조작적 조건화 실험
Skinner는 스스로 Skinner box라고 명명한 조그마한 실험 상자를 만들어서 실험합니다. 흰쥐를 Skinner box에 넣었을 때, 흰쥐가 상자 안에서 쉬지 않고 계속 움직이면서 새로운 환경을 탐색하다가, 우연히 지렛대를 눌러 먹이가 먹이통에 떨어지고 이를 먹고는 다시 지렛대를 누르는 행동을 계속하게 되었습니다. 이때 먹이는 지렛대를 누르는 행동을 강화시켜 주어 지렛대 누르는 행동이 증가되었습니다. 지렛대 누르는 반응은 먹이라는 강화를 받았기 때문에 반복된 것이며, 다시 누르면 또다시 강화를 받았기 때문에 지렛대 누르는 반응은 증가하게 되었습니다. 이러한 절차가 반복됨에 따라 흰쥐는 지렛대 누르는 반응을 학습하게 됩니다. Skinner는 흰쥐가 이러한 행동을 통하여, 환경에 스스로 작용함으로써 어떤 결과를 생성해 내는 것을 조작(operant)이라고 하고, 이와 같은 절차가 학습되는 과정을 조작적 조건 형성(operant conditioning)이라고 부릅니다.


3) 조작적 조건 형성의 주요 원리
(1) 반응적 행동
'반응적' 이란 용어는 구체적인 자극에 의해 유발되는 구체적인 행동을 뜻합니다. 또 이런 행동은 반사적인 반응(reflexive-type)을 뜻하며, 자극이 행동보다 먼저 나타나게 됩니다. 예를 들어, 불빛의 밝기가 변화하면 동공은 반사적인 반응을 보이며, 눈에 강한 바람을 불어넣으면 눈이 깜박거리는 반응이 일어나며, 무릎의 슬개골 근육을 두드리면 무릎이 움직이는 반사가 나타나고, 끝이 날카로운 물체에 손이 닿으면 그 물체에서 손을 피하는 반응을 보입니다. 반응적인 행동으로는 눈 깜빡임, 무릎 반응, 타액분비 반응, 공포 반응 등이 있습니다.


(2) 조작적 행동
조작적 행동은 환경을 조작해서 어떤 결과를 남게 되는 행동입니다. 조작적 조건화에 의해 습득된 행동을 말합니다. 이 행동은 유발되는 것이 아니라 방출되는 것이며, 이것은 능동적인 유기체의 특성입니다. 스키너는 방출된 반응과 그 결과에 대한 연구가 심리학의 기본적인 탐구내용이라고 생각했습니다. 조작적 행동은 읽기, 쓰기, 악기 연주, 식사, 운전 등이 있습니다. 사람들이 일상생활에서 하고 있는 중요한 행동들의 대부분이 조작적 행동입니다. 사람에 따라 이런 행동상의 차이를 보여주는데, 조작적 조건 형성 개념은 이런 차이를 설명하는 데 도움이 됩니다.

(3) 변별 자극
조작적 행동도 특정 자극의 영향을 받을 수 있습니다. 비둘기를 스키너 상자에 넣고 불이 켜졌을 때에만 원판을 쪼는 행동을 강화합니다. 불이 켜지지 않았을 때에는 원판을 쪼아도 강화를 받지 못합니다. 이런 과정이 반복되면 결국 비둘기는 불이 켜져 있을 때만 원판을 쪼게 됩니다. 즉 불이 켜지면 원판을 쪼는 행동이 나타납니다. 이때 불빛은 변별 자극이 되며, 비둘기가 원판을 쪼는 행동을 통제하게 됩니다. 어떤 반응이 특정한 경우에만 강화를 받을 수 있기 때문에 특정 자극이 제시되었을 때만 반응이 일어난다면 변별(discrimination)이 형성된 것입니다. 


(4) 강화
스키너는 행동의 결과로 일어날 수 있는 강화에는 두 가지, 즉 정적 강화(positive reinforcement)와 부적 강화(negative reinforcement)가 있다고 합니다. 이 두 가지 강화는 모두 반응의 가능성을 증대시킵니다. 즉 행동을 강화합니다. 정적 강화에는 반응을 하고 난 이후에 정적 강화물이 제시됩니다. 정적 강화물을 일어난 직후에 주어졌을 때 그 행동이 일어날 확률이 높습니다. 예를 들어 음식, 물, 성적 접촉 등과 같은 것을 제시하는 것인데 이것을 정적 강화 자극이라고 합니다. 
부적 강화물은 어떤 행동이 일어난 직후에 제거했을 때 그 행동이 점차 일어날 확률을 높이는 자극을 말합니다. 예를 들어 견디기 힘든 추위나 더위, 아주 큰 소음, 위협, 전기충격과 같은 어떤 것을 제거시켜 줌으로써 어떤 행동이 일어날 확률을 높이는 것으로 이것을 부적 강화 자극이라고 합니다. 

 

반응형


(5) 벌
벌(punishment)이란 어떤 사람에게 그가 원하는 어떤 것을 빼앗아가거나 또는 원하지 않는 어떤 것을 줌으로써 반응을 약화시기는 절차를 말합니다. 벌이란 그것을 받은 사람이 또다시 같은 방식으로 행동하는 경향이 줄어들 것이라는 전제 위에서, 행동 목록으로부터 거북하고, 위험하고 또는 원하지 않는 행동을 제거시키기 위하여 설계된 것입니다. 반응을 증가시키는 강화와 다릅니다. 강화에서는 반응의 빈도가 올라가는데, 벌에서는 반응의 빈도가 내려갑니다. 


(6) 행동의 조성
행동의 조성은 복잡한 행동이나 기술을 학습시키는 과정입니다. 스키너는 조작적 조건 형성의 행동 조성 방식은 조각가가 조각품을 만드는 방법과 유사하다고 지적합니다. 스키너 상자 속의 쥐가 음식을 먹기 위해 지렛대를 누르거나, 수업 중인 학생들의 읽기나 쓰기 등과 같은 조작적 조건 형성에 의한 행동은 한꺼번에 나타나는 행동은 아닙니다. 이런 행동들은 연속적인 단계를 거쳐 조성됩니다. 조성(shaping)이란 용어는 유사한 반응에 대해 연속적으로 차별적 강화를 하는 과정을 의미합니다.

(7) 강화 계획
• 강화는 행동을 조성하는 것 이상의 역할을 합니다. 강화는 형성된 행동을 유지하기도 합니다. 어떤 사람이 현재 보이고 있는 행동의 범위와 그 복합성을 이해하려면 현재의 강화의 조건부(contingencies of reinforcement)를 분석해야 합니다.  즉 강화가 일어나는 외적 조건을 알아야 합니다. 어떤 행동들은 방출될 때마다 강화를 받습니다. 이를 연속적 강화라고 합니다. 강화 계획이란 강화가 일어나는 특정 패턴 혹은 규칙을 뜻합니다. 특정 행동이 방출될 때마다 항상 강화가 주어지지 않을 경우, 이를 간헐적 강화 계획이라고 하며, 이런 강화 계획에 의해 유지되는 행동은 연속적 강화 계획에 유지되는 행
동보다 소거에 대한 저항력이 더 큽니다.


• 간헐적 강화 계획은 두 가지 유형, 즉 간격 계획(interval schedule)과 비율 계획(ratio schedule)으로 나누어집니다. 스키너 상자 속에 있는 비둘기는 어떤 시간 간격이 경과한 후 첫 번째로 원판을 쪼는 반응을 할 때 음식을 제공받게 됩니다. 이 시간 간격은 일정할 수도 있고 다양하게 변할 수도 있습니다. 시간 간격이 변하지 않는 경우(예를 들어, 항상 1분 간격인 경우)에는 고정 간격 (fixed interval : FI) 계획이라고 합니다. 이 시간 간격이 변하는 경우(예를 들어, 처음에는 50초, 다음에는 70초 등의 간격을 정해 평균적으로 1분의 간격이 되게끔 하는 경우)에는 변동 간격(variable interval : VI) 계획이라고 합니다. 이 간격이 긴 경우보다 젊은 경우에 상대적으로 높은 반응을 보이게 됩니다.


• 비율 강화 계획에서 중요한 점은 “강화받는 반응과 강화받지 못하는 반응의 비율"입니다. 고정비율 (fixed ratio : FR) 계획에서는 강화를 받으려면 일정한 반응 횟수를 보여야 합니다. 변동비율 (variable ratio : VR) 계획에서는 각각의 강화를 받는데 다양한 반응 횟수가 요구되며, 이는 평균 횟수를 중심으로 그 비율이 다양하게 변합니다.


(8) 강화 계획의 종류
① 고정 가격 계획 (Fixed-Interval schedule: FI) : 일정한 시간을 경과하지 않으면 지렛대를 눌러도 먹이가 나오지 않게 설계된 강화 계획입니다. (ex; 주급, 월급)
② 변동 간격 계획(Variable Interval schedule : VI) : 강화 간의 시간이 어떤 평균점을 중심으로 변동하는 강화 계획입니다.  (ex: 낚시)
③ 고정비율 계획 (Fixed-Ratio schedule: FR) : 일정한 수의 반응을 한 뒤에 강화가 주어집니다. (ex: 생산공장에서 일정한 수만큼 생산할 때마다 일정한 액수의 보수를 지불하는 성과급 보수제도)
④ 변동비율 계획(Variable-Ratio schedule; VR) 강화와 강화 간의 반응수가 어떤 평균수에 따라 변동합니다. (ex: 도박에서 딸 수 있는 확률)

반응형

댓글