반응형

[교육심리학] 12. 행동주의 학습이론



고전적 조건화


다음의 그림은 러시아의 심리학자 파블로프(Pavlov)의 개의 타액 분비반응의 관한 실험이다.

개는 먹이를 먹으며 침을 분비한다. 이것을 무조건 반응(Unconditioned Response, UR)이라고 하고, 무조건 반응을 일으키는 자극을 무조건 자극(Unconditioned Stimulus ,US)이라고 한다. 이것은 학습된 것이 아닌 자극에 의해 나타난 반응이고, 더운 날씨에 흐르는 땀, 신맛 나는 포도를 먹을 때 분비되는 타액, 밝은 빛에 대한 동공축소가 그 예다.

처음에 울린 종소리는 침 분비를 유발하지 않는 중성자극(Neutral Stimulus, NS)이나 종소리와 먹이를 먹이는 과정을 여러번 연합하면 종소리만으로도 침 분비가 유발된다. 이때의 종소리는 조건자극(Conditioned Stimulus, CS)이 되고, 침 분비반응은 조건반응(Conditional Response, CR)이 된다. 조건반응에 대한 타액분비반응은 무조건자극(먹이주기)과 조건자극(종소리)을 반복적으로 조건화(conditioning)한 결과이고 따라서 조건화는 무조건자극과 조건자극을 결합시켜 조건반응을 유발시키는 과정이다.

이 실험결과는 행동이 학습될 수 있는 한 가지 방법을 보여주고 있다고 할 수 있고, 이 실험을 통해 몇 가지 주요 개념을 배울 수 있다.

1. 유기체는 서로 다른 자극을 구별하고 그 자극에 대해 각각 다르게 반응하도록 학습될 수 있다. 이것을 변별(discrimination)이라고 한다.  2. 유기체는 반복적으로 훈련받은 작그에 대해서 뿐만 아니라 유사한 다른 자극에도 반응하도록 학습될 수 있다. 이것을 일반화(generalization)라고 한다. 

3. 무조건 자극이 제공되지 않고 계속해서 조건자극만 제시되면 조건화된 반응의 빈도가 점차 감소하거나 사라진다. 이것을 소거(extinction)라고 한다.

4. 소거 이후 무조건 자극과 연합하지 않은 상태에서 다시 조건화된 자극을 제시했을 경우, 재훈련을 하지 않아도 조건반응이 다시 나타난다. 이것을 자발적 회복(spontaneous recovery)이라고 한다. 


조작적 조건화


다음의 그림은 손다이크의 문제상자 실험이다.

이 상자 안에 고양이를 넣고 관찰했는데, 고양이는 여러 행동을 한 끝에 탈출에 성공했고, 탈출을 성공시킨 자발적인 행동과 그 자극 사이에 강한 연합이 생겨서 학습이 이루어진다는 결과를 얻었다. 이것을 시행착오학습(trial and error learning)이라고 한다. 

손다이크는 이 실험결과를 통해 학습이 일어나는 과정을 몇 가지 기본적인 학습원리로 설명했다.

1. 효과의 법칙(law of effect)은 행동의 결과를 강조하는 것으로 결과가 좋은 행동은 학습되고 결과가 좋지 않은 행동은 학습되지 않음을 뜻한다.

2. 연습의 법칙(law of exercise)은 행동의 반복에 의해 자극과 반응의 결합이 더 견고해지는 것으로 빈도의 법칙(또는 사용의 법칙)이라고 한다. 자극과 반응의 결합은 사용할수록 강화되고, 사용하지 않으면 결합은 약화된다(연습의 빈도가 높을수록 학습은 더 잘 일어난다). 

3. 준비성의 법칙(law of readiness)은 유기체가 반응을 준비가 되었을 때 반응의 결과가 만족스럽게 나온다는 것을 의미한다. 유기체의 성숙도나 학습태도, 선행기술 등의 준비 정도가 학습의 효과에 영향을 미치게 된다.


스키너는 파블로프와 손다이크의 영향을 받아 다음과 같이 상자(스키너 상자)에 쥐를 넣고 실험을 했다.

위 그림의 스키너 상자는 먹이통과 연결된 지렛대와 먹이접시가 달린 상자로, 상자 안에서 지렛대를 누르면 먹이통에 먹이가 떨어지고, 바닥에는 약간의 전기충격을 주는 전기장치가 설치되었다.

이 실험에서 쥐는 상자 안을 돌아다니다가 지렛대를 누르고 먹이를 먹었다. 이 과정이 반복되자 지렛대 누르기와 먹이와의 관계를 학습한 쥐는 배가 고플때 지렛대를 눌렀다. 이것은 보상이 뒤따르는 행동은 증가하고 처벌이 주어지는 행동은 감소함을 뜻한다.

스키너는 이 실험에서 지렛대를 누르는 행동(조작적 행동)과 그 행동을 증가시키는 먹이(조작적 행동의 빈도를 증가시키는 자극)와의 관계를 강화(reinforcement)라는 개념으로 설명했다. 강화에는 정적 강화와 부적 강화가 있다.

정적 강화(positive reinforcement)는 어떤 행동 후에 만족스러운 강화물을 제공함으로써 의도한 행동의 빈도와 강도를 증가시키고 유지하는 것을 의미한다(여기서는 쥐가 지렛대를 눌러 먹이를 먹는 것에 해당). 정적강화의 예는 숙제를 잘하거나 수업시간에 대답을 잘 하는 행위에 대해 칭찬을 하는 것이다.

부적 강화(negative reinforcement)는 어떤 행동 후에 싫어하는 자극을 제거함으로써 의도한 행동의 빈도와 강도를 증가시키는 것이다. 부적강화의 예는 보충수업을 한번도 안 빠진 학생에게 청소를 면제함으로써 보충수업에 빠지지 않게 하는 것이다. 

강화물(reinforcer)에는 일차적 강화물과 이차적 강화물이 있다.

일차적 강화물(primary reinforcer)은 그 자체로 강화능력을 가지고 있어 생리적 욕구를 충족해 주는 것이다. 음식이나 물은 일차적 강화물의 예다.

이차적 강화물(secondary reinforcer)은 그 자체러 강화능력을 가지지 않는 중립자극이 강화능력을 가지고 있는 자극과 결합되어 강화의 속성을 갖고 있는 것이다. 돈은 이차적 강화물의 예다. 

강화는 행동을 증가시키나 처벌(punishment)은 부적합한 행동의 빈도를 감소시키는 데 사용된다. 벌의 종류에는 수여성 벌과 제거성 벌이 있다.

수여성 벌(presentation punishment)은 부적합한 행동의 빈도를 감소시키기 위해 혐오하는 자극이다. 꾸중, 체벌은 수여성 벌의 예다.

제거성 벌(removal punishment)은 학생의 부적합한 행동의 빈도를 감소시키기 위해 학생이 좋아하는 자극을 제거하는 것이다. 부적합한 행동을 했을 때 외출을 금지하거나 좋아하는 활동을 금지시키는 것은 제거성 벌의 예다.

처벌은 부작용을 일으킬 수 있다. 때문에 처벌을 효과적으로 사용하기 위해서는 다음의 네 가지 원리를 따라야 한다. 

1. 억제되어야 할 행동이 일어난 직후에 즉시 처벌을 해야 한다(시간의 원리).

2. 가능한 강한 벌이 주어져야 하고, 벌을 피할 수 있는 상황이 제공되면 안된다(강도(강한 정도)의 원리).

3. 같은 행동에 대해서 같은 처벌이 일관성 있게 주어져야 한다(일관성의 원리).

4. 벌을 받게 되는 이유를 정확히 설명하고, 벌을 받지 않을 행동이나 대안적인 행동을 제시해야 한다(정보성의 원리). 

벌이 벌로서의 역할을 하지 못하고 강화의 기능을 할 수 있다. 어떤 학생이 교사의 관심을 끌기 위해 수업 중 수업을 방해했을 때 지적을 하면 정적 강화가 일어날 수 있다. 이런 경우 적절한 행동에만 관심을 갖는 게 좋다.


프리맥의 원리


프리맥의 원리는 개인이 가장 선호하는 행동을 강화물로 사용해서 강화의 효과를 높이는 방법이다. 즉 발생빈도가 낮은 행동(회피행동)을 강화하기 위해 발생빈도가 높은 행동(선호하는 행동)을 강화물로 사용하는 방법이다. 한 학생이 하교후 숙제를 마쳤을 때 노는 것을 허락하는 것은 프리맥의 원리의 예이다. 한 학습자에게 강화의 기능을 하는 활동이 일반적으로 다른 학습자에게도 강화로 작용하지 않고, 보상으로 한 가지 활동을 지나치게 사용하면 강화의 효과가 약해짐에 주의한다.    


참고자료:

교육심리의 이론과 실제, 김영희 외 6인, 학지사

교육심리학 3판, 신명희 외 8인, 학지사

https://ko.wikipedia.org/wiki/%EA%B3%A0%EC%A0%84%EC%A0%81_%EC%A1%B0%EA%B1%B4%ED%98%95%EC%84%B1

https://slidesplayer.org/slide/16993563/

https://ko.wikipedia.org/wiki/%EC%8A%A4%ED%82%A4%EB%84%88_%EC%83%81%EC%9E%90

반응형
Posted by skywalker222