You are on page 1of 5

Condicionamento Operante: Definio, Como Funciona

Exemplos
Como Reforo e Punio modificam o comportamento
O condicionamento operante (por vezes referido como condicionamento
instrumental) um mtodo de aprendizado que ocorre atravs de recompensas e punies
para o comportamento. Atravs de condicionamento operante, uma
associao feita entre um comportamento e uma consequncia
para esse comportamento.
Por exemplo, quando um rato de laboratrio pressiona um boto azul, ele recebe uma
bolinha de comida como recompensa, mas quando ele aperta o boto vermelho ele recebe
um leve choque eltrico.

Como resultado, ele aprende a pressionar o boto azul, mas evitar o boto vermelho.

A histria do condicionamento operante


O condicionamento operante foi cunhado pelo behaviorista BF Skinner, razo pela qual
voc pode ocasionalmente ouvi-lo referido como condicionamento Skinneriano. Como um
behaviorista, Skinner acreditava que no era realmente necessrio olhar para pensamentos e
motivaes internas, a fim de explicar o comportamento. Em vez disso, ele sugeriu,
devemos olhar apenas para as causas externas, observveis do comportamento humano.
Atravs da primeira parte do sculo 20, o behaviorismo havia se tornado uma grande fora
dentro da psicologia. As ideias de John B. Watson dominaram essa escola de pensamento
desde o incio. Watson focava nos princpios do condicionamento clssico ,
sugerindo que poderia tomar qualquer pessoa, independentemente da sua origem e trein-la
para ser qualquer coisa que ele escolhesse.
Enquanto os primeiros behavioristas tinha centrado os seus interesses na aprendizagem
associativa, Skinner estava mais interessado em como as consequncias de aes das
pessoas influenciavam seu comportamento.
Skinner usou o termo operante para se referir a qualquer comportamento ativo que
atua sobre o meio ambiente para gerar consequncias (1953). Em outras palavras, a teoria
de Skinner explicou como podemos adquirir a gama de comportamentos aprendidos que
exibimos a cada dia.
Sua teoria foi fortemente influenciada pelo trabalho do psiclogo Edward Thorndike,
que props o que chamou de lei do efeito. De acordo com este princpio, as aes que
so seguidas por resultados desejveis so mais suscetveis de serem repetidas, enquanto
aquelas seguidas por resultados indesejveis so menos susceptveis de serem repetidas.
O condicionamento operante se baseia em uma premissa bastante simples aes que
so seguidas por reforo sero reforadas e tem mais
probabilidade de ocorrer novamente no futuro. Se voc contar uma
histria engraada na classe e todo mundo rir, provavelmente voc vai ser mais propenso a
contar essa histria de novo no futuro.
Por outro lado, as aes que resultam em punio ou consequncias indesejveis
sero enfraquecidas e tero menos probabilidade de ocorrerem novamente no futuro. Se
voc contar a mesma histria novamente em outra classe, mas ningum rir, desta vez, voc
vai ser menos propenso a repetir a histria novamente no futuro.

Tipos de comportamentos
Skinner distinguiu entre dois tipos diferentes de comportamentos: comportamentos
respondentes e comportamentos operantes . Comportamentos
respondentes so aqueles que ocorrem automaticamente e reflexivamente, como puxar sua
mo de volta de um fogo quente ou levantar sua perna quando o mdico bate em seu
joelho.
Voc no tem que aprender esses comportamentos, eles simplesmente ocorrem de forma
automtica e involuntariamente.

Comportamentos operantes, por outro lado, so aqueles sob nosso controle


consciente. Alguns podem ocorrer espontaneamente e outros propositadamente, mas so as
consequncias dessas aes que influenciam ou no as ocorrncias futuras. Nossas aes
sobre o meio ambiente e as consequncias dessa ao tornam-se uma parte importante do
processo de aprendizagem.

Enquanto o condicionamento clssico pode explicar comportamentos respondentes, Skinner


percebeu que no poderia ser responsvel por uma grande quantidade de aprendizagem. Em
vez disso, Skinner sugeriu que o condicionamento operante tinha importncia muito maior.

Skinner inventou dispositivos diferentes durante sua infncia e ele colocou essas
habilidades para trabalhar durante seus estudos sobre o condicionamento operante. Ele criou
um dispositivo conhecido como cmara de condicionamento operante, na
maioria das vezes referida hoje como uma caixa de Skinner. A cmara era
essencialmente uma caixa que poderia conter um pequeno animal tal como um rato ou
pombo. A caixa tambm continha uma barra ou a chave que o animal poderia pressionar
para receber uma recompensa.
A fim de controlar as respostas, Skinner tambm desenvolveu um dispositivo conhecido
como um gravador cumulativo. O dispositivo gravava respostas como um movimento
ascendente de uma linha de modo a que as taxas de respostas poderiam ser lidas por
olhar para o declive da linha.

Componentes do condicionamento operante


Alguns conceitos-chave no condicionamento operante:

Reforo
O reforo qualquer acontecimento que refora ou aumenta o comportamento que se
segue. Existem dois tipos de reforos:
1. Reforadores positivos so eventos favorveis ou resultados que
so apresentados aps o comportamento. Em situaes que refletem o
reforo positivo, uma resposta ou comportamento reforada pela adio
de algo, como elogio ou uma recompensa direta.
2. Reforadores negativos envolvem a remoo de eventos ou
resultados desfavorveis aps a exibio de um comportamento. Nestas
situaes, a resposta reforada pela remoo de algo considerado
desagradvel.
Em ambos os casos de reforo, o comportamento aumenta.
Punio
Punio a apresentao de um evento adverso ou resultado que provoca uma
diminuio no comportamento que se segue. Existem dois tipos de punio:
1. Punio positiva, por vezes referida como punio por aplicao,
apresenta um evento desfavorvel ou resultado a fim de enfraquecer a
resposta que se segue.
2. Punio negativa, tambm conhecida como a punio por remoo,
ocorre quando um evento favorvel ou resultado removido aps um
comportamento ocorrer.
Em ambos os casos de punio, o comportamento diminui.
Esquemas de reforo
Skinner tambm descobriu que, quando e com que frequncia comportamentos
eram reforadas desempenhava um papel na velocidade e fora da aquisio. Ele identificou
vrios diferentes esquemas de reforo:

1. Reforo contnuo envolve a entrega de um reforo cada vez que


uma resposta ocorre. Aprendizagem tende a ocorrer de forma relativamente
rpida, no entanto, a taxa de resposta muito baixa. Extino tambm
ocorre muito rapidamente uma vez que o reforo interrompido.
2. Esquema de razo fixa so um tipo de reforo parcial. As respostas
so reforadas apenas aps a ocorrncia de um nmero especfico de
respostas. Isso normalmente leva a uma taxa de resposta bastante estvel.
3. Esquema de intervalo fixo outra forma de reforo parcial. Reforo
ocorre apenas aps um certo intervalo de tempo decorrido. As taxas de
resposta permanecem relativamente estveis e comeam a aumentar
medida que o tempo de reforo se aproxima, mas lentas imediatamente
aps o reforo tem sido entregue.
4. Esquema de reforo de razo varivel tambm um tipo de
reforo parcial que envolve reforar o comportamento depois de um variado
nmero de respostas. Isto leva a uma alta taxa de resposta e as taxas de
extino lentas.
5. Esquema de reforo de intervalo varivel a forma final de
reforo parcial que Skinner descreveu. Esta agenda envolve a entrega de
reforo aps um perodo varivel de tempo decorrido. Isto tambm tende a
conduzir a uma taxa de resposta rpida e lenta taxa de extino.
Exemplos do condicionamento operante
Podemos encontrar exemplos de condicionamento operante funcionando
ao nosso redor. Considere o caso de crianas que completam a lio de casa para ganhar
uma recompensa de um pai ou professor, ou funcionrios que acabam projetos para receber
elogios ou promoes.
Nestes exemplos, a promessa ou possibilidade de recompensas provoca um aumento no
comportamento, mas condicionamento operante pode tambm ser usado para diminuir um
comportamento. A remoo de um resultado desejvel ou aplicao de resultado negativo
pode ser utilizada para diminuir ou prevenir comportamentos indesejveis. Por exemplo,
uma criana pode ser informada de que vai perder privilgio do recreio se falar fora de
hora em sala de aula. Este potencial para a punio pode levar a uma diminuio da
indisciplina.

O que reforo negativo?


Reforo negativo um termo descrito por BF Skinner em sua teoria de
condicionamento operante. Em reforo negativo, uma resposta ou comportamento
reforada por parar, remover ou evitar um resultado negativo ou estmulo aversivo.
Estmulos aversivos tendem a envolver algum tipo de desconforto, seja fsico ou
psicolgico. Comportamentos so reforados negativamente quando eles permitem
que voc escape de estmulos aversivos que j esto presentes ou lhe permitem evitar
completamente os estmulos aversivos antes que eles aconteam.
Uma das melhores maneiras de lembrar do reforo negativo pensar nisso como algo
que est sendo subtrado da situao. Quando voc olha para ele, desta forma, pode
ser mais fcil de identificar exemplos de reforo negativo no mundo real.
Exemplos de reforo negativo
Saiba mais, olhando para os exemplos a seguir:

Antes de sair para um dia na praia, voc se entope de protetor solar (o


comportamento) para evitar queimaduras solares (remoo do estmulo aversivo).
Voc decide limpar sua baguna na cozinha (o comportamento) para evitar
entrar em uma briga com seus companheiros de repblica (remoo do estmulo
aversivo).
Na segunda-feira de manh, voc sai de casa cedo (o comportamento), para
evitar ficar preso no trnsito e chegar atrasado para a aula (remoo de um estmulo
aversivo).
Na hora do jantar, uma criana faz beicinho e se recusa a comer cada um dos
vegetais no seu prato. Seus pais rapidamente tiram os legumes ofensivos para longe.
Uma vez que o comportamento (pirraa) levou remoo do estmulo aversivo (os
legumes), este um exemplo de reforo negativo.
Voc consegue identificar o reforador negativo em cada um desses exemplos?

Queimaduras solares, uma briga com seu companheiro de casa e estar atrasado para o
trabalho so todos os resultados negativos que foram evitados atravs da realizao de
um comportamento especfico. Ao eliminar esses resultados indesejveis, os
comportamentos preventivos tornam-se mais provveis de ocorrer novamente no
futuro.

Reforo negativo contra Punio


Um erro que muitas vezes as pessoas fazem confundir o reforo negativo com
a punio. Recorde, no entanto, que o reforo negativo envolve a remoo de uma
condio negativa para reforar um comportamento. Por outro lado, punio envolve
apresentar ou retirar um estmulo para enfraquecer um comportamento.
Considere o exemplo a seguir e determine se voc pensa que um exemplo de reforo
negativo ou punio:
Adamastor limpa seu quarto todos os sbados de manh. Na semana passada, ele saiu
para brincar com seu amigo sem limpar seu quarto. Como resultado, seu pai o fez
passar o resto do fim de semana fazendo outras tarefas como limpar a garagem, cortar
a grama e capinar o jardim, alm de limpar seu quarto.

Se voc disse que este era um exemplo de punio, ento voc est correto. Porque o
pequeno Adamastor no limpa seu quarto, seu pai atribui um castigo de ter de fazer
tarefas extras.
Quando reforo negativo mais eficaz?
Reforo negativo pode ser uma forma eficaz de reforar o comportamento desejado.
No entanto, mais eficaz quando os reforos so apresentados imediatamente a seguir
um comportamento. Quando h um perodo de tempo decorrido entre o
comportamento e o reforador, a resposta provvel que seja mais fraca. Em alguns
casos, os comportamentos que ocorrem no tempo decorrido entre a ao inicial e o
reforador tambm podem ser inadvertidamente reforados bem.
De acordo com Wolfgang (2001), o reforo negativo deve ser usado com
moderao em sala de aula, enquanto que o reforo positivo deve ser enfatizado.
Enquanto o reforo negativo pode produzir resultados imediatos, ele sugere que mais
adequado para uso a curto prazo.
O tipo de reforo usado importante, mas a frequncia e a programao utilizada
tambm desempenha um papel importante na fora da resposta.

You might also like