Professional Documents
Culture Documents
1, 105-124
mos termos, no mesmo arranjo sinttico, estando a diferena no grau de confiana. Nenhuma afirmao emprica
completamente no-terica neste sentido, porque a evidncia nunca completa e, provavelmente, nenhuma pre-
dio feita completamente sem evidncia. O termo teoria no ir se referir aqui a afirmaes deste tipo, mas a
qualquer explicao de um fato observado que apele a
eventos que ocorrem em algum outro lugar, em algum ou-
Skinner, B. F. (1950). Are theories of learning necessary? Psychological Review, 57, 193-216. Publicado com autorizao da American Psychological
Association (o texto utilizado para esta traduo foi a reproduo publicada em Skinner, B. F. (1972). Cumulative Record: A Selection of papers (3 ed.)
New York: Appleton-Century-Crofts). Traduo de Lincoln da Silva Gimenes, David Alan Eckerman e Patrcia Regina Lopes Galvo, do Departamento de
Processos Psicolgicos Bsicos, da Universidade de Braslia. Contatos: lgimenes@unb.br. Algumas expresses foram traduzidas literalmente para manter a
linguagem utilizada pelo autor na poca. Assim, expresses como ter em mente, nveis de fome e outras, representam fielmente as palavras utilizadas pelo
autor. As notas no final do artigo so as do original.
Parte do material que segue foi obtido em 1941-42, em um estudo cooperativo sobre o comportamento do pombo em que Keller Breland, Norman Guttman,
e W. K. Estes colaboraram. Alguns dos experimentos relatados nesse artigo foram financiados pela General Mills, Inc. e pelo Office of Scientific Research
and Development. Parte desse trabalho foi selecionado de estudo subseqente sobre o pombo, ainda no publicado, conduzido pelo autor na Indiana
University e Harvard University. Tambm apresentado como Conferncia do Presidente, na Midwestern Psychological Association, em Chicago, Illinois, em
maio de1949.
105
o comportamento em sua relao com determinadas variveis manipulveis. Teorias - seja neural, mental, ou
conceitual - falam sobre passos intervenientes nestas relaes. Mas em vez de nos alertar a procurar e explorar vari-
veis relevantes, elas freqentemente tm o efeito completamente contrrio. Quando atribumos comportamento a
um evento neural ou mental, real ou conceitual, provavelmente nos esquecemos de que ainda temos a tarefa de
explicar a expectativa. O problema , no mnimo, igualmente complexo e, provavelmente, mais difcil. Ns tendemos a fechar nossos olhos para isso e usamos a teoria
para nos dar respostas no lugar daquelas que poderamos
encontrar com mais estudos. Pode-se questionar que a principal funo da teoria de aprendizagem at agora tem sido,
no a de sugerir pesquisas apropriadas, mas criar uma falsa
sensao de segurana, uma satisfao no garantida com
o status quo.
Pesquisa planejada com respeito teoria tambm
provvel de ser desperdiada. O fato de uma teoria gerar
pesquisa no prova seu valor, a menos que a pesquisa seja
106
B. F. SKINNER
a que entra a teoria. Se o que muda na aprendizagem no for o tempo requerido para sair de uma caixaproblema, mas a fora de uma ligao, ou a condutividade
de uma via neural, ou o potencial de excitao de um
insistiro que aprendizagem uma mudana no comportamento, mas eles tendem a evitar referncias explcitas a
respostas ou atos como tal. Aprendizagem ajustamento
ou adaptao a uma situao. Mas de que so feitos os
medidas devem ter propriedades relevantes e comparveis. Mas situaes experimentais produtivas so difceis
de encontrar, particularmente se aceitarmos determinadas
restries plausveis. Mostrar uma mudana ordenada no
mente o resultado da aprendizagem. Um organismo satisfaz um critrio de dez tentativas bem sucedidas; mas um
critrio arbitrrio est em discrepncia com a nossa concepo de generalidade do processo de aprendizagem.
to confortados.
O nvel de energia ou o produto-trabalho do comportamento, por exemplo, no mudam de forma apropriada. No tipo de comportamento adaptado para o experi-
107
Em um experimento tpico, a porta de uma caixa de partida aberta e o tempo que decorre antes que um rato saia
da caixa medido. Abrir a porta no somente um estmulo, uma mudana na situao, que torna a resposta
gum valor arbitrrio reforado diferencialmente - quando tal mudana o que aprendido.
A emergncia de uma resposta correta, em competio com respostas erradas, um outro dado usado
lar curvas mdias para grupos de tentativas ou de organismos no resolver este problema.
Recentemente tem aumentado a ateno em relao latncia, a relevncia da qual, como aquela do nvel
de energia, sugerida pelas propriedades dos reflexos condicionados e incondicionados. Mas no comportamento
operante, a relao com um estmulo diferente. Uma
medida de latncia envolve outras consideraes, como
curtos so obtidos pelo reforamento diferencial das respostas que ocorrem logo aps o estmulo3. Mas as respostas
tambm se tornam mais rpidas sem reforamento diferencial. Uma anlise mostra que isto devido ao desenvol-
Um experimento sobre reforamento diferencial em relao ao tempo foi relatado num encontro da American Psychological Association, em setembro
de 1946. Um resumo apresentado em The American Psychologist, 1946, 1, 274-275.
108
B. F. SKINNER
discriminativo e no eliciador, mas este um bom exemplo de latncia usada no estudo da aprendizagem. O ponto que esta medida no varia continuamente ou de forma ordenada. Dando mais alimento ao pssaro, por exem-
plo, ns induzimos a uma condio na qual ele nem sempre responde. Mas as respostas que ocorrem mostram, aproximadamente, a mesma relao temporal com o estmulo
(Figura 1, curva do meio). Em extino, de especial inte-
cumulativa na qual a taxa da resposta lida imediatamente como inclinao. A taxa em que uma resposta emitida
em tal situao est perto da nossa pr-concepo do processo de aprendizagem. medida que o organismo apren-
de, a taxa aumenta. Quando ele desaprende (por exemplo, em extino) a taxa cai. Vrios tipos de estmulos
discriminativos podem ser colocados sob controle da resposta com modificaes correspondentes da taxa. As mu-
danas motivacionais, assim como aqueles eventos que dizemos serem geradores de emoo, alteram a taxa de forma
sensvel. Os valores atravs dos quais a taxa varia significativamente podem ser to grande quanto da ordem de
Figura 1
109
dida como um dado, porque particularmente apropriada tarefa fundamental de uma cincia do comportamento. Se devemos predizer o comportamento (e, possivelmente, control-lo), ns devemos lidar com probabilidade
bilidade de forma facilmente imaginada, mas as propriedades adicionais sugeridas por estes termos impediram a
busca por medidas apropriadas. A taxa de resposta no
uma medida de probabilidade, mas o nico dado apro-
probabilidade da resposta, assim como a predio da resposta, trata do momento da emisso. Isto se refere a um
ponto no tempo, mas no tem a dimenso temporal de
uma latncia. A execuo pode levar tempo depois que a
que so ocorrncias nicas na vida do indivduo. Um homem no se decide por uma carreira, no se casa, no
ganha milhes de dlares, nem morre em um acidente
freqentemente o bastante para se ter uma taxa de respos-
Isso no pode, de fato, ser reduzido ou aumentado. Onde uma latncia parece ser forada em direo a um valor mnimo pelo reforamento diferencial, uma
outra interpretao requerida. Embora possamos reforar diferencialmente um comportamento mais energtico ou a execuo mais rpida do comportamento
depois que ele comeou, no faz sentido falar em respostas reforadas diferencialmente com latncias curtas ou longas. O que realmente reforamos
diferencialmente (a) o comportamento favorvel de espera e (b) respostas mais vigorosas. Quando pedimos a um sujeito que responda o mais rpido
possvel no experimento de tempo de reao com humanos, ns pedimos essencialmente que ele (a) realize tantas respostas quantas possveis sem realmente
alcanar o critrio de emisso, (b) faa qualquer outra coisa to pouco quanto possvel e, (c) responda energicamente aps a apresentao do estmulo. Isto
pode produzir um tempo mensurvel mnimo entre estmulo e resposta, mas este tempo no necessariamente um dado bsico e nem nossas instrues o
alterou como tal. Uma interpretao paralela do reforamento diferencial de latncias longas requerida. Isso facilmente estabelecido por inspeo. Nos
experimentos com pombos, citados previamente, o comportamento preliminar condicionado, o qual adia as respostas ao disco at o momento apropriado.
O comportamento que marca o tempo geralmente conspcuo.
110
B. F. SKINNER
pendentes de que a probabilidade da resposta uma funo. Aqui ns encontramos outro tipo de teoria de aprendizagem.
Uma demonstrao efetiva da Lei do Efeito, em
esteja ocorrendo em tais situaes. A noo de probabilidade geralmente extrapolada para casos em que uma
anlise de freqncia no pode ser realizada. No campo do
comportamento, ns arranjamos uma situao em que as
sala de aula, pode ser feita da seguinte maneira. Um pombo, reduzido a 80 por cento de seu peso livre, habituado
a uma pequena caixa semicircular, e alimentado l por
varios dias atravs de um comedouro que o experimentador
decorre entre duas respostas, ns no temos dvida alguma do que o organismo estava fazendo quando disparamos o cronmetro. Ns sabemos que ele estava executando uma resposta. Este um zero natural bastante dife-
ele bica a bolinha. Qualquer um que tenha visto tal demonstrao sabe que a Lei do Efeito no nenhuma teoria. Ela simplesmente especifica um procedimento para
alterar a probabilidade de uma dada resposta.
tendemos a recorrer menos a entidades tericas que carregam a noo de probabilidade da resposta.
cesso inverso da extino explicado com teorias comparveis. Se a taxa de resposta primeiramente elevada a um
ponto alto por reforamento e o reforamento ento retido, observa-se que a resposta ocorre cada vez menos
111
muns, onde serviram como reprodutores. Pequenos grupos foram testados para extino no fim de seis meses, de
um ano, de dois anos, e de quatro anos. Antes do teste,
cada pssaro foi transferido para uma gaiola separada. Um
dimensional diferente, j que nada no nvel do comportamento corresponde a processos opostos de excitao e inibio. A taxa de resposta simplesmente aumentada por
uma operao e diminuda por outra. Determinados efei-
Figura 2
O experimento do qual esses dados advm foi relatado em um encontro da American Psychological Association, em setembro de 1940. Um resumo
apresentado em Psychological Bulletin, 1940, 37, 243.
112
B. F. SKINNER
Figura 3
Mowrer, O. H. & Jones, H.M. Extinction and behavior variability as function of effortfulness of task. Journal of Experimental Psychology, 1943, 33, 369-386.
Esse experimento foi relatado em um encontro da Midwestern Psychological Association, em maro de 1946. Um resumo apresentado em American
Psychologist, 1946, 1, 462.
113
pela rpida mudana de posio durante o perodo experimental. Cada um dos cinco registros na Figura 4 cobre
um perodo experimental de 15 minutos sob reforamento
peridico. As distncias entre o pssaro e o disco so indicadas
reservatrio quando uma sada est aberta. Condicionamento provoca uma pr-disposio para responder - uma
reserva - que a extino esgota. Esta talvez uma descrio defensvel no nvel do comportamento. A reserva no
no reforamos uma resposta que foi reforada previamente, ns no iniciamos somente um processo de extino,
ns estabelecemos uma resposta emocional - talvez o que
freqentemente significa frustrao. O pombo arrulha em
um padro identificvel, move-se rapidamente pela gaiola, defeca, ou bate suas asas rapidamente em uma posio
de agachamento que sugere iniciar um comportamento
(de acasalamento). Isto compete com a resposta de bicar
um disco e , talvez, o suficiente para esclarecer o declnio
na taxa na comeo da extino. tambm possvel que a
probabilidade de uma resposta baseada na privao de
alimento seja reduzida diretamente como parte de uma tal
reao emocional. Qualquer que seja sua natureza, o efeito
desta varivel eliminado atravs da adaptao. As curvas
repetidas de extino tornam-se mais planas e, em alguns
dos esquemas a serem descritos brevemente, h pouca ou
Figura 4
114
B. F. SKINNER
Figura 5
115
Figura 6
Figura 7
116
B. F. SKINNER
Figura 7, e parece representar um nico processo ordenado. O nmero total de respostas maior, talvez por causa
do maior tempo permitido para emisso. Tudo isso pode
ser explicado pelo simples fato de que tornamos imposs-
deveria ter aparecido antes na curva. A curva pode razoavelmente ser explicada pela suposio de que o pssaro
altamente controlado pela falsa correlao anterior entre
reforamento e responder rpido.
Esta suposio pode ser verificada pela elaborao
vel para o pombo formar um par de discriminaes baseadas, primeiro, na estimulao do comportamento de comer e, segundo, na estimulao do comportamento de
responder rapidamente.
de um esquema de reforamento no qual uma contingncia diferencial entre taxa de resposta e reforamento impossvel. Em tal esquema daquilo que pode ser chamado
de reforamento aperidico, um intervalo entre sucessivas respostas reforadas to curto que nenhuma resposta
no-reforada intervem, enquanto o intervalo mais longo
de aproximadamente dois minutos8. Outros intervalos
so distribudos aritmeticamente entre estes valores, a mdia permanecendo em um minuto. Os intervalos so grosseiramente randomizados para compor um programa de
reforamento. Sob este programa, a probabilidade de
reforamento no muda com respeito aos reforamentos
anteriores, e as curvas nunca adquirem a caracterstica de
escada da curva E na Figura 6. (A Figura 9 mostra curvas
de um programa similar). Como resultado, nenhuma correlao entre diferentes taxas de resposta e diferentes probabilidades de reforamento pode se estabelecer.
Uma curva de extino que segue uma exposio
breve ao reforamento aperidico mostrada na Figura 8.
Ela comea caracteristicamente na taxa prevalente sob o
reforamento aperidico e, ao contrrio da curva que segue o reforamento peridico regular, no acelera para uma
taxa total mais elevada. No h nenhuma evidncia da
produo autocataltica de uma condio estimulante
tima. Tambm caracteristicamente, no h nenhuma
descontinuidade significativa ou mudana repentina na
taxa em uma ou outra direo. A curva se estende por um
perodo de oito horas, diferente das quase duas horas na
Figura 8
O que chamado reforamento peridico neste artigo veio a ser conhecido como reforamento em intervalo fixo e aperidico como intervalo varivel.
(Ver Schedules of Reinforcement.)
117
representado por um trao horizontal. O tempo registrado , aproximadamente, 3 horas. Os registros so mostrados para dois pombos que mantiveram taxas totais diferentes sob este programa de reforamento.
contendo intervalos excepcionalmente muito mais longos, no produzam uma linha reta por muito mais tempo.
Figura 9
Figura 10
118
B. F. SKINNER
comum dizer que ela o resultado da escolha, significando, pela ltima, uma terica atividade prcomportamental. Os processos mentais superiores so os
melhores exemplos das teorias deste tipo; os paralelos neu-
rolgicos no tm sido bem trabalhados. A apelao teoria incentivada pelo fato de que escolher (como discriminar, igualar e assim por diante) no um pedao particular
de comportamento. No uma resposta ou uma ao com
observveis e manipulveis, e podemos expressar as relaes entre elas em termos objetivos. At ao ponto em que
nosso dado torna isso possvel, reduz a necessidade de
teoria. Quando observamos um pombo emitindo 7000
Aprendizagem complexa
Um terceiro tipo de teoria de aprendizagem ilustrado por termos como preferindo, escolhendo, discriminando e igualando. Um esforo pode ser feito para defini-
119
cor randomizada com respeito posio. Reforando ocasionalmente uma resposta em um disco ou no outro, sem
favorecer qualquer disco, obtemos taxas iguais de resposta
nos dois discos. O comportamento se aproxima a uma
tempo transcorreu durante o qual o relgio pode ter fechado o circuito para o disco esquerdo. Mas o comportamento do pssaro no corresponde a esta probabilidade
meramente em respeito matemtica. O resultado espec-
fico de tal contingncia de reforamento que mudarpara-outro-disco-e-bicar geralmente mais reforado que
bicar-o-mesmo-disco-uma-segunda-vez. No estamos mais
lidando apenas com duas respostas. Para analisar escolha,
postas topograficamente independentes, capazes de emisso ao mesmo tempo e, portanto, no requerendo mudana, mostram processos separados de recondicionamento e
extino, e a taxa combinada de respostas varia).
Figura 11
120
B. F. SKINNER
de mudar, com uma diferena implcita em feedback sensorial. Ela tambm modifica a distribuio do reforamento
para respostas supostamente no reforadas, j que se os
discos forem prximos um do outro, uma resposta reforada em um lado pode ocorrer mais cedo aps uma resposta precedente no outro lado. Na Figura 11, os dois discos
eram separados por, aproximadamente, uma polegada.
Eram, portanto, razoavelmente similares em relao posio na caixa experimental. Mudar de um para outro
envolvia um mnimo de feedback sensorial, e o reforamento
de uma resposta a um disco poderia ocorrer logo aps uma
resposta ao outro. Quando os discos so separados por
uma distncia de at quatro polegadas, a mudana no
fortalecimento muito mais rpida. A Figura 12 mostra
duas curvas registradas simultaneamente de um nico
pombo durante um perodo experimental de aproximadamente 40 minutos. Uma elevada taxa para o disco da
direita e uma taxa baixa para o da esquerda tinham sido
estabelecidas previamente. Na figura, nenhuma resposta
direita foi reforada, mas aquelas esquerda foram reforadas a cada minuto, como indicado pelos traos verticais
acima da curva L. A inclinao de R declina de forma
razoavelmente suave enquanto a de L aumenta, tambm
razoavelmente suave, para um valor comparvel ao valor
O que chamado de preferncia entra nesta formulao. Em qualquer estgio do processo mostrado na
Figura 12, preferncia pode ser expressa em termos das
taxas relativas de resposta aos dois discos. Esta preferncia,
entretanto, no est em bicar um disco, mas em mudar de
um disco para outro. A probabilidade de que o pssaro
bicar um disco, a despeito das suas propriedades
identificadoras, comporta-se independentemente da resposta preferencial de mudar de um disco para outro. Vrios experimentos tm revelado um fato adicional. Uma
preferncia permanece fixa se o reforamento for retido. A
Figura 13 um exemplo. Ela mostra curvas simultneas
de extino de dois discos durante sete perodos experimentais dirios, de uma hora cada. Antes da extino, a
fora relativa das respostas de mudar-para-a-direita e mudar-para-a-esquerda produziu uma preferncia de aproximadamente 3 para 1 pela direita. A constncia da taxa
durante todo o processo de extino foi mostrada na figura multiplicando-se L por uma constante apropriada e
incorporando os pontos como pequenos crculos em R. Se
a extino alterasse a preferncia, as duas curvas no poderiam ser sobrepostas desta maneira.
inicial de R. O pssaro conformou-se contingncia mudada dentro de um nico perodo experimental. A taxa
mdia de resposta mostrada pela linha pontilhada, que
no mostra novamente nenhuma curvatura significativa.
Figura 13
Estas formulaes de discriminao e escolha permitem-nos lidar com o que geralmente considerado um
processo muito mais complexo escolha de acordo com o
modelo. Suponha que arranjemos trs discos translcidos,
cada um podendo ser iluminado com luz vermelha ou
verde. O disco do meio funciona como um modelo e ns
Figura 12
121
facilmente planejado. A resposta discriminativa de bicarvermelho-aps-ser-estmulado-por-vermelho no , aparentemente, mais fcil de estabelecer do que bicar-vermelho-aps-ser-estmulado-por-verde. Quando a resposta
caso, e possvel que um pombo pudesse aprender a emitir uma resposta apropriada para cada padro. Isto no
acontece, pelo menos no perodo de tempo coberto pelos
experimentos realizados at o momento. Se simplesmente
escolha em outro. Pombos que adquiriram o comportamento de escolha do modelo sob reforamento contnuo,
mantiveram este comportamento quando reforados no
mais que uma vez por minuto, em mdia. Eles podem
122
B. F. SKINNER
nuo, porque o problema pode ser resolvido de trs maneiras. O pssaro receber praticamente o mesmo nmero de
reforamentos se ele responder (1) somente a um disco ou
(2) somente a uma cor, j que a programao do experi-
Figura 14
Estes experimentos sobre alguns processos superiores foram necessariamente, muito brevemente descritos. Eles
no so oferecidos como provas de que as teorias de aprendizagem no so necessrias, mas eles podem sugerir um
programa alternativo nesta difcil rea. Os dados no campo
dos processos mentais superiores transcendem respostas
nicas ou relaes nicas de estmulo-resposta. Mas eles
parecem ser suscetveis formulao em termos de diferenciao de respostas concorrentes, a discriminao de estmulos, o estabelecimento de vrias seqncias de respostas, e
assim por diante. No parece haver nenhuma razo a priori
por que uma completa explicao no seja possvel sem apelao a processos tericos em outros sistemas dimensionais.
Concluso
Fazer (cincia) completamente sem teorias, talvez
seja um desempenho supremo, o que demasiado para se
123
adequado dado pela inclinao a obter dados que mostrem mudanas ordenadas caractersticas do processo de
aprendizagem. Um programa cientfico aceitvel coletar
dados deste tipo e relacion-los s variveis manipulveis,
necessidade de uma representao formal dos dados, reduzida a um nmero mnimo de termos. Uma construo
terica pode produzir maior generalidade do que qualquer conjunto de fatos. Mas tal construo no se referir
at que sua importncia seja determinada experimentalmente, uma equao que as abrigue, ter tantas constantes
arbitrrias que um bom ajuste ser uma questo de tempo
e uma causa para pouqussima satisfao.
124