You are on page 1of 6

Eres lo que hablas

El psiclogo James W. Pennebaker asegura poder desenmascarar


la personalidad de los escritores con un programa de anlisis de textos.
Las estadsticas no mienten, aduce. La polmica est servida
JAN DNGES

1. ENTRETENIMIENTO TRAICIONERO.
El lenguaje no slo proporciona contenidos, sino
que revela tambin algo sobre nuestro carcter.

22

DONGES.indd 22

MENTE Y CEREBRO 43 / 2010

23/06/2010 14:43:55

FOTOLIA / KELLY YOUNG

os trabajos del psiclogo James W. Pennebaker mantienen dividido al gremio de


los estudiosos de la lengua. Prescinde de los
planteamientos clsicos de la investigacin
lingstica. Desde hace una veintena de aos
Pennebaker viene indagando en los escritos la
personalidad de sus autores, sin analizar una
sola vez la sintaxis, ni considerar los matices
del signicado, ni siquiera leer el texto. El psiclogo se aplica, en cambio, en el recuento de
palabras.

MENTE Y CEREBRO 43 / 2010

DONGES.indd 23

Queda fuera de toda discusin que la personalidad de un individuo se refleja en su


lenguaje. Desde siempre, los escritores se han
esmerado en encontrar las formas de expresin ms adecuadas para sus personajes de
ficcin. Sigmund Freud (1856-1939) observ
que el lapsus linguae (error o tropiezo involuntario e inconsciente al hablar) saca a la luz
el subconsciente. Adems, aquel que posee un
pronunciado sentido del lenguaje cree adivinar,
entre tantas lneas, la personalidad del autor.
Mas, utilizar la estadstica ciega para medir la
supercie de un texto y, con ello, desentraar
el perl del carcter del escritor, funciona?
Pennebaker, investigador desde 1997 en la
Universidad de Texas, desarroll su importante
instrumento a mediados de los aos noventa.
Lo llam Linguistic Inquiry and Word Count
(LIWC). El programa de recuento de palabras
por ordenador ocupa desde entonces cantidades ingentes de textos.
Nuestro psiclogo social, que ha cumplido
60 aos, centr uno de sus ltimos anlisis en
las elecciones presidenciales estadounidenses
de 2008. Public los resultados del estudio psicolingstico de los candidatos Barack Obama
y John MacCain en la pgina web www.wordwatchers.wordpress.com. Tanto en los debates
como en las entrevistas, los polticos mostraban tendencias claras: McCain hablaba a sus
votantes de un modo muy directo y personal;
su eleccin de palabras resultaba emotiva e impulsiva. Por el contrario, Obama utilizaba con
frecuencia relaciones causales que indicaban
razonamientos complejos. Asimismo, tenda a
expresarse de un modo ms vago que su competidor republicano.
El sistema de anlisis mecnico de textos
de Pennebaker naci por casualidad. Al inicio de
los aos noventa, el investigador mostraba
especial inters en el estudio de la escritura
expresiva. Dicho mtodo permite a personas
traumatizadas asimilar las vivencias negativas
o desagradables a travs de su proyeccin por
escrito en un diario personal y la redaccin
de ensayos. Pero quera ir ms all: mostrar
que no slo aparece plasmada sobre el papel la
reexin de los afectados; sus notas tambin
reejan sus progresos.

RESUMEN

Dime quin eres

El programa de
anlisis lingstico

Linguistic Inquiry and


Word Count (LIWC) de
James W. Pennebaker
debe derivar, a partir
de cualquier texto, armaciones referentes al
carcter del autor.

Segn Pennebaker,
el contenido de

un texto no supone la
clave para desentraar
la personalidad de su
autor, sino las palabras aparentemente
insignicantes como
pronombres, artculos o
conjunciones, ya que
su uso resulta menos
consciente.

Los defensores de
los sistemas asistidos

por ordenador consideran el anlisis de textos


electrnico ms objetivo
que el de los expertos
humanos. Sus detractores, por el contrario,
critican que el sistema
descuide ingentes relaciones de contenido.

23

23/06/2010 14:43:58

MARSHA MILLER, UNIVERSIDAD DE TEXAS, AUSTIN

Con el objeto de probar su hiptesis, Pennebaker encarg a diversos doctorandos que


examinaran cientos de redacciones con contenido, en su gran mayora, incriminatorio. La
inuencia emocional fue enorme, recuerda
Pennebaker; la evaluacin de lo escrito, por lo
tanto, resultaba poco able. Buscaba un mtodo ms objetivo para analizar los textos. Por
ello desarrollamos LIWC, seala.
El software extrae del texto las palabras que
denotan alguna seal o caracterstica: Cun
optimista es el autor? Le preocupan temas del
pasado o, por el contrario, dominan cuestiones
del futuro? Utiliza expresiones que apuntan a
argumentaciones complejas? Todo ello junto
al propio programa de recuento de palabras
ha propiciado la elaboracin de un diccionario con 4500 entradas, distribuidas a su vez
en ms de 70 campos lxicos. De esa manera,
se registra la frecuencia con que aparecen en
el texto las palabras incluidas en las distintas
categoras.

2. ENFANT TERRIBLE DE LA
INVESTIGACION LINGISTICA:

De la A a la Z

James W. Pennebaker, inventor

Soledad, llorar o feliz, por ejemplo, se encuentran agrupadas bajo el epgrafe de palabras emocionales, que a su vez se subdivide en
los grupos de afectos positivos y negativos.
En estas subcategoras, se describen de manera
ms especca conceptos relacionados con estados emocionales concretos, como miedo o
duelo. Otras de las categoras que recoge el trabajo son palabras de percepcin inespeccas
(ver, or, sentir) y de procesos cognitivos
complejos (debera, pensar, porque). A ello
se suma un total de 22 categoras generales referentes a partes de la oracin: pronombres,
verbos auxiliares, artculos, numerales o conjunciones; es decir, palabras funcionales.
Sin embargo, el anlisis lingstico electrnico no es una invencin de Pennebaker. Con
el n de facilitar el laborioso anlisis manual,
Philip Stone (1936-2006), que ense en Harvard, invent en 1966 el primer procedimiento
de recuento asistido por ordenador, el General Inquirer. Coincidiendo casi en el tiempo,
en 1969 Louis Gottschalk, de la Universidad
de California, y su colega Goldine Gleser (19152004), impulsaron el desarrollo de un programa similar. Los psiclogos queran, a travs de
la escala Gottschalk-Gleser (bautizada con el
nombre de sus creadores), clasicar de manera
automtica cmo una determinada emocin,
por ejemplo el miedo o la agresividad, inua
en la comunicacin del paciente.

del programa de anlisis de


textos Linguistic Inquiry and
Word Count (LIWC).

24

DONGES.indd 24

En 1987, una publicacin de Gottschalk caus


sensacin. Declaraba que haba observado, a
travs de sus procedimientos, indicios de que
el por entonces presidente en funciones de Estados Unidos, Ronald Reagan (1911-2004), sufra
un deterioro mental desde ms o menos 1980.
Aos despus, ya en 1994, se hizo pblico que
Reagan padeca alzheimer.
Con la llegada de ordenadores sucientemente potentes y asequibles, a comienzos de
los aos noventa, el mtodo cobr mayor popularidad. El software para el tratamiento de
textos, junto con Internet, posibilitaban recoger una creciente cantidad de datos en formato digital. As, el nmero de instrumentos de
anlisis se dispar.
Por lo general, la atencin se centraba en
el contenido. Ha pasado inadvertido para la
psicologa el hecho de que las palabras pequeas (yo, nosotros, uno o todos y similares),
permitieran, de una manera particular, atar
cabos sobre el comportamiento, comenta Pennebaker. Los sustantivos, los verbos y los adjetivos sostenan el signicado de una frase, pero
su eleccin dependa en gran medida del azar;
por ejemplo, el tema de una redaccin.
El cmo, seala Pennebaker, revela la personalidad. El estilo de un texto que se expresa
a travs de las palabras pequeas, entre otros
elementos, resulta poco accesible a la manipulacin consciente. As, la persona que quiere resultar agradable, elige las expresiones adecuadas, pero no controla el nmero de artculos o
pronombres que utiliza para ello, indica.

El lenguaje de los terroristas


Tal principio queda claro en el estudio AlKaida de Pennebaker: el investigador analiz
en 2007, junto a otros cientcos, y por encargo
del FBI, un total de 58 textos de Osama Bin
Laden y Aiman Al-Zawahiri, considerado este
ltimo el nmero dos en la jerarqua de la organizacin terrorista. Como escala comparativa
recurrieron a 17 muestras de panetos pertenecientes a otras organizaciones extremistas.
Tres de las categoras del LIWC destacaron en
la investigacin. En primer lugar, Bin Laden y
Zawahiri utilizaban de modo signicativo un
mayor nmero de palabras emocionales que
correspondan en su mayora, y por encima de
la media, a expresiones hostiles. En segundo
lugar, raramente aparecan verbos en pasado.
Los cientcos interpretaron este hecho como
un reejo del escaso inters por parte de sus
autores de recordar acontecimientos ya suceMENTE Y CEREBRO 43 / 2010

23/06/2010 14:44:01

didos. En tercer lugar, llam la atencin de los


investigadores la alta proporcin de pronombres en tercera persona del plural (ellos, a
ellos, etctera). Otra de las conclusiones fue
que Al-Kaida se dena, ms que otros grupos
terroristas, a travs de la delimitacin con el
enemigo, segn su lema: Nosotros contra los
de Occidente. A comienzos del estudio, los investigadores compararon tambin los resultados del LIWC con evaluaciones de observadores
independientes, lo que les permiti confirmar que el grado de extremismo de un grupo
puede determinarse mediante la frecuencia
de uso del pronombre en la tercera persona
del plural.
La comparacin del lenguaje de ambos
islamistas sirvi, a su vez, para determinar
todo aquello que los pronombres revelan. As,
entre 2004 y 2006 se triplic la frecuencia
con la que Al-Zawahiri usaba la palabra yo,
mientras que dicho pronombre permaneca
constante en el discurso de Bin Laden. Un
alto porcentaje en el uso de yo indica, por lo
general, un fuerte egosmo, aunque tambin
inseguridad y una actitud defensiva. Asimismo, el contexto concreto del contenido conrma esto, aclara Pennebaker.
Otros estudios han demostrado que las palabras utilizadas para expresar ponderaciones
o enunciados diferenciados (excepto, pero,
excluido, etctera) guardan relacin con una
mayor complejidad cognitiva, con mejores notas escolares, e incluso con un relato verdico

de los hechos acontecidos. El recuento de palabras en el caso de Bin Laden dio como resultado
que la complejidad de los procesos de pensamiento en sus textos haba alcanzado un alto
nivel con el paso de los aos, mientras que en
el caso de su mano derecha, haban quedado
estancados en un grado inferior.
Las interpretaciones de Pennebaker parecen
plausibles. Sin embargo, su mtodo recuerda,
en cierto modo, la lectura de posos de caf. Por
ejemplo, en los textos de Bin Laden, el 1,49
por ciento de todas las palabras se incluyen en
la categora odio e ira; en los textos de control elegidos, representa un 0,89 por ciento.
Desde la estadstica pura, la diferencia resulta
signicativa; pero, hasta qu punto podemos
considerar signicativo tal resultado?
Las desviaciones, aunque parezcan nimias,
no lo son, apunta Markus Wolf, de la Universidad de Heidelberg. El psiclogo, con un equipo,
tradujo el diccionario LIWC al alemn, versin
que debe servir para el desarrollo de una futura rehabilitacin teraputica con ayuda del
correo electrnico. Para lograr desviaciones
mayores, la extensin del texto debera ser
tambin mayor o, menos compleja, la forma de
expresin. Si un paciente explica que se siente
triste, no suele repetir la palabra triste, por regla general, sino que describe su estado de otra
manera. De ah el inters de las ponderaciones
pequeas, insiste el investigador.
El taln de Aquiles del mtodo de Pennebaker aora en la interpretacin de los datos.

Yo y la muerte
Se revelan pensamientos
de suicidio en el lenguaje
de un poema? James W.
Pennebaker y su compaero
Shannon Stirmann, de la
Universidad de Pennsylvania, investigaron unas 300
obras de nueve poetas
lricos norteamericanos
suicidas y otros tantos que
no se haban suicidado.
El resultado fue inequvoco.
Los que se haban quitado
la vida, usaban casi el doble
de veces las palabras yo,
mo, me y a m; en
cambio pocos de ellos usaban el pronombre nosotros. Asimismo, raras veces
empleaban, en sus creaciones literarias, conceptos de
actividades relacionadas con
la comunicacin.
Tal seleccin de palabras
evidencia un egosmo
exagerado y un aislamiento
social, indica Pennebaker,
observacin que coincide
con las teoras sobre factores desencadenantes del
comportamiento suicida.
En opinin del investigador,
result sorprendente que

Obama contra McCain: Lenguaje en la campaa electoral de EE.UU.

los dos grupos estudiados


se reriesen en sus poemas, y aproximadamente

El anlisis electrnico de entrevistas, debates y discursos de Barack Obama y John McCain,

con la misma frecuencia,

durante la campaa presidencial, revel claras diferencias en sus respectivos modos de

a sentimientos negativos.

expresin. Las palabras de las siguientes categoras se reproducan cada vez ms:
McCain:

Obama:

emocional, directo, orientado hacia el futuro

reservado y sensato

Empleo frecuente de:


Primera persona del singular (I, me, my)
Futuro (will, must)
Conjunciones (and, but, also)
Palabras copulativas (all, both)
Afectos negativos (sad)
Emociones positivas (enjoy, happy)

Empleo frecuente de:


Artculos (a, the)
Negaciones (never, no)
Palabras excluyentes (without, except)
Miedo y rabia (worry, ght)
Precaucin (probably, careful)
Percepcin (look, listen)
movimiento (run, carry)
direccin (around, eastern)
tiempo (age, beginning)
muerte (casualty, grieve)

MENTE Y CEREBRO 43 / 2010

DONGES.indd 25

25

23/06/2010 14:44:01

As investiga los textos el LIWC


Cuando yo llegu a la universidad, empec a experimentar una mezcla de sentimientos:
excitacin, miedo, curiosidad, etctera. Ante todo estaba tan contento de haber salido
nalmente del colegio. Lo odiaba! En un primer momento, era para m como una huida hacia una nueva vida. Pero, naturalmente, no tena an ni idea de qu clase de vida
deba ser. All, todo resultaba tan nuevo y desconocido. Y, honradamente hablando, al
principio no me entend con mis compaeros. Entonces pens: funciona ahora la cosa
otra vez de la misma manera o qu?
Los colores marcan ejemplos de la eleccin de categoras, segn desglosa el LIWC en el protocolo
de una sesin de terapia (no hemos tomado en cuenta los dobles sentidos):
Primera persona del singular

PRO

Fundamentalmente,
palabras pequeas
como yo, nosotros,
uno o todo
permiten sacar
conclusiones sobre
la personalidad.
James W. Pennebaker,
Universidad de Texas en Austin

CONTRA

Los rasgos
lingsticos
extraos son los
que ms revelan.
Brigitte Boothe,
Universidad de Zrich

26

DONGES.indd 26

Preposiciones

Qu signica una acumulacin de pronombres? Una persona que utiliza muchas negaciones (no hago eso de mala gana), es ms
prudente o sensata que alguien que formula
las relaciones de forma directa (preero eso)?
Pennebaker y Wolf se muestran de acuerdo: los
mtodos como el LIWC representan slo una
primera aproximacin; la interpretacin de los
hallazgos se encuentra todava en paales.

Artculos

Conjunciones

Palabras de emocin

sentes, objeta Brigitte Boothe, investigadora


en la Universidad de Zrich del lenguaje de pacientes en psicoterapia. Boothe se muestra crtica ante la evaluacin de los datos asistida por
ordenador. Cuando en un texto aparece con
frecuencia el pronombre nosotros, signica
eso que el paciente se halla socialmente bien
integrado? O que es tmido y busca escolta en
el grupo?. Preguntas que resultan clave para el
terapeuta que desea acceder a su paciente.

Comparacin de mtodos
La comparacin con mtodos de medida ya
establecidos que sondean la personalidad de
un sujeto experimental por medio de las entrevistas o tests debe servir para asegurar ms las
interpretaciones. En este sentido, Markus Wolf
compar el potencial informativo del LIWC alemn con otros procedimientos electrnicos. Entre ellos, el Diccionario del miedo de Dresde,
del psiclogo Hendrik Berth, de la Universidad
tcnica de Dresde. Su mtodo se asemejaba en
buena medida a la escala Gottschalk-Gleser. La
coincidencia fue sorprendente, seala Wolf.
Tampoco las consideraciones de expertos humanos discrepaban de forma notable. Todo
ello, aade el psiclogo, teniendo en cuenta
que el LIWC no toma en consideracin ni los
dobles sentidos ni las negaciones.
De hecho, muchos crticos del software de
Pennebaker subrayan que el programa no
distingue, por ejemplo, si alguien dice estoy
triste o no estoy triste; ambos enunciados
contienen una palabra de la categora emocin negativa. Sin embargo, los defensores del
mtodo aseguran que tales casos se corrigen
gracias a la estadstica, cuando la seleccin de
textos es lo sucientemente amplia.
No obstante, son los pequeos indicios, los
acontecimientos raros, los que estn ms pre-

Anlisis segn el principio Google


Hemos intentado cotejar, en la medida de lo
posible, nuestros ajustes con evaluaciones de
expertos. Pero tampoco stas resultan infalibles, se deende Pennebaker de sus crticos.
Nos sucede como a los economistas: realizamos conjeturas justicadas en torno a una
materia compleja. An es demasiado pronto
para establecer una interpretacin estandarizada.
Una posible solucin sera el renamiento
de los mtodos. En los ltimos aos, lingistas informticos desarrollaron programas que
recopilaban por s solos informaciones relevantes sobre el estilo y el contenido. Funcionaban
segn el principio Google. En vez de instalar en el ordenador un sistema de categoras
preestablecido, los sistemas de anlisis de
factores, aprendan por s solos. Por ejemplo,
qu agrupaciones desempeaban una funcin
determinada. En cantidades ingentes de texto,
encontraban las palabras y grupos de trminos
que aparecan con frecuencia. Esto ayudara a
despejar cualquier prejuicio por parte de otros
investigadores.
Junto a Sherlock Campbell, de la Universidad
de Yale, Pennebaker calcul en 2003, mediante
el anlisis semntico latente, una escala para
MENTE Y CEREBRO 43 / 2010

23/06/2010 14:44:01

medir la semejanza entre el contenido de los


diarios personales de pacientes con trauma. Los
textos procedan de tres estudios realizados en
los ltimos aos. Pennebaker y Campbell se
preguntaron qu rasgos haban cambiado en
los textos de pacientes que mostraban una mejora y apenas necesitaban acudir a la consulta del mdico. De nuevo, se comprob que los
componentes del contenido no desempeaban
ninguna funcin: el factor que guardaba una
vinculacin ntida con el progreso del paciente
era el empleo de pronombres. Por su parte, los
probandos que realizaban, en sus notas, modicaciones en la perspectiva de la narracin,
se dejaron tratar posteriormente menos por
el mdico. Es posible que un paciente supere
con mayor rapidez las vivencias traumticas,
cuando describe su situacin desde su propio
punto de vista y desde el de los otros.
El xito de tales estudios apoya la posibilidad
de dejar el asunto en manos del ordenador, aunque Pennebaker aconseja precaucin: si faltan
datos referentes al contenido o determinadas
categoras lingsticas, los nuevos programas
Google calculan resultados errneos. Para
nosotros, por ejemplo, la primera persona del
singular representa un constructo bien comprensible; me, mo y a m pertenecen a la
misma serie. Mas, para el ordenador, el pronombre nosotros pertenece tambin a esta categora, a pesar de que indica el plural, ejemplica
el investigador.
Por esa razn, Markus Wolf considera que
los programas de anlisis de probada ecacia,
como el LIWC, suponen ahora los mejores sistemas para lograr efectos reproducibles. Un
juicio positivo que sigue tan controvertido
como antes a los ojos de los investigadores de
la lengua: un principio que deja de lado el contexto de la relacin de palabras, frases o textos,
resulta sospechoso.
La perspectiva de Roderick Hart, de le Escuela de Comunicacin de la Universidad de Texas,
se ofrece conciliadora. Cuando dos personas
quieren conocer una ciudad, una se sube a un
helicptero y la otra va a pie. Con el anlisis
lingstico sucede algo parecido: quien sobrevuela muchos textos con el programa LIWC,
puede dejar escapar cosas que quiz salten a la
vista en una lectura personal. Pero como compensacin, obtiene una amplia perspectiva del
panorama general.

PALEONTOLOGIA
Y
ANTROPOLOGIA

ha publicado sobre el tema, entre otros,


los siguientes artculos:

Claves de la evolucin humana


en el Pleistoceno,
de Jos Mara Bermdez de Castro
Enero 2008

BIBLIOGRAFIA
COMPLEMENTARIA
WORD USE IN THE POETRY OF
SUICIDAL AND NONSUICIDAL
POETS. J. W. Pennebaker,

S. Stirman en Psychosomatic Medicine, vol. 63,


pgs. 517-522; 2001.
COMPUTERIZED TEXT ANALYSIS OF AL-QAEDA TRANSCRIPTS. J. W. Pennebaker

y C. Chung en A Content
Analysis Reader, dirigido
por K. Krippendorff y M.
Bock. Thousand Oaks;
Sage, 2007.
CO M P U T ERG E S T T Z T E
QUANTITATIVE TE X TANALYSE: QUIVALENZ UND ROBUSTHEIT DER DEUTSCHEN
VERSION DES LINGUISTIC INQUIRY AND WORD COUNT.

Fsiles virtuales en cenizas


del silrico,
de D.E.G. Briggs, Derek J. Siveter,
David J. Siveter y Mark D. Sutton
Febrero 2009
Turiasaurus riodevensis:
el gigante europeo,
de Rafael Royo Torres,
Alberto Cobos y Luis Alcal
Junio 2009
La extincin de los neandertales,
de Kate Wong
Octubre 2009
El origen de la cultura humana,
de Zenobia Jacobs
y Richard G. Robert
Noviembre 2009
Nueva luz sobre
el hombre de Flores,
de Kate Wong
Enero 2010
Origen de la piel desnuda,
de Nina G. Jablonsky
Abril 2010
Genes, cultura y dieta,
de Olli Arjamaa y Timo Vuorisalo
Junio 2010

M. Wolf et al. en Diagnostica, vol. 54, pgs. 85-98;

Jan Dnges es lingista y periodista cientfico en


Heidelberg.
MENTE Y CEREBRO 43 / 2010

DONGES.indd 27

2008.

27

23/06/2010 14:44:02

You might also like