Professional Documents
Culture Documents
_____
Resumen
En Internet encontramos un abanico muy amplio de herramientas útiles para el
proceso de enseñanza-aprendizaje del español como lengua extranjera. Sin
embargo, no siempre estamos al tanto de la existencia de estos instrumentos
didácticos que podemos llevar a la clase. Un claro ejemplo de estos nuevos medios
disponibles para la enseñanza de ELE lo constituyen los corpus lingüísticos. Este
artículo ofrece un acercamiento al uso de algunos corpus informatizados que
contamos hoy en día y que podemos utilizar para el estudio y la enseñanza de
ELE. 3
Résumé
Dans l’Internet nous pouvons trouver une panoplie d’outils efficaces pour le
processus d’enseignement-apprentissage de l’espagnol comme langue étrangère.
Par contre, nous ne sommes pas toujours au courant de l’existence de ces
instruments didactiques profitables pour les cours que nous donnons. Quelques-uns
de ces outils, disponibles de façon gratuite, sont les corpus linguistiques. Pour ce
fait, cet article offre l’utilisation des quelques corpus informatisés dont nous
disposons aujourd’hui pour l’étude et l’enseignement de l’ELE.
* Los contenidos plasmados en este trabajo son el resultado del Seminario “Instrumentos
de trabajo sobre el español” que el profesor Enrique Pato impartió en el marco de la
Maestría en Estudios Hispánicos de la Universidad de Montreal (otoño 2007), a quien
queremos expresar nuestro agradecimiento por su entera disponibilidad y colaboración.
3
Este artículo sintetiza los talleres titulados “Los nuevos medios disponibles en Internet
para la enseñanza de ELE: los Corpus” y “El uso de corpus en el aula de ELE y como
herramienta para la creación de materiales didácticos” que los autores impartieron en el
Congreso CEDELEQ III.
31
TINKUY n°11 Section d’études hispaniques
Mayo 2009 Université de Montréal
1. Introducción
4
El 8º congreso tuvo lugar en Lisboa, entre el 4 y el 8 de julio de 2008 [http://talc8.isla.pt].
32
TINKUY n°11 Section d’études hispaniques
Mayo 2009 Université de Montréal
33
TINKUY n°11 Section d’études hispaniques
Mayo 2009 Université de Montréal
5
Un estudio sobre la clasificación de los corpus en función de otra serie de criterios puede
encontrarse en Sinclair (1996).
6
Cf. Torruella y Llisterri (1999).
34
TINKUY n°11 Section d’études hispaniques
Mayo 2009 Université de Montréal
Otras ideas:
35
TINKUY n°11 Section d’études hispaniques
Mayo 2009 Université de Montréal
7
Información y datos extraídos del Corpus Oral y Sonoro del Español Rural (COSER)
dirigido por Inés Fernández-Ordóñez [www.ffil.uam.es/coser/contenido.php?es].
8
Real Academia Española [www.rae.es].
36
TINKUY n°11 Section d’études hispaniques
Mayo 2009 Université de Montréal
• Combinar palabras.
• Comprobar las frecuencias de aparición de un término.
• Consultar el uso de palabras y expresiones.
• Averiguar la época o el país en el cual el empleo de una palabra o frase
resulta más frecuente.
Combinación de variables:
• Autor.
• Obra.
• Año o intervalo de años.
• Área temática.
• País.
Datos generales:
9
Para un ejemplo de uso demostrado en el taller, véase el Anexo.
10
Real Academia Española [www.rae.es].
37
TINKUY n°11 Section d’études hispaniques
Mayo 2009 Université de Montréal
Datos generales:
• Corpus textual.
• Textos fechados desde los inicios del idioma hasta el año 2004.
• Contiene 250 millones de registros (abril de 2005).
• Los textos escritos son: narrativos, líricos, dramáticos, científico-
técnicos, históricos, jurídicos, religiosos, periodísticos, etc.
• El Corpus se divide en tres grandes etapas: Edad Media, Siglos de Oro y
Época Contemporánea.
• Por su perspectiva diacrónica: otorga 74% para el español peninsular y
un 26% para Latinoamérica.
11
Real Academia Española [www.rae.es].
12
Real Academia Española [www.rae.es].
38
TINKUY n°11 Section d’études hispaniques
Mayo 2009 Université de Montréal
El Corpus del español (CdE), creado por Mark Davis, almacena una
colección de más 20.000 textos orales y escritos que ofrecen una buena
representación del español utilizado desde el siglo XIII hasta el siglo XX.
Estos textos, son una muestra del uso real de la lengua, y pone a nuestra
disposición más de 100 millones de palabras para la creación de materiales
didácticos y para el desarrollo de investigaciones lingüísticas. El CdE, con
una interfaz en español y otra en inglés para utilizar la que más nos
convenga, nos permite hacer búsquedas de palabras exactas o frases por
medio de comodines, etiquetas, lemas o categoría gramatical. De igual
manera, se pueden combinar todas estas herramientas para hacer una
búsqueda más avanzada. Por otro lado, en el CdE podemos también, por
medio de una suscripción gratuita, hacer búsquedas por las frecuencias de
uso de palabras. A su vez, nos permite comparar las frecuencias entre textos
orales o escritos (sean de ficción, prensa o registro académico). Otro tipo de
comparación que se puede buscar en este corpus es por campos semánticos,
sinónimos, etc. No cabe duda de que el Corpus del español es una poderosa
herramienta para hacer un sinfín de investigaciones o, lo que más interesa
en el ámbito pedagógico, para la realización de materiales didácticos para el
aula de ELE. Presentamos, a continuación, algunas indicaciones sobre su
funcionamiento, que permitirá a los profesores de ELE conocerlo e indagar
más de acuerdo a sus propios intereses.
El uso del CdE se puede presentar como algo complejo, pero cabe recalcar
que este corpus ha tenido ciertas modificaciones (o actualizaciones) de
aspecto técnico y que facilitan la investigación de los usuarios. A pesar de
estos cambios, es importante mencionar que para evitar sorpresas, hay que
ser cuidadoso al escribir las palabras, lemas, etiquetas y demás componentes
que permiten recuperar los datos deseados. Siguiendo los pasos que les
presentamos, podemos tener nociones básicas del uso de este corpus y así
ver cuan útil, interesante y hasta adictivo puede ser el uso del CdE.
13
Corpus del español [www.corpusdelespanol.org/x.asp].
39
TINKUY n°11 Section d’études hispaniques
Mayo 2009 Université de Montréal
5.2 Secciones
• Mostrar.
• Buscar.
• Secciones.
• Ver opciones.
• “Sumario de resultados” (no tiene un título particular visible).
• Resultados.
Sección 1
Al pulsar en el signo de interrogación, que se encuentra al lado derecho, nos
aparece la descripción de cada una de las opciones y funciones que forman
esta sección. No obstante, explicamos brevemente en qué consiste cada una
de ellas.
Sección 2
En esta sección se coloca, en el espacio designado para este fin, la(s)
palabra(s) que deseamos buscar. En la misma, encontramos la opción que
nos permite escribir el contexto en el cual aparecería dicha palabra. Es
decir, buscar la palabra que consultamos acompañada de otro vocablo,
preposición, artículo, etc. Para que aparezca el espacio específico que
permite introducir esta información (necesario para colocar los datos que
40
TINKUY n°11 Section d’études hispaniques
Mayo 2009 Université de Montréal
Sección 3
A continuación, encontramos la opción llamada Secciones. Esta nos permite
delimitar nuestra búsqueda según el siglo (o los siglos) en el cual fue
utilizada la palabra que consultamos. Además, encontramos la frecuencia
mínima que queramos que aparezca el lema en los siglos indicados, esto es,
si la palabra sólo aparece en tres textos en determinado siglo, el CdE no
incluiría estos en los resultados. Por supuesto, podemos aumentar el número
de frecuencia que deseamos.
Sección 4
Al seleccionar el signo de interrogación que se encuentra a la derecha de la
palabra Opciones, aparecen en la sección 6 cuatro opciones de preferencias
que nos permiten personalizar la presentación de los resultados que se
obtendrán.
41
TINKUY n°11 Section d’études hispaniques
Mayo 2009 Université de Montréal
Sección 5
En esta sección, los resultados de la búsqueda lanzada aparecen en una lista,
ya sea por frecuencia, gráficos o por comparación de palabras, según la
opción que se haya escogido en la sección 1. Los resultados que se muestran
son enlaces que nos permiten ver en la sección 6 un fragmento del texto en
que se encuentran la palabra que hemos buscado.
Sección 6
Nos brinda la lista enumerada de los resultados de las búsquedas, indicando
en números arábigos el siglo en el cual se produjo el texto; el guión y la
letra que acompaña indica el tipo de texto (oral, ficción, científico, etc.). A
la derecha, vemos el título del texto y posteriormente una línea del texto. Al
pulsar en el número que representa el siglo o en el título, aparecerá un
fragmento más extenso.
6. Así hablamos 14
Características generales:
14
Así hablamos [www.asihablamos.com].
42
TINKUY n°11 Section d’études hispaniques
Mayo 2009 Université de Montréal
Es probable que esta base de datos no goce del mismo prestigio que otros
corpus disponibles en Internet, por no contar con el respaldo académico.
Como cuenta su creadora, Roxana Fitch, el sitio JHH nace gracias a la
curiosidad de una amiga española por saber el significado de palabras
“raras” que mencionaban en telenovelas mexicanas. Sin embargo, hoy en
día existe la primera edición impresa del Diccionario de jergas de habla
hispana. Por tanto, se debe reconocer la labor de Fitch y del grupo de
colaboradores, que han hecho crecer este corpus de manera voluntaria desde
1997.
15
Es importante recalcar que esta lista no es exhaustiva, puesto que los datos disponibles
depende de la colaboración de los propios usuarios.
43
TINKUY n°11 Section d’études hispaniques
Mayo 2009 Université de Montréal
16
Nótese que para reproducir el audio es necesario tener Windows Media Player o
QuickTime, ya que los dos tipos de formatos están disponibles.
44
TINKUY n°11 Section d’études hispaniques
Mayo 2009 Université de Montréal
A pesar de que su manejo puede ser complejo, los corpus pueden ser una
manera muy interesante de conocer el uso real de la lengua española. Ya
sabemos que, en los últimos años, los materiales de enseñanza han tratado
de utilizar textos que se asemejen lo más posible a textos reales. En
45
TINKUY n°11 Section d’études hispaniques
Mayo 2009 Université de Montréal
Otra virtud que tienen los corpus, como indica Campillos Llanos,
recogiendo la idea de Alcón Soler (2000) es que:
Por otro lado, los corpus también pueden presentar desventajas. Una de ellas
suele ser de naturaleza técnica, bien por la falta de instrucción en el uso de
los corpus, bien por las fallas en la conexión a Internet. No obstante, estos
problemas o riesgos son comunes en el uso de cualquier herramienta
46
TINKUY n°11 Section d’études hispaniques
Mayo 2009 Université de Montréal
tecnológica. Incluso, debido a que parte del contenido de los corpus son
transcripciones textuales de muestras orales, se pueden encontrar errores o
vocabulario no deseado para el aprendizaje de la lengua. Para evitar
inconvenientes, recomendamos que se les explique a los estudiantes que
estos textos son para estudios lingüísticos y que, como en todo idioma, en
español los hablantes nativos se expresan de una manera particular. En
efecto, los corpus son un instrumento tecnológico que refleja el contexto
mismo en que se utiliza la lengua e intentan ser un modelo de la realidad
lingüística. Como tal, muestran el uso que sus hablantes hacen de ella con
todas sus variedades.
47
TINKUY n°11 Section d’études hispaniques
Mayo 2009 Université de Montréal
Referencias bibliográficas
48
TINKUY n°11 Section d’études hispaniques
Mayo 2009 Université de Montréal
49
TINKUY n°11 Section d’études hispaniques
Mayo 2009 Université de Montréal
17
Información y datos extraídos directamente de la página web de la Real Academia
Española [http://corpus.rae.es/ayuda_c.htm].
50
TINKUY n°11 Section d’études hispaniques
Mayo 2009 Université de Montréal
51