You are on page 1of 31

Presentación de la Unidad 1

La palabra estadística a menudo te remite a gráficas y tablas; cifras relativas a nacimientos, muertes,
impuestos, demografía, ingresos, deudas, créditos, etc. No obstante, para aprovechar las
herramientas de análisis estadístico, es necesario comprender qué representa cada concepto y la
metodología mediante la cual se obtiene un dato estadístico.

En esta unidad se hablará sobre la importancia de la estadística, conocerás sus conceptos básicos,
así como la metodología del muestreo para que al final, obtengas una muestra aleatoria simple.

Propósitos de la Unidad

 Identificarás los conceptos básicos relacionados con la Estadística.

 Reconocerás la utilidad e importacia de la Estadística.

 Aplicarás el procedimiento para obtener una muestra aleatoria simple

Competencia específica

Aplica la metodología estadística para obtener una muestra aleatoria simple, identificando los
elementos que intervienen en un problema estadístico.

1.1. Introducción a la estadística

La estadística es la ciencia cuyo objetivo es reunir información cuantitativa relacionada a individuos,


grupos, series de hechos, entre otros. Gracias al análisis de estos datos se pueden deducir algunos
significados precisos o algunas previsiones para el futuro. La estadística, en general, es la ciencia
que trata la recopilación, la organización, la presentación, el análisis y la interpretación de datos
numéricos con el fin de realizar una toma de decisiones más efectiva.

Las estadísticas…

La palabra estadística también se utiliza para referirse a la información estadística (descripción de


parámetros); es decir, a series de datos, tablas y gráficas que presentan resultados. Por ejemplo,
cuando leemos las estadísticas de los equipos o escuchamos la estadística muestra que el
índice de reprobación en las escuelas es tal, se hace referencia a los datos y no al procedimiento
o metodología de análisis.

LECTURA
La estadística y la salud
Carlos presenta síntomas del virus de la Influenza A (H1N1); su doctor le indica acudir a un
laboratorio para tomarse una muestra de sangre a partir de la cual se realizarán estudios
clínicos y determinará si los signos corresponden a dicha enfermedad.

Los técnicos del laboratorio extraen algunos mililitros de sangre para realizar un conteo de
plaquetas y neutrófilos.
El médico interpreta el resultado del análisis comparándolo contra los parámetros normales
para diagnosticar adecuadamente a Carlos.

POBLACIÓN INDIVIDUO

MUESTRA MUESTREO

DATO VARIABLE
1.2. Conceptos básicos de estadística

Tipos de variables

La variable es una característica de la población o muestra que desea estudiarse. Las variables
pueden ser:

¿Cómo utilizamos los conceptos?

En el ejemplo La estadística y la salud identificaste algunos conceptos básicos de estadística.


Ahora, revisemos juntos(as) los conceptos que estaban en el texto.

La población de estudio es la sangre del individuo, de la cual se toma una muestra que
representa una pequeña parte de esta población. Esta muestra contiene información sobre las
características que se desean observar.

Los (las) expertos(as) de laboratorio preparan la sangre para observar en un microscopio


electrónico los elementos (variables) que contiene, por ejemplo pueden observar la cantidad
de plaquetas o neutrófilos (las plaquetas y los neutrófilos son los individuos y
la cantidad que contiene la sangre de estos elementos son los datos) que contiene la
muestra por unidad de volumen.
Se realiza un conteo, en este caso, del número de plaquetas y del número de neutrófilos, esta
información se representa por medio de un estadístico, característica numérica que refleja la
información contenida en la muestra, en la que se observa el total de plaquetas.

Aunque, en realidad, lo que nos interesa conocer o estimar es el total de plaquetas en el total de la
sangre (población) del individuo.

¿Cuántos conceptos identificaste en la lectura?

La metodología para solucionar un problema estadístico comprende los siguientes pasos:

1. Planteamiento del problema: En el planteamiento se define si se requiere de una muestra o


es posible estudiar la población, las características a estudiar (las variables), si es necesario
establecer una hipótesis, entre otros. En este punto también se analizan los medios de los
que se dispone y el procedimiento a seguir.
2. Elaboración de un modelo: Se establece un modelo teórico de comportamiento de las
variables de estudio. En ocasiones no es posible diseñar el modelo hasta realizar un estudio
previo. Los posibles modelos son normal, binomial, poisson, uniforme, y otros como binomial
negativa, geométrico.
3. Extracción de la muestra: Se usa alguna técnica de muestreo o un diseño experimental para
obtener información de una pequeña parte de la población.
4. Tratamiento de los datos: En esta fase se eliminan posibles errores, se depura la muestra,
se tabulan los datos y se calculan los valores que serán necesarios en pasos posteriores,
como la media y la varianza de la muestra. Los métodos de esta etapa corresponden a los
métodos de la estadística descriptiva. Algunas de las etapas de esta fase son: recopilación,
clasificación y presentación de la información.
5. Estimación de los parámetros: La estadística inferencial nos proporciona herramientas para
la predicción o estimación de los parámetros de la población que nos ayudarán a resolver el
problema. Un ejemplo de estas herramientas son las pruebas de hipótesis que se obtienen
del análisis de los datos y los intervalos de confianza.
1.3. Muestreo aleatorio
Introducción

Los estudios estadísticos normalmente se hacen con una


parte de la población, ya que realizarlos sobre la totalidad
resultaría demasiado complicado. Para que la información
obtenida tenga validez y confiabilidad es necesario que la
muestra cumpla con ciertas condiciones específicas.

Estas condiciones están relacionadas con el método para


determinar el tamaño y características de la muestra y los
individuos que la componen.

LECTURA

Tipos de muestreo probabilístico

Dentro de los métodos de muestreo probabilístico se encuentra, además del muestreo aleatorio
simple (que revisarás con detalle más adelante), los siguientes tipos:

Muestreo sistemático: Es aquel en el que los elementos de la población que conformarán la muestra
se seleccionan en intervalos regulares, es decir, se numeran los elementos de la población, se
escoge uno al azar i y todos los elementos i + k, se seleccionan para la muestra. Ejemplo: de una
población de 1000 individuos se quiere seleccionar 100, la selección al azar del número i, da como
resultado el individuo 13 de la población, entonces la muestra se obtiene seleccionando la unidad
13, la 26, la 39…, hasta que se obtienen 100 observaciones.
Muestreo estratificado
En este tipo de muestreo, la población es clasificada en categorías diferentes entre sí, llamadas
estratos, que poseen gran homogeneidad respecto a alguna característica (por ejemplo profesión,
sexo, estado civil, etc.).

Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de interés
estarán representados adecuadamente en la muestra.

Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos, nuevamente, el


muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarán parte
de la muestra.
Muestreo aleatorio por conglomerados: En este tipo de muestreo cada unidad o individuo de la
muestra está formado por un grupo de elementos, al que se le llama conglomerado, este grupo
contiene representantes de toda la población (de acuerdo a la característica que se mida).

El muestreo por conglomerados consiste en seleccionar aleatoriamente el número de


conglomerados necesario para alcanzar el tamaño muestral, en el cual se investigan a todos los
elementos que componen los conglomerados elegidos.

Muestreo mixto: Este consiste en la combinación de dos o más tipos de muestreo vistos
anteriormente. Por ejemplo, si se desea estudiar una producción de medicinas puede hacerse
primero un muestreo aleatorio por conglomerados y escogerse ciertos lotes. Sobre estos lotes se
hace luego un muestreo sistemático y se selecciona uno de cada 29 frascos de medicina del lote.

Referencias:
BORREGO, Silvia (2008). Estadística descriptiva e inferencial. Revista digital innovación y
experiencias educativas 13. Recuperado el 10 de marzo de 2010 desde: http://www.csi-
csif.es/andalucia/modules/mod_ense/revista/pdf/Numero_13/SILVIA_BORREGO_2.pdf. .

CASAL, Jordi y ENRIC Mateu (2003). Tipos de muestreo. Rev. Epidem. Med. Prev. 1: 3-7.
Recuperado el 1 de marzo de 2010 de http://minnie.uab.es/~veteri/21216/TiposMuestreo1.pdf

El muestreo aleatorio simple es el procedimiento por medio del cual se obtiene una muestra aleatoria
simple.

A continuación conocerás los pasos para obtener una muestra aleatoria simple:
1.- Definir la población de estudio y el parámetro a estudiar.
Recuerda que la población es el grupo formado por el conjunto total de individuos, objetos
o medidas que poseen algunas características comunes, observables en un lugar y en un
momento determinado. Por lo tanto, el paso 1 es determinar qué se estudiará.
EJEMPLO: Un investigador realiza un estudio sobre las relaciones de género en el
noviazgo, su objeto de estudio son las manifestaciones de violencia física y
psicológica entre los (las) estudiantes del último año de la carrera de química. Su
población es el total de estudiantes del último año de ingeniería química que tengan
novio o novia; el total de individuos con esta característica es de 386. Por lo que, la
población es de 386 individuos y las variables son: violencia física y violencia
psicológica
2.- Enumerar a todas las unidades de análisis que integran la población, asignándoles un
número de identidad o identificación.
Una vez que has definido la población y las variables a estudiar, es necesario asignar un
número de identificación a cada individuo de la población.
Siguiendo con el ejemplo de la relaciones de género en el noviazgo de los (las) estudiantes
de química, lo que sigue es numerar a los 386 estudiantes un número del 1 al 386.

Para calcular el tamaño de una muestra hay que tomar en cuenta tres factores:
1. El porcentaje de confianza con el que se quiere generalizar los datos, desde la muestra
hacia la población total.
2. El porcentaje de error que se pretende aceptar al momento de hacer la generalización.
3. El nivel de variabilidad que se calcula para comprobar la hipótesis.
A continuación definiremos estos conceptos.
1 Definir el tamaño de la población: Significa determinar el # de individuos que la
constituyen; la variable N representa el tamaño de la población
N=X
2 Porcentaje de confianza:

3 Porcentaje de error:
Variabilidad:

3.- Determinar el tamaño de la población, determinar el porcentaje de error y el porcentaje de


confianza y obtener una muestra preliminar.
4.- Determinar el tamaño óptimo de la muestra para el estudio.
Una vez que la población, el porcentaje de confianza, el porcentaje de error y el nivel de variabilidad
han sido determinados, se debe determinar el tamaño de la muestra.
Puedes calcularlo mediante alguna de las dos fórmulas que examinarás: una para los casos en que
se conoce el tamaño de la población y la otra para cuando este dato se desconoce.
5.- Seleccionar los sujetos de la muestra usando números aleatorios.

El último paso para obtener la muestra es saber qué individuos específicos de la población se
tomarán. Para hacer esto debes:

1. Numerar a los individuos de la población del 1 a N (donde N es el tamaño de la población).

2. Generar números aleatorios para seleccionar los individuos de la muestra.

3. Tomar los individuos correspondientes a los números elegidos.


Los números aleatorios se pueden generar por diversos métodos, por ejemplo mediante programas
computaciones (por ejemplo en Excel con la función “=aleatorio()”), funciones en calculadora,
sacando números de una urna o lanzando una moneda al aire, o bien utilizando tablas de números
aleatorios. Para obtener los números aleatorios, utilizarás la tabla, para ello lee el documento Uso de
la tabla de números aleatorios.

Da clic en el icono para descargar el documento. (TABLA DE NÚMEROS ALEATORIOS)

 Unidad 2. Representación numérica y gráfica de datos

Presentación de la unidad

En la unidad anterior, conociste las dos grandes divisiones de la estadística: la que se dedica a la
recolección, presentación y categorización de datos, llamada estadística descriptiva y la que se
dedica a realizar hipótesis con base en dichos datos, la inferencial.

También aprendiste a determinar el espacio de estudio (es decir, la población) y las variables que se
van a estudiar de acuerdo al problema planteado.

En esta unidad estudiarás la estadística descriptiva y aprenderás cómo organizar y presentar los
datos obtenidos mediante el muestreo en poblaciones.

Cuando se realiza un trabajo que requiere a la estadística, se diseñan instrumentos para obtener los
datos deseados. Existen muchos métodos para recolectar información, pero los más frecuentes son:

Otra de las técnicas más recurridas en estadística para recolectar información son los experimentos, revisa en
qué consisten.

Un experimento es una prueba que se realiza para determinar las características o comportamientos de una
cosa. Por ejemplo, experimentar mediante el sentido del gusto, qué alimentos te parecen más salados.
También, experimento se define como el proceso que se realiza para verificar una serie de hipótesis
relacionadas con un determinado fenómeno, en el cual se determinan las características o
comportamientos del fenómeno que se analiza.

Por ejemplo, un experimento para determinar la velocidad de la luz en el vacío.

La diferencia entre la primera y la segunda definición es que en la segunda se parte de una hipótesis mientras
que en la primera no necesariamente. En el primer ejemplo, experimentas los sabores de los alimentos sin
antes predecir cuál será más salado. En el segundo ejemplo, la hipótesis, a partir de estudios anteriores, es
que la velocidad de la luz en el vacío es de 300 000 km/seg.

Por lo tanto, el experimento verifica si esta hipótesis es cierta o no y en él cabe un margen de error
experimental.

Los datos que se recopilan, usando alguna técnica de las que acabamos de describir u otra, son organizados
de acuerdo a los parámetros de la estadística descriptiva que estudiarás en esta unidad.

En esta unidad:

 Identificarás algunos conceptos que se utilizan en estadística descriptiva.

 Organizarás datos en diferentes tipos de tablas y elaborarás varios tipos de gráficas.

Utiliza las técnicas de representación numérica y gráfica para representar información a través de la
organización de los datos obtenidos de una muestra o población.

2.1. Organización de datos y distribución de frecuencias

Introducción

La descripción estadística organiza los datos y los presenta en forma de tablas y gráficas. Esta área
sólo describe, resume, organiza y representalos datos obtenidos de una población o muestra de la
población, sin elaborar inferencias ni obtener conclusiones.

La organización de datos se realiza a través detablas que se utilizan para simplificar la presentación y
distribución de estos datos.

A continuación, conocerás que existen diferentes tipos de presentación de datos y con base en ellos, distintas
clasificaciones de frecuencia, como: frecuencia relativa, frecuencia acumulada y frecuencia absoluta.

2.1.1. Frecuencias
Es la continuación de esta tabla
Ejemplo de organización de frecuencias

En la siguiente pantalla observarás una tabla con la organización de frecuencias, los datos presentados son
los siguientes:

18, 41, 23, 47,18, 23, 23, 41, 41, 47, 47, 52, 23, 47, 23, 47, 18, 47, 7,
23, 18, 47, 52, 41, 52, 18, 23, 52, 7, 18, 52, 23.

2.1.2. Intervalos
2.1.3. Construcción de intervalos de clase
Ejemplo de construcción de intervalos

El director de una consultoría en desarrollo de software desea conocer el número de incidencias en sus
desarrollos reportadas durante los meses de agosto y septiembre. Para ello registra los siguientes datos:

35, 24, 26, 23, 50, 20, 25, 56, 30, 30, 38, 36, 35, 29, 28, 30, 40, 39, 38, 40, 27, 24, 30, 32, 35, 27, 29, 22, 28,
27, 48, 40, 48, 31, 39, 28, 46, 36, 37, 52, 44, 49, 52, 41, 31, 31, 56, 58, 38, 26, 25, 24, 60, 55, 48, 37, 31, 30,
22, 20.

Observa cada paso:

1. Calcular el rango: R=Xn–X1=60-20=40


2. Determinar el número de intervalos entre 5 y 20: Elegir 8 intervalos.
3. Dividir el rango entre el número de intervalos: 40/8=5
4. Se forman los intervalos: Comenzar por un número anterior al límite inferior: 19-24, 25-30, 31-36,
37-42, 43-48, 49-54, 55-60

2.1.4. Tablas de datos

Existen diferentes tipos de tablas para presentar datos, las más utilizadas son: Tabla de datos, Tabla de
frecuencias, Tabla por intervalos de clase y Tablas de doble entrada. Conoce en qué consiste cada una:

Tablas de datos
Una tabla de datos es la forma más sencilla de organizar un conjunto de datos y se utiliza cuando la información
que necesitas son los datos mismos. Se organizan en columnas o renglones y se registran las mediciones o
datos obtenidos.

Ejemplo:
Imagina que la medición de temperatura a lo largo del día da como resultado los siguientes valores (en grados
Celsius): 20.4°, 21.2°, 22.1°, 23.9°, 25.3°, 26.9°, 27.7°

A partir de estos valores construyes la siguiente tabla:


2.1.5. Tablas de frecuencias

Las tablas de frecuencia aportan mayor información que las tablas de datos, ya que están construidas con las
categorías de la variable que se está midiendo y su frecuencia.

Ejemplo:

2.1.6. Tablas por intervalos de clase.

2.1.7. Tablas de doble entrada


Una tabla cualquiera puede ser vista como una tabla de doble entrada, en la cual las variables relacionadas
son los rangos contra el valor de las variables en dicho rango. Por ejemplo, imagina que mides la temperatura
de un líquido con respecto al tiempo de calentamiento. En el renglón colocas los tiempos y en las columnas la
temperatura obtenida. Puedes considerar la tabla como una tabla de frecuencias o como una tabla de doble
entrada:

2.2. Representación gráfica de los datos


Introducción

El tema anterior presentó diferentes formas de organizar o de tabular datos y la


distribución de frecuencias. Ahora estudiarás la representación gráfica de los datos.

Las gráficas son representaciones visuales de los datos que se muestran en una
tabla. Existen diferentes tipos de gráficas, cada una de ellas se elabora con base en el
tipo de información que se quiere representar.

2.2.1. Histograma

El histograma es la representación gráfica de una variable continua. Se elabora en


un sistema de coordenadas rectangulares. El eje horizontal se utiliza para
representar la variable independiente, es decir, la escala de medición o fronteras
de clase. El eje vertical representa la escala de frecuencias. Si los intervalos de
clase tienen el mismo ancho, las alturas de las barras serán proporcionales a las
frecuencias.

El histograma permite apreciar visualmente la distribución y dispersión de las


mediciones

2.2.2. Gráfica de barras

Este tipo de gráfica se utiliza para datos de tipo ordinal, nominal y discreto. En éstas se muestran la
frecuencia, la frecuencia relativa y el porcentaje por medio de la altura y no por el área de la barra. Esta
gráfica muestra las discontinuidades en las mediciones por medio de espacios vacios entre las barras.

La gráfica de barras se traza sobre un eje de coordenadas. Y puede ser de dos formas:
2.2.3. Gráfica de líneas

Una gráfica de líneas también se construye en un sistema


coordenado rectangular y muestra la relación entre las variables
mediante puntos conectados por líneas continuas. La frecuencia de
cada valor medido es representada por la altura del punto.

En el eje horizontal se representa la variable y en el eje vertical, la


frecuencia. Se determinan los puntos de corte del valor de la variable
con su frecuencia y se unen, obteniéndose la gráfica de línea.

2.2.4. Gráfica de áreas o de pastel

Una forma de representar datos u observaciones de una variable


cualitativa es mediante un diagrama circular. Esta gráfica muestra la
relación entre las variables dividiendo un círculo (o pastel) en sectores
(o rebanadas). También, se utilizan para representar la distribución de
frecuencias, pero es el área de cada sector la proporcional a los valores
medidos.

Para trazar la gráfica, se hace una distribución proporcional de las


frecuencias del problema con respecto a la circunferencia, determinando
sectores circulares para cada categoría.

HISTOGRAMA
GRAFICA DE PASTEL

GRAFICA DE LÍNEA

Unidad 3. Medidas de tendencia central y dispersión


Presentación de la unidad

Para cualquier conjunto de datos estudiados es importante tener un resumen de la información y sus
características. Esta información indica cómo se comporta la población de datos que tienes. Para resumir la
información se utilizan dos tipos de valores que, en vez de representar cada uno de los datos, representan
conjuntos de datos. Estos dos tipos de indicadores estadísticos son: las medidas de tendencia central, que
muestran hacia qué valores se agrupan o acumulan los datos; y las medidas de dispersión, que de forma
contraria a las anteriores, muestran cómo se dispersan o separan los datos.

En esta unidad:

 Aplicarás el procedimiento para obtener las medidas de tendencia central y dispersión en datos
agrupados y no agrupados.

En esta unidad:
 Aplicarás el procedimiento para obtener las medidas de tendencia central y dispersión en datos
agrupados y no agrupados.

3.1. Medidas de tendencia central

Las medidas de tendencia central

Las medidas de tendencia central son los valores que representan un conjunto de datos de forma tal que te
ayudan a saber dónde están acumulados los datos sin indicar cómo se distribuyen. Se llaman así porque
tienden a ubicarse en la parte central del conjunto de datos. Las medidas de tendencia central más comunes
son: la media aritmética (conocida como media o promedio), la mediana y la moda.

Media aritmética

Mediana

La segunda medida de tendencia central es la mediana, esta se define como:

El valor que divide en dos partes iguales una serie de datos, es decir, la cantidad de
datos que quedan a la derecha de la mediana es igual a la cantidad de datos que
quedan a la izquierda. Se representa por Me.
3.1.3. Moda

La tercera medida de tendencia central es la moda.

La moda es el valor que tiene mayor frecuencia absoluta, es decir, el valor que se
repite más veces en una serie de datos. La moda se denota por Mo.
3.2. Medidas de dispersión

A diferencia de las medidas de tendencia central, que miden acumulaciones en un solo punto, las medidas de
dispersión miden el grado de separación o alejamiento que tiene una variable estadística con respecto a una
medida de posición o tendencia central. Dicho grado de separación indica lo representativa que es la medida
de posición con respecto al conjunto total de datos. A mayor dispersión, menor representatividad de la medida
de posición y viceversa.

3.2.1. Recorrido

El recorrido representa la diferencia que hay entre el primero y el último valor de la variable, también se le
conoce como rango y se denota por Re.

La fórmula para calcularlo es:

Por ejemplo:

Si tienes la siguiente distribución de datos: 69, 68, 52, 57, 69, 71, 78, 52, 74, 74, 69, 52, 76, calcula el rango,
sustituyendo los valores Re=78-52=26

3.2.2. Varianza
La varianza mide la mayor o menor dispersión de los valores de la variable respecto a la media aritmética.
Siempre es mayor o igual que cero y menor que infinito. Se define como la media de los cuadrados de las
diferencias del valor de los datos menos la media aritmética de éstos.

La fórmula de la varianza para datos no agrupados es:


Cómo calcular la varianza en datos agrupados por intervalos

Para calcular la varianza en datos agrupados, puedes realizar una tabla como la siguiente o sustituir los
valores directamente en la fórmula.

Si tienes la siguiente distribución de datos:


3.2.3. Desviación típica

You might also like