Professional Documents
Culture Documents
La palabra estadística a menudo te remite a gráficas y tablas; cifras relativas a nacimientos, muertes,
impuestos, demografía, ingresos, deudas, créditos, etc. No obstante, para aprovechar las
herramientas de análisis estadístico, es necesario comprender qué representa cada concepto y la
metodología mediante la cual se obtiene un dato estadístico.
En esta unidad se hablará sobre la importancia de la estadística, conocerás sus conceptos básicos,
así como la metodología del muestreo para que al final, obtengas una muestra aleatoria simple.
Propósitos de la Unidad
Competencia específica
Aplica la metodología estadística para obtener una muestra aleatoria simple, identificando los
elementos que intervienen en un problema estadístico.
Las estadísticas…
LECTURA
La estadística y la salud
Carlos presenta síntomas del virus de la Influenza A (H1N1); su doctor le indica acudir a un
laboratorio para tomarse una muestra de sangre a partir de la cual se realizarán estudios
clínicos y determinará si los signos corresponden a dicha enfermedad.
Los técnicos del laboratorio extraen algunos mililitros de sangre para realizar un conteo de
plaquetas y neutrófilos.
El médico interpreta el resultado del análisis comparándolo contra los parámetros normales
para diagnosticar adecuadamente a Carlos.
POBLACIÓN INDIVIDUO
MUESTRA MUESTREO
DATO VARIABLE
1.2. Conceptos básicos de estadística
Tipos de variables
La variable es una característica de la población o muestra que desea estudiarse. Las variables
pueden ser:
La población de estudio es la sangre del individuo, de la cual se toma una muestra que
representa una pequeña parte de esta población. Esta muestra contiene información sobre las
características que se desean observar.
Aunque, en realidad, lo que nos interesa conocer o estimar es el total de plaquetas en el total de la
sangre (población) del individuo.
LECTURA
Dentro de los métodos de muestreo probabilístico se encuentra, además del muestreo aleatorio
simple (que revisarás con detalle más adelante), los siguientes tipos:
Muestreo sistemático: Es aquel en el que los elementos de la población que conformarán la muestra
se seleccionan en intervalos regulares, es decir, se numeran los elementos de la población, se
escoge uno al azar i y todos los elementos i + k, se seleccionan para la muestra. Ejemplo: de una
población de 1000 individuos se quiere seleccionar 100, la selección al azar del número i, da como
resultado el individuo 13 de la población, entonces la muestra se obtiene seleccionando la unidad
13, la 26, la 39…, hasta que se obtienen 100 observaciones.
Muestreo estratificado
En este tipo de muestreo, la población es clasificada en categorías diferentes entre sí, llamadas
estratos, que poseen gran homogeneidad respecto a alguna característica (por ejemplo profesión,
sexo, estado civil, etc.).
Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de interés
estarán representados adecuadamente en la muestra.
Muestreo mixto: Este consiste en la combinación de dos o más tipos de muestreo vistos
anteriormente. Por ejemplo, si se desea estudiar una producción de medicinas puede hacerse
primero un muestreo aleatorio por conglomerados y escogerse ciertos lotes. Sobre estos lotes se
hace luego un muestreo sistemático y se selecciona uno de cada 29 frascos de medicina del lote.
Referencias:
BORREGO, Silvia (2008). Estadística descriptiva e inferencial. Revista digital innovación y
experiencias educativas 13. Recuperado el 10 de marzo de 2010 desde: http://www.csi-
csif.es/andalucia/modules/mod_ense/revista/pdf/Numero_13/SILVIA_BORREGO_2.pdf. .
CASAL, Jordi y ENRIC Mateu (2003). Tipos de muestreo. Rev. Epidem. Med. Prev. 1: 3-7.
Recuperado el 1 de marzo de 2010 de http://minnie.uab.es/~veteri/21216/TiposMuestreo1.pdf
El muestreo aleatorio simple es el procedimiento por medio del cual se obtiene una muestra aleatoria
simple.
A continuación conocerás los pasos para obtener una muestra aleatoria simple:
1.- Definir la población de estudio y el parámetro a estudiar.
Recuerda que la población es el grupo formado por el conjunto total de individuos, objetos
o medidas que poseen algunas características comunes, observables en un lugar y en un
momento determinado. Por lo tanto, el paso 1 es determinar qué se estudiará.
EJEMPLO: Un investigador realiza un estudio sobre las relaciones de género en el
noviazgo, su objeto de estudio son las manifestaciones de violencia física y
psicológica entre los (las) estudiantes del último año de la carrera de química. Su
población es el total de estudiantes del último año de ingeniería química que tengan
novio o novia; el total de individuos con esta característica es de 386. Por lo que, la
población es de 386 individuos y las variables son: violencia física y violencia
psicológica
2.- Enumerar a todas las unidades de análisis que integran la población, asignándoles un
número de identidad o identificación.
Una vez que has definido la población y las variables a estudiar, es necesario asignar un
número de identificación a cada individuo de la población.
Siguiendo con el ejemplo de la relaciones de género en el noviazgo de los (las) estudiantes
de química, lo que sigue es numerar a los 386 estudiantes un número del 1 al 386.
Para calcular el tamaño de una muestra hay que tomar en cuenta tres factores:
1. El porcentaje de confianza con el que se quiere generalizar los datos, desde la muestra
hacia la población total.
2. El porcentaje de error que se pretende aceptar al momento de hacer la generalización.
3. El nivel de variabilidad que se calcula para comprobar la hipótesis.
A continuación definiremos estos conceptos.
1 Definir el tamaño de la población: Significa determinar el # de individuos que la
constituyen; la variable N representa el tamaño de la población
N=X
2 Porcentaje de confianza:
3 Porcentaje de error:
Variabilidad:
El último paso para obtener la muestra es saber qué individuos específicos de la población se
tomarán. Para hacer esto debes:
Presentación de la unidad
En la unidad anterior, conociste las dos grandes divisiones de la estadística: la que se dedica a la
recolección, presentación y categorización de datos, llamada estadística descriptiva y la que se
dedica a realizar hipótesis con base en dichos datos, la inferencial.
También aprendiste a determinar el espacio de estudio (es decir, la población) y las variables que se
van a estudiar de acuerdo al problema planteado.
En esta unidad estudiarás la estadística descriptiva y aprenderás cómo organizar y presentar los
datos obtenidos mediante el muestreo en poblaciones.
Cuando se realiza un trabajo que requiere a la estadística, se diseñan instrumentos para obtener los
datos deseados. Existen muchos métodos para recolectar información, pero los más frecuentes son:
Otra de las técnicas más recurridas en estadística para recolectar información son los experimentos, revisa en
qué consisten.
Un experimento es una prueba que se realiza para determinar las características o comportamientos de una
cosa. Por ejemplo, experimentar mediante el sentido del gusto, qué alimentos te parecen más salados.
También, experimento se define como el proceso que se realiza para verificar una serie de hipótesis
relacionadas con un determinado fenómeno, en el cual se determinan las características o
comportamientos del fenómeno que se analiza.
La diferencia entre la primera y la segunda definición es que en la segunda se parte de una hipótesis mientras
que en la primera no necesariamente. En el primer ejemplo, experimentas los sabores de los alimentos sin
antes predecir cuál será más salado. En el segundo ejemplo, la hipótesis, a partir de estudios anteriores, es
que la velocidad de la luz en el vacío es de 300 000 km/seg.
Por lo tanto, el experimento verifica si esta hipótesis es cierta o no y en él cabe un margen de error
experimental.
Los datos que se recopilan, usando alguna técnica de las que acabamos de describir u otra, son organizados
de acuerdo a los parámetros de la estadística descriptiva que estudiarás en esta unidad.
En esta unidad:
Utiliza las técnicas de representación numérica y gráfica para representar información a través de la
organización de los datos obtenidos de una muestra o población.
Introducción
La descripción estadística organiza los datos y los presenta en forma de tablas y gráficas. Esta área
sólo describe, resume, organiza y representalos datos obtenidos de una población o muestra de la
población, sin elaborar inferencias ni obtener conclusiones.
La organización de datos se realiza a través detablas que se utilizan para simplificar la presentación y
distribución de estos datos.
A continuación, conocerás que existen diferentes tipos de presentación de datos y con base en ellos, distintas
clasificaciones de frecuencia, como: frecuencia relativa, frecuencia acumulada y frecuencia absoluta.
2.1.1. Frecuencias
Es la continuación de esta tabla
Ejemplo de organización de frecuencias
En la siguiente pantalla observarás una tabla con la organización de frecuencias, los datos presentados son
los siguientes:
18, 41, 23, 47,18, 23, 23, 41, 41, 47, 47, 52, 23, 47, 23, 47, 18, 47, 7,
23, 18, 47, 52, 41, 52, 18, 23, 52, 7, 18, 52, 23.
2.1.2. Intervalos
2.1.3. Construcción de intervalos de clase
Ejemplo de construcción de intervalos
El director de una consultoría en desarrollo de software desea conocer el número de incidencias en sus
desarrollos reportadas durante los meses de agosto y septiembre. Para ello registra los siguientes datos:
35, 24, 26, 23, 50, 20, 25, 56, 30, 30, 38, 36, 35, 29, 28, 30, 40, 39, 38, 40, 27, 24, 30, 32, 35, 27, 29, 22, 28,
27, 48, 40, 48, 31, 39, 28, 46, 36, 37, 52, 44, 49, 52, 41, 31, 31, 56, 58, 38, 26, 25, 24, 60, 55, 48, 37, 31, 30,
22, 20.
Existen diferentes tipos de tablas para presentar datos, las más utilizadas son: Tabla de datos, Tabla de
frecuencias, Tabla por intervalos de clase y Tablas de doble entrada. Conoce en qué consiste cada una:
Tablas de datos
Una tabla de datos es la forma más sencilla de organizar un conjunto de datos y se utiliza cuando la información
que necesitas son los datos mismos. Se organizan en columnas o renglones y se registran las mediciones o
datos obtenidos.
Ejemplo:
Imagina que la medición de temperatura a lo largo del día da como resultado los siguientes valores (en grados
Celsius): 20.4°, 21.2°, 22.1°, 23.9°, 25.3°, 26.9°, 27.7°
Las tablas de frecuencia aportan mayor información que las tablas de datos, ya que están construidas con las
categorías de la variable que se está midiendo y su frecuencia.
Ejemplo:
Las gráficas son representaciones visuales de los datos que se muestran en una
tabla. Existen diferentes tipos de gráficas, cada una de ellas se elabora con base en el
tipo de información que se quiere representar.
2.2.1. Histograma
Este tipo de gráfica se utiliza para datos de tipo ordinal, nominal y discreto. En éstas se muestran la
frecuencia, la frecuencia relativa y el porcentaje por medio de la altura y no por el área de la barra. Esta
gráfica muestra las discontinuidades en las mediciones por medio de espacios vacios entre las barras.
La gráfica de barras se traza sobre un eje de coordenadas. Y puede ser de dos formas:
2.2.3. Gráfica de líneas
HISTOGRAMA
GRAFICA DE PASTEL
GRAFICA DE LÍNEA
Para cualquier conjunto de datos estudiados es importante tener un resumen de la información y sus
características. Esta información indica cómo se comporta la población de datos que tienes. Para resumir la
información se utilizan dos tipos de valores que, en vez de representar cada uno de los datos, representan
conjuntos de datos. Estos dos tipos de indicadores estadísticos son: las medidas de tendencia central, que
muestran hacia qué valores se agrupan o acumulan los datos; y las medidas de dispersión, que de forma
contraria a las anteriores, muestran cómo se dispersan o separan los datos.
En esta unidad:
Aplicarás el procedimiento para obtener las medidas de tendencia central y dispersión en datos
agrupados y no agrupados.
En esta unidad:
Aplicarás el procedimiento para obtener las medidas de tendencia central y dispersión en datos
agrupados y no agrupados.
Las medidas de tendencia central son los valores que representan un conjunto de datos de forma tal que te
ayudan a saber dónde están acumulados los datos sin indicar cómo se distribuyen. Se llaman así porque
tienden a ubicarse en la parte central del conjunto de datos. Las medidas de tendencia central más comunes
son: la media aritmética (conocida como media o promedio), la mediana y la moda.
Media aritmética
Mediana
El valor que divide en dos partes iguales una serie de datos, es decir, la cantidad de
datos que quedan a la derecha de la mediana es igual a la cantidad de datos que
quedan a la izquierda. Se representa por Me.
3.1.3. Moda
La moda es el valor que tiene mayor frecuencia absoluta, es decir, el valor que se
repite más veces en una serie de datos. La moda se denota por Mo.
3.2. Medidas de dispersión
A diferencia de las medidas de tendencia central, que miden acumulaciones en un solo punto, las medidas de
dispersión miden el grado de separación o alejamiento que tiene una variable estadística con respecto a una
medida de posición o tendencia central. Dicho grado de separación indica lo representativa que es la medida
de posición con respecto al conjunto total de datos. A mayor dispersión, menor representatividad de la medida
de posición y viceversa.
3.2.1. Recorrido
El recorrido representa la diferencia que hay entre el primero y el último valor de la variable, también se le
conoce como rango y se denota por Re.
Por ejemplo:
Si tienes la siguiente distribución de datos: 69, 68, 52, 57, 69, 71, 78, 52, 74, 74, 69, 52, 76, calcula el rango,
sustituyendo los valores Re=78-52=26
3.2.2. Varianza
La varianza mide la mayor o menor dispersión de los valores de la variable respecto a la media aritmética.
Siempre es mayor o igual que cero y menor que infinito. Se define como la media de los cuadrados de las
diferencias del valor de los datos menos la media aritmética de éstos.
Para calcular la varianza en datos agrupados, puedes realizar una tabla como la siguiente o sustituir los
valores directamente en la fórmula.