Professional Documents
Culture Documents
CARRERA DE ENFERMERÍA.
MÓDULO INTEGRADOR: Salud Pública
Estadística Descriptiva
INTEGRANTES:
Rendon Chaperon Viviana Jocelin
Rodríguez Hernández Ximena Alejandra
Bioestadística. U. Málaga. 1
¿Para qué sirve la estadística?
La Ciencia se ocupa en general de fenómenos observables
Bioestadística. U. Málaga. 2
Definición
La Estadística es la Ciencia de la
Bioestadística. U. Málaga. 3
Pasos en un estudio estadístico
Plantear hipótesis sobre una población
Los fumadores tienen “más bajas” laborales que los no fumadores
¿En qué sentido? ¿Mayor número? ¿Tiempo medio?
Plantear Diseñar
hipótesis experimento
Bioestadística. U. Málaga. 5
Población y muestra
Población (‘population’) es el conjunto sobre el que estamos
interesados en obtener conclusiones (hacer inferencia).
Normalmente es demasiado grande para poder abarcarlo.
Bioestadística. U. Málaga. 6
Variables
Una variable es una característica observable que varía entre los
diferentes individuos de una población. La información que disponemos
de cada individuo es resumida en variables.
El grupo sanguíneo
{A, B, AB, O} Var. Cualitativa
Su nivel de felicidad “declarado”
{Deprimido, Ni fu ni fa, Muy Feliz} Var. Ordinal
El número de hijos
{0,1,2,3,...} Var. Numérica discreta
La altura
{1’62 ; 1’74; ...} Var. Numérica continua
Bioestadística. U. Málaga. 7
Tipos de variables
Cualitativas
Si sus valores (modalidades) no se pueden asociar naturalmente a un
número (no se pueden hacer operaciones algebraicas con ellos)
Cuantitativas o Numéricas
Si sus valores son numéricos (tiene sentido hacer operaciones
algebraicas con ellos)
Bioestadística. U. Málaga. 8
Es buena idea codificar las variables
como números para poder procesarlas
con facilidad en un ordenador.
Es conveniente asignar “etiquetas” a
los valores de las variables para
recordar qué significan los códigos
numéricos.
Sexo (Cualit: Códigos arbitrarios)
1 = Hombre
2 = Mujer
Raza (Cualit: Códigos arbitrarios)
1 = Blanca
2 = Negra,...
Felicidad Ordinal: Respetar un orden al
codificar.
1 = Muy feliz
2 = Bastante feliz
3 = No demasiado feliz
Se pueden asignar códigos a
respuestas especiales como
0 = No sabe
99 = No contesta...
Estas situaciones deberán ser tenidas
en cuentas en el análisis. Datos
perdidos (‘missing data’)
Bioestadística. U. Málaga. 9
Aunque se codifiquen como números, debemos recordar siempre el
verdadero tipo de las variables y su significado cuando vayamos a
usar programas de cálculo estadístico.
No todo está permitido con cualquier tipo de variable.
Bioestadística. U. Málaga. 10
Los posibles valores de una variable suelen denominarse modalidades.
5, 6, 4, 7, 8, 4, 6 Hay 7 datos
que suman 40
La nota media de Juan es:
5 6 4 7 8 4 6 40
Nota media = 5,7
7 7
Media aritmética (II)
1º. Ordenamos los datos: 56, 59, 63, 65, 71, 72, 72
2º. El dato que queda en el centro es La mediana vale 65.
65.
Caso: Si el número de datos fuese par, la mediana es la
media aritmética de los dos valores centrales.
Para el conjunto 56, 57, 59, 63, 65, 71, 72, 72, la mediana es: 63 65
64
2
La moda
Nº de calzado 38 39 40 41 42 43 44 45
Nº de personas 16 21 30 35 29 18 10 7
La moda es 41.
Medidas de Dispersión
Se utilizan para conocer la distancia de los valores
de la variable a un cierto valor central. Permiten
identificar la concentración de los datos en un
cierto sector del recorrido de la variable.
Bioestadística. U. Málaga. 20
Desviación Estándar
(S)
_ _
S ( X X ) 2
S f (X X ) 2
n 1 n 1
Bioestadística. U. Málaga. 21
Desviación Estándar (S)
_
Para Datos Aislados
S
( X X ) 2
n 1
Edades de 7 personas encuestadas
X X–X (X - X)
10 10 -15,7= - 5,7 32,49
14 14-15,7= -1,7 2,89
15 15 -15,7= -0,7 0,49
57,43
16 16 -15,7= 0,3 0,09
S 3,09
18 18 -15,7= 2,3 5,29 7 1
18 18 -15,7= 2,3 5,29
19 19 -15,7= 3,3 10,89
Total 57,43 S = 9,57
Bioestadística. U. Málaga. 22
Desviación Estándar (S)
_
S
Para Datos Agrupados f ( X X ) 2
n 1
Calificaciones de 23 personas encuestadas
X F X–X (X - X) f (X - X)
17 2 17 -14= 3 9 18
16 3 16 -14= 2 4 12
15 4 15 -14= 1 1 4
14 5 14 -14= 0 0 0
13 4 13 -14= -1 1 4
12 3 12 -14= -2 4 12
11 2 11 -14= 3 9 18
Total 23 68
68
S 1,76 S = 3,1
Bioestadística. U. Málaga. 23 1 23
PROPORCIONES
Se define como el cociente que resulta de dividir un
subconjunto por el conjunto total en que está incluido.
proporción porcentaje
Tasas
1. Se define como el cociente que resulta de dividir un número de
acontecimientos sucedidos durante un periodo de tiempo (un flujo)
por la población media existente durante ese periodo.
Hombre 4 4
3
2
Mujer 6 1
0
Hombre Mujer
Bioestadística. U. Málaga. 28
Tablas de frecuencia
Exponen la información recogida en la muestra, de forma que no se pierda nada de
información (o poca).
Bioestadística. U. Málaga. 29
Datos desordenados y ordenados en tablas
Variable: Género Género Frec. Frec. relat.
Modalidades: porcentaje
H = Hombre Hombre 4 4/10=0,4=40%
M = Mujer Mujer 6 6/10=0,6=60%
10=tamaño
muestral
Muestra:
MHHMMHMMMH
equivale a
HHHH MMMMMM
Bioestadística. U. Málaga. 30
Ejemplo
¿Cuántos individuos tienen Número de hijos
menos de 2 hijos?
frec. indiv. sin hijos Porcent. Porcent.
+ Frec. (válido) acum.
frec. indiv. con 1 hijo 0 419 27,8 27,8
= 419 + 255 1 255 16,9 44,7
= 674 individuos 2 375 24,9 69,5 ≥50%
3 215 14,2 83,8
¿Qué porcentaje de individuos 4 127 8,4 92,2
tiene 6 hijos o menos?
5 54 3,6 95,8
97,3%
6 24 1,6 97,3
7 23 1,5 98,9
¿Qué cantidad de hijos es tal
que al menos el 50% de la Ocho+ 17 1,1 100,0
población tiene una cantidad Total 1509 100,0
inferior o igual?
2 hijos
Bioestadística. U. Málaga. 31
Tabulación y Gráficas
Enumérelas en secuencia
Enumérelos en secuencia
28%
Femenino
Femenino
Masculino
72%
Masculino
Grafico 5. Nivel de Instrucción
Secundaria
23% 9%
9% TSU
Postgrado
59%
Universitaria
Diagrama de Barras (Histogramas)
Grafico 7. Lugar donde prefieren tomar whisky
25
20 23%
15 18% 18%
10 12% 11%
9%
% %
5
4% 4%
1%
0
Cafés Fiestas Labo rales P laya Casa Disco Casino Co ncierto Club
Grafico 9. Activos/ Servicios que posee
73% Internet
99% Celular
73% Telf. fijo
90% Computadora
0 20 40 60 80 100 120
Diagrama de Barras (Histogramas)
Se utilizan rectángulos separados, que tienen como base a cada uno de los
datos y como altura la frecuencia de ese dato.
Pictogramas
Fáciles de entender.
El área de cada modalidad debe ser proporcional a
la frecuencia. ¿De los dos, cuál es incorrecto?.
Bioestadística. U. Málaga. 44
Gráficos diferenciales para variables numéricas 419
400 375
255
Recuento
215
127
54
24 23 17
Diagramas barras para v. discretas 0 1 2 3 4 5 6 7 Ocho o más
Recuento
El área que hay bajo el histograma entre 150
el intervalo.
20 40 60 80
Bioestadística. U. Málaga. 45
Diagramas integrales
Cada uno de los anteriores diagramas tiene su correspondiente diagrama integral. Se realizan
a partir de las frecuencias acumuladas. Indican, para cada valor de la variable, la cantidad
(frecuencia) de individuos que poseen un valor inferior o igual al mismo. No los construiremos
en clase. Se pasan de los diferenciales a los integrales por integración y a la inversa por
derivación (en un sentido más general del que visteis en bachillerato.)
Bioestadística. U. Málaga. 46