You are on page 1of 25

UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO

FACULTAD DE CIENCIAS FISICAS Y MATEMATICAS


DEPARTAMENTO ACADEMICO DE ESTADISTICA

ESTADISTICA DESCRIPTIVA
Prof. J. Nez R.

Definicin de Estadstica
Es una disciplina que nos proporciona un conjunto de mtodos y tcnicas que nos permite recopilar, presentar, analizar e interpretar un conjunto de datos en forma adecuada para tomar decisiones frente a la incertidumbre a partir de la informacin que nos proporciona la muestra.
Mediante esta definicin podemos distinguir la Estadstica Descriptiva de la Estadstica Inferencial.

Estadstica descriptiva. Esta relacionada con la recopilacin, clasificacin y descripcin de los datos numricos con el propsito de describir cada una de las caractersticas de la poblacin.
Estadstica Inferencial. Nos proporciona la teora necesaria para elaborar conclusiones probabilsticas acerca de una poblacin en base a la informacin de una muestra tomada de dicha poblacin.

Definicin de trminos

Unidad de anlisis: Es el elemento indivisible de la poblacin, que es objeto de estudio del cual se obtiene el dato estadstico. Ejemplo: puede ser un elemento (o persona), una vivienda, un centro educativo, una historia clnica, etc.
Poblacin: Es un conjunto de unidades de anlisis que tienen una caracterstica o atributo especial cuantificable. Una poblacin se define en trminos de su contenido extensin y tiempo. Ejemplo: Si se trata de disear una muestra sobre el gasto mensual de los padres de familia de la facultad de medicina de la UNPRG, en el presente ao. Tenemos; Contenido : padres de familia Unidad de anlisis : Un padre de familia. Extensin : Facultad de medicina de la UNPRG. Tiempo : Ao 2006. Variable de estudio : Gasto mensual de las familias. Para generalizaciones inferenciales hay que distinguir dos tipos de poblaciones: Poblacin objetivo y Poblacin muestreada.

Poblacin objetivo: Es la totalidad de los elementos en discusin y acerca de los cuales se desea obtener informacin. Ejemplo: El conjunto de pacientes con SIDA registrados en el Departamento de Lambayeque durante el ao 2008. Tenemos; Contenido : Pacientes con SIDA Unidad de anlisis : Un paciente con SIDA. Extensin : Dpto de Lambayeque. Tiempo : Ao 2008. Poblacin muestreada: Esta constituida por una parte o subconjunto de la poblacin objetivo, de la cual se obtiene la muestra. Ejemplo: El conjunto de pacientes con SIDA registrados (o que asisten) al hospital Las Mercedes, durante el ao 2008.

Marco muestral. Es un documento que nos permite identificar a los elemento o unidades de anlisis de la poblacin y que puede ser una lista de personas, una relacin de viviendas, un archivo de historias clnicas, un mapa o plano de la ciudad actualizado, etc. Del cual se obtiene la muestra. Para que un marco muestral sea vlido debe contener al menos el 90% del tamao de la poblacin. Muestra. Es un subconjunto de la poblacin seleccionada convenientemente de acuerdo a un plan de estudios, con la finalidad de estudiar las caractersticas de la poblacin y debe ser representativa, viable, suficiente y de tamao apropiado. Representativa. A cada elemento de la poblacin le corresponde la misma probabilidad diferente de cero de ser seleccionada para integrar la muestra. Viable. Es decir de fcil aplicacin. Suficiente. Permite recolectar la mayor cantidad de informacin al menor costo posible.

Parmetro: Es una medida de resumen de la poblacin que describe alguna caracterstica. Para calcular dicho valor es necesario considerar a todos los valores de la poblacin. Ejemplo de algunos parmetro ms conocidos: Parmetros Notacin Media poblacional : Varianza poblacional : 2 Proporcin poblacional : P Estadstico: Es una medida de resumen que describe una caracterstica en la muestra. Su valor se calcula considerando a todos los elementos de la muestra. Ejemplo de algunos estadsticos ms usados: Estadsticos Notacin _ Media muestral : x Varianza muestral : s2 Proporcin muestral : p

Ejemplo Objetivo: Se desea conocer el colesterol promedio y la proporcin de personas que fuman cigarrillos, entre los trabajadores de la UNPRG. Si se examina a toda la poblacin, el promedio () y la proporcin (P) se consideran parmetros. _ Si el estudio se realiza mediante una muestra, se calculan los estadsticos: promedio (x) y proporcin muestral (p). Variable Las variables son las caractersticas de las Personas u objetos, que toman diferentes valores. Ejemplo: Caractersticas : Peso, Edad, Sexo, N de hijos/fam. Notacin : X Y Z W

Tipos de variables: De acuerdo a su naturaleza pueden ser : Cuantitativas y cualitativas. 1. Variables cualitativas o categricas Son aquellas que se asocian a cualidades o atributos de los elementos. Pueden ser dicotmicas, si solamente tienen dos categoras mutuamente excluyentes. Ejemplo: Sexo : masculino (m), femenino (f) Estado nutricional : normal (n), desnutrido (d) Estado de salud : sano (s), enfermo (e) Cuando las variables tienen ms de dos categoras se les denomina politmicas. Ejemplo: Nivel socioeconmico, ao de estudios, grado de instruccin, estado civil, religin, procedencia, etc.

2. Variable cuantitativa
Son aquellas que pueden asociarse a valores numricos y que son susceptibles de contar o medir. stas a su vez pueden ser: discretas o continuas. 2.1. Variables cuantitativas discretas o discontinuas Son aquellas que toman valores aislados y no pueden tomar un valor entre dos nmeros consecutivos. Por lo general resultan de un proceso de conteo. Ejemplo: nmero de hijos por familia; nmero de alumnos por seccin; nmero de recadas de un paciente; nmero de dientes con caries; das de estada en la maternidad; las ventas diarias de un negocio; etc. 2.2. Variable cuantitativa continua. Son aquellas que pueden asociarse con cualquier con cualquier nmero real comprendido entre dos lmites; es decir, tienen un recorrido infinito no numerable. Ejemplo: Estatura; peso; presin sangunea; nivel de colesterol en la sangre; ingresos; etc. En los anlisis estadsticos que realicemos ms adelante o en la eleccin de estadsticas de resumen, las variables como: estatura; peso; presin sangunea; etc. Que son intrnsicamente continuas, pero que el instrumento las ha discretizado, seguirn siendo tratadas como variables continuas.

Ejemplo Poblacin: Nios de 5 aos de edad Caractersticas Sexo : Estado nutricional : Peso : Hemoglobina : Frecuencia cardiaca : Nmero de hermanos : Tipo de variable cualitativa dicotomica cualitativa cuantitativa continua cuantitativa continua cuantitativa discreta cuantitativa discreta

Escalas de medicin
1. Nominal: Asigna a cada unidad a una entre varias categoras excluyentes. No es posible establecer relacin de orden entre las categoras. Ejemplo: Sexo: Masculino (M) (1) Femenino (F) (2) Estado civil: Soltero (S) (1) Casado (C) (2) Viudo (V) (3) Divorciado (D) (4) 2. Ordinal: Asigna a cada unidad a categoras excluyentes; pero existe un grado de intensidad de la propiedad medida, por lo que las categoras guardan orden. Ejemplo: Dolor : Leve (1) Moderado (2) Severo (3) Grado de instruccin : Primaria (1) Secundaria (2) Superior (3)

Escalas de medicin
3. De intervalo: Asigna un nmero a cada elemento para indicar la intensidad de una caracterstica, con unidad de medida y origen arbitrarios, que se eligen en base a conveniencias prcticas. Ejemplo: Temperatura: Unidad de medida C. Origen: 0 C (cero arbitrario) Puntuaciones de pruebas sicolgicas. El origen que le corresponde es arbitrario. 4. De razn: Asigna un nmero a cada elemento para indicar la intensidad de una caracterstica, con unidad de medida arbitraria, pero origen fijo, manteniendo la igualdad de las proporciones. Ejemplo: Escala de razn: Peso Hemoglobina Colesterol Presin arterial Frecuencia cardiaca.

RECOLECCIN DE DATOS
Prof. J. Nez R.

RECOLECCIN DE DATOS
Segn la definicin de estadstica, la primera actividad viene hacer el proceso de captacin de datos.
Fuentes de datos Fuentes Secundarias Son aquellos datos que han sido recolectados anteriormente para alcanzar otros objetivos y que estn publicados o registrados en alguna parte. Ejemplo: datos publicados en revistas especializadas, tesis, censos de poblacin y vivienda, etc. Fuentes Primarias Datos recolectados directamente de las unidades de anlisis. Son datos que no existan antes. Estos datos se pueden obtener por tres procedimientos:
Cuestionario Observacin Entrevista

Clasificacin de datos Consiste en agrupar las observaciones en un nmero determinado de categoras o clases dependiendo del tipo de variable, las que a su vez originan las tablas de distribuciones de frecuencias.

Clasificacin de datos Consiste en agrupar las observaciones en un nmero determinado de categoras o clases dependiendo del tipo de variable, las que a su vez originan las tablas de distribuciones de frecuencias. 1. Ejemplo: A continuacin se presenta los resultados de 30 personas con cncer pulmonar del Hospital Beln Lambayeque, en 2005. Los enfermos se clasifican segn Ciudad de Residencia (A, B, C, D); Edad (aos), Sexo (M: masculino y F: femenino) y dosaje glucosa. Los resultados fueron:

Paciente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

Ciudad A A B C A D C A B B C A A D D B A A C D D C A C D A A B B C

Edad 26 33 28 41 50 32 28 26 36 45 47 29 31 39 33 46 39 44 29 32 36 61 40 35 37 40 51 45 56 38

Sexo M M F M M F F M F M M M F M M F M M F M M M F M M F F M M M

Dosaje glucosa 118 127 131 141 119 124 141 133 114 133 143 106 144 146 146 145 116 146 133 120 139 116 129 136 153 122 130 118 122 110

Presentar la informacin en tablas de distribucin de frecuencias. SOLUCIN: Clasificacin de los datos segn variable cualitativa Tabla N 01
(Titulo)
V lidos A B C D Total Frecuenc ia 11 6 7 6 30 Porcentaje 36.7 20.0 23.3 20.0 100.0 Porcentaje ac umulado 36.7 56.7 80.0 100.0

Fuente: Encuesta aplicadapersonas con cncer pulmonar del Hospital Beln


Lambayeque

Interpretacin:

Una variable cualitativa tambin se puede representar mediante un grfico de barras o grfico de reas.
Grfico: No 01
(Grfico de barras)
12

10

A
8

Frecuencia

C
2

0 A B C D

ciudad

Fuente: Tabla 01

Tabla: N 2
Grfico No 02
(Ttulo)
Porcentaje acumulado 66.7 100.0
70

60

Vlidos

MASCULINO FEMENINO Total

Frecuencia 20 10 30

Porcentaje 66.7 33.3 100.0

50

40

30

20

Porcentaje

Fuente:

10

0 MASCULINO FEMENINO

SEXO

Fuente: Tabla 02

Interpretacin:

Los pacientes pueden ser clasificados Segn dos caractersticas cualitativas: Segn Sexo y por Ciudad de Procedencia.
Tabla N 3
Ttulo:
Recuento Ciudad A SEXO MASCULINO FEMENINO 7 4 11 B 3 3 6 C 5 2 7 D 5 1 6 Total 20 10 30

Fuente: Total

Interpretacin:
Grfico N 03
12

10

Frecuencia

SEXO
2 FEMENINO 0 A B C D MASCULINO

CIUDAD

Fuente: Tabla 03

Clasificacin de los datos Segn una variable discreta. Ejemplo: Clasificar a los trabajadores de un centro de salud, segn el nmero de hijos por trabajador. Los datos que se presentan a continuacin, corresponden a 25 trabajadores.. 2, 2, 4, 0, 0, 0, 2, 2, 4, 5, 0, 4, 1, 4, 2, 4, 5, 5, 5, 4, 4, 3, 5, 3, 2. Solucin:
Tabla: N 04

Xi 0 1 2 3 4

fi 4 1 6 2 7

Porc. 16 4 24 8 28

Interpretacin:
Grfico: N 04

5 Total

5 25

20 100

Clasificacin de los datos Segn una variable continua: Variable Edad de los pacientes.
Tabla N 05

Fuente:

Se dar un procedimiento que servir de gua u orientacin para construir la tabla de frecuencias.
Procedimiento:

Ordenamos los datos. 26, 26, 28, 28, 29, 29, 31, 32, 33, 33, 35, 36, 36, 37, 38, 39, 39, 40, 40, 41, 44, 45, 45, 46, 47, 50, 51, 52, 56, 61. ii) Clculo del Rango R R = (Vmax Vmin) +1
i)

= (61 26) + 1 = 36

iii) Clculo nmero de intervalos de clase m


4 4

m = 2.5*n = 2.5*30 = 5.8508 = 6 m=5; 6 7 iv) Amplitud Intervlica c: C = R/m = 36/6 = 6 v) Construccin de los intervalos de clase: [ Vmin ; Vmin+ ( c - 1 )] 1 : [ 26 - 31 ] 2 : [ 32 37]

6 : [ 55 - 61 ]

vi) Marca de clase Yi : Promedio de cada intervalo de clase: Y1 = (Yi + Y i-1)/2 Y1 = ( 26 + 31 )/2 = 28.5 Y2 = ( 32 + 37 )/2 = 34.5 Y6 = ( 56 + 61 )/2 = 58.5 vii) Frecuencias:
a) Frecuencias absolutas simples fi : indica el nmero de datos que estn contenidos en cada intervalo.

En el ejemplo: n1 = 7 ; n2 = 7;

n3 = 6 ; n4 = 5 ; n5 = 3 ; n6 = 2.

b) Frecuencia absoluta acumulada Fi : Se obtienen sumando las frecuencias absolutas simples en forma acumulada.

N1 = n1 = 7 N2 = n1 + n2 = 7 + 7 = 14 N3 = N2 + n3 = 141 + 6 = 20 ......................................
6

N6 = N5 + n6 = 28 + 2 = 30 = n = ni
i=1

c) Frecuencia relativa simple porcentual : hi% h1% = (f1 / n) *100 = (7/30 ) * 100 = 23.3 % h2% = (f2 / n) *100 = (7/30) * 100 = 23.3 % h6% = (f6 / n) *100 = (2 /30 ) * 100 = 6.7 % d) Frecuencia relativa acumulada porcentual : Hi% H1% = h1% = 23.3 % H2% = h1% + h2% = 23.3 % + 23.3 % = 46.6 % H3% = H2% + h3% = 46.6% + 20.0 % = 66.6 % .....
6

H6% = H5 + h6% = 83% + 17 % = 100.0% = hi%


i=1

You might also like