You are on page 1of 98

Universidad Nacional Jos Faustino Snchez Carrin Facultad de Ingeniera Qumica Y Metalurgica

Autores: Ing. Algemiro Julio Muoz Vilela Mg. ngel Hugo Campos Daz

ESTADISTICA DESCRIPTIVA

PRLOGO
En el campo de las ciencias econmicas, sociales, educativas y en la ingeniera, entre otros, la estadstica descriptiva es una herramienta de suma importancia en todas las especialidades profesionales de las diferentes universidades del pas . Debido al gran desarrollo competitivo de las instituciones las cuales demandan cada vez mayor cantidad de profesionales que desarrollen actitudes en el campo de la investigacin , asi como tambin su aplicacin mediante tcnicas y instrumentos de medicin estadstica. El presente texto que se presenta se hace con el fin de dar bases slidas para que los estudiantes de las diferentes especialidades sean estos de la carrera profesional de ingeniera, administracin, o de otras reas lo puedan utilizar como medio de ayuda en la resolucin de sus problemas Estadisticos as como tambin a la interpretacin o anlisis que se deba de hacer en alguna toma de decisiones. En la presente edicin se ha considerado el desarrollo algunos ejercicios Estadisticos as como la interpretacin de cada medida de resmenes presentados, con la intencin de proporcionar al lector el ms simple entendimiento que debe tener al usar las tcnicas del anlisis Estadstico al momento de un proceso de investigacin. En esta edicin el lector encontrar problemas propuestos. problemas desarrollados y

Los autores

INDICE
2

ESTADISTICA DESCRIPTIVA

CAPITULO 1 1.- ESTADISTICA 1.1 Definicin 1.1.1Conceptos 1.1.2Estadistica como ciencia 1.1.3 Para qu sirve la estadstica 1.2 Clasificacin de la Estadstica 1.2.1 Estadistica Descriptiva 1.2.2 Estadstica Inferencial 1.3 Algunas definiciones Estadsticas 1.3.1 1.3.2 1.3.3 1.3.4 Poblacin Muestra Parmetro Estadstico

1.4 Variables y sus tipos 1.4.1 Por su generalidad y abstraccin - Variables Teoricas - Variables Intermedias - Variables Empiricas 1.42 Por su relacin causal - Variable Independiente - Variable Dependiente - Variable Interviniente 1.4.3 Por su naturaleza - Variable Cualitativa - Variable Cuantitativa

CAPITULO 2 2.- MEDICION DE VARIABLES

ESTADISTICA DESCRIPTIVA

2.1 ESCALAS DE MEDICIN 2.1.1 2.2.2 2.2.3 2.2.4 Escala Escala Escala Escala Nominal Ordinal de Intervalo de Razn

2.2 INSTRUMENTOS DE RECOLECCIN DE DATOS CUANTITATIVOS 2.2.1 2.2.2 2.2.3 2.3.4 2.3.5 2.3.6 2.3.7 la la la la la la el investigacin documental. investigacin de campo observacin experimentacin entrevista encuesta cuestionario

2.3 FUENTES DE INFORMACIN 2.3.1 Primarias 2.3.2 Secundarias 2.4 REDONDEO DE DATOS, NOTACIN CIENTFICA Y CIFRAS SIGNIFICATIVAS 2.4.1 Redondeo 2.4.2 Notacin cientfica 2.4.3 Cifras significativas 2.5 ORDEN DE DATOS 2.5.1 Mtodo del Listado en Orden 2.5.2 Mtodo de tallos y hojas

CAPITULO 3 3.- DISTRIBUCION DE FRECUENCIAS

ESTADISTICA DESCRIPTIVA

3.1 tabla de distribucion de frecuencias 3.1.1 partes de una tabla estadstica 3.1.2estructura de una tabla de distribucion de frecuencias 3.1.3 tipos de frecuencia en una tabla estadstica 3.1.4 clculo del nmero de intervalos 3.1.5 clculo del rango (r) 3.1.6 clculo de la amplitud o ancho de clase (w) CAPITULO 4 4.- DESARROLLO DE LAS MEDIDAS DE RESUMEN 4.1 Medidas de tendencia central 4.1.1 Media 4.1.2 Mediana 4.1.3 Moda 4.1.4 Media Geomtrica 4.1.5 Media Armnica 4.2 Medidas de posicin 4.2.1 Percentiles 4.2.2 Deciles 4.2.3 Cuartiles 4.3 Medidas de Dispersin 4.3.1.Rango 4.3.2 Recorrido Intercuartilico 4.3.3 Desviacin Media 4.3.4 Varianza 4.3.5 Desviacin Estndar 4.3.6 Coeficiente de Variacin 5.- Medidas de Forma 5.31 Asimetra 5.3.2 Curtosis 6.-BIBLIOGRAFIA

ESTADISTICA

ESTADISTICA DESCRIPTIVA

Con algunas definiciones se pretende que el estudiante aprenda conceptos descriptivos e inferenciales, conociendo sus aplicaciones en el mundo real, en diferentes campos hasta el de ingeniera. Para formarnos una idea de lo que es la Estadstica relacionmoslo con las siguientes interrogantes: Es Ciencia? Porque busca sistemticamente a travs de Experimentaciones y conocimiento la Realidad del problema en estudio. Es la Tecnologa del Mtodo Cientfico? Qu es la investigacin cientfica? Es la bsqueda sistematizada y objetiva de nuevos conocimientos. Investigar es un proceso de buscar, indagar o pesquisar. El mtodo cientfico, comprende la realizacin de la investigacin en forma sistematizada y objetiva, organizada y coherente haciendo uso de tcnicas y procedimientos como: La Observacin del Problema. La formulacin de Hiptesis. La Experimentacin. Las Leyes y Teoras. Conclusiones. Documentaciones.

Es una Herramienta? Es una herramienta til para el aprendizaje del mundo que nos rodea, porque con ella se Recoge, Clasifica, Presenta, Analiza e interpretan las informaciones procedentes de una investigacin, para de esta manera obtener resultados y hacer inferencias validas cientficas (proyecciones a futuro). La Estadstica sirve para: Para promediar y calcular una serie de datos. Para hacer relaciones de una variable con la otra. Para hacer representaciones de la informacin en cuadros estadsticos y en Graficos. Para determinar la validez y fiabilidad de la informacin obtenida haciendo predicciones a travs de la probabilidad.

ESTADISTICA DESCRIPTIVA

Quienes lo Usan? Ante las necesidades cambiantes que se dan en la Sociedad, es necesario contar con herramientas altamente confiables que nos permitan tomar decisiones acertadas y eficaces para poder resolver los problemas prioritarios que podran enmarcarse de acuerdo al criterio 80/20 (el 80% de todos los problemas se deben al 20% de las causas.) .De ah que sea fundamental que todos los futuros profesionales que pretendan dirigir correctamente los destinos de la humanidad, aprendan y se sirvan de los mtodos estadsticos para minimizar la probabilidad de error en la toma de decisiones en esta era llamada del conocimiento, que actualmente cuentan con todas ayudas de ltima generacin que a travs de excelentes software permiten agilizar todo el trabajo estadstico. Actualmente existen muchos paquetes estadsticos que agilizan todo el trabajo y entre los ms importantes tenemos: SPSS: Gestin de datos, anlisis estadstico, grficos y presentacin de resultados. STAGRAPHICS: Paquete de anlisis interactivo y sistema grafico SAS: Planificacin, anlisis estadstico, grficos y presentacin de resultados. EXCEL: anlisis estadstico, grficos y presentacin de resultados. STATISTICA: Planificacin, presentacin de resultados anlisis estadstico, grficos y

MINITAB: Planificacin, anlisis estadstico, grficos y presentacin de resultados ARIMA: Diseo de experimentos EVIEWS: Anlisis economtrico y estadstico, grficos y presentacin de resultados Es usada en: Las comunicaciones, la industria, la Agricultura, la salud, por los rganos Gubernamentales, los Organismos Oficiales, los Diarios y revistas, los Administradores, los Ingenieros, los Deportes, los Mdicos,

ESTADISTICA DESCRIPTIVA

el Marketing, profesionales.

en

el

Control

de

Calidad

diferentes

reas

DEFINICIONES.La estadstica es la ciencia que nos facilita la solucin de problemas, en los cuales necesitamos conocer caractersticas sobre el comportamiento de algn suceso o evento. Nos permite inferir el comportamiento de sucesos iguales o similares sin necesidad que estos ocurran. Nos da la posibilidad de poder tomar decisiones acertadas y a tiempo, asi como realizar proyecciones del comportamiento del suceso, en un escenario de incertidumbre. Por lo general solo se realizan clculos y anlisis con los datos obtenidos de una muestra y no con toda la poblacin. En trmino generales la estadstica se puede utilizar para mejorar el rendimiento en el trabajo y en muchos aspectos de la vida diaria ya que es una gua universal para lo desconocido DEFINICIN: La Estadstica es la ciencia que se encarga de recolectar, organizar, resumir, analizar, interpretar y representar grandes cantidades de datos con respecto a una caracterstica materia de estudio o investigacin, para transformarlos en informacin que nos facilite la solucin de problemas obteniendo conclusiones y de esta manera poder tomar decisiones. Qu es la Recoleccin de Datos? Es el registro de caractersticas(medicin, observacin, conteo) a una unidad elemental (o de anlisis). Qu es la Organizacin de Datos? Es el ordenamiento para una mejor comprensin y facilitar sus anlisis. (tablas, grficos y figuras). Los datos sin organizar se llaman datos brutos, y son de poca utilidad Qu es el Anlisis de Datos?

ESTADISTICA DESCRIPTIVA

Es el clculo de MEDIDAS REPRESENTATIVAS (o de resumen) tales como promedios, medidas de variabilidad y medidas de la forma de la distribucin. Tambin se analizan datos cuando se establecen relaciones entre ellos (regresin y correlacin). Qu es la Interpretacin de Datos? Es darle un sentido prctico o til a los resultados obtenidos en el anlisis. La estadstica responde a nuevas demandas sociales para realizar investigaciones exhaustivas sobre temas sociales surgiendo 2 problemas bsicos a la hora del trabajo de Campo: Como el tiempo que tardaramos entrevistar a toda la Poblacin. El costo econmico y de personal de estas entrevistas.

Con las Tcnicas de Muestreo se consigue hacer buenas Investigaciones sobre una pequea parte de esa poblacin, obteniendo resultados vlidos para todo ella. El control de Calidad permite medir las caractersticas de la calidad de un producto, compararlas con ciertos requisitos y tomar decisiones correctivas si hay diferencias entre el funcionamiento real y el esperado. Con estudios estadsticos aplicados a las diversas reas podemos estimar los Rendimientos obtenidos en una determinada produccin.

Clasificacin de la Estadstica: Estadstica Descriptiva.Se denomina as al conjunto de mtodos estadsticos que se relacionan con la recoleccin, el resumen, descripcin y visualizacin adecuada de los datos originados a partir de los fenmenos en estudio. Emplea la construccin de TABLAS y representaciones GRAFICAS que permiten simplificar la complejidad de los datos que intervienen en la Distribucin.

ESTADISTICA DESCRIPTIVA

Hace uso del mtodo deductivo en el anlisis que consiste en que conocida la poblacin se puede aplicar las Generalidades a la Muestra. Estadstica Inferencial.Se encarga de analizar la informacin presentada por la estadstica descriptiva mediante tcnicas que nos ayuden a interpretar y conocer con un determinado grado de confianza a la poblacin lo que nos permitir tomar decisiones . Hace uso del mtodo Inductivo, plantea y resuelve el problema de establecer previsiones y conclusiones generales sobre una Poblacin a partir de los resultados obtenidos en una muestra. Algunas definiciones Estadsticas Importantes: POBLACION: Se define poblacin al conjunto de todos los individuos Elementos, objetos, eventos que cumplen ciertas propiedades en comn, sobre el que se realizan las observaciones y/o mediciones. En los estudios con poblaciones de personas, la unidad de Observacin son los individuos. Segn el nmero de elementos puede ser: POBLACION INFINITA, es cuando tiene un nmero infinito de elementos es decir es extremadamente grande. POBLACION FINITA, es cuando tiene un nmero determinado de elementos, es decir es posible contarlos e numerarlos. En relacin al tamao de la poblacin, esta puede ser: MUESTRA: Es una parte o un subconjunto de la Poblacin, que tiene la caracterstica fundamental de ser representativa de la Poblacin. CENSO: es el procedimiento durante el cual se realiza la Encuesta para recopilar informacin de toda POBLACION. MUESTREO: es el procedimiento en el que se realiza la Encuesta para recopilar informacin de unas MUESTRAS. PARAMETRO: funcin definida sobre los valores numricos que resumen todos los datos de caractersticas medibles de una poblacin.se simboliza con letras griegas y

10

ESTADISTICA DESCRIPTIVA

ESTADISTICO: funcin definida sobre los valores numricos que resumen todos los datos de caractersticas medibles de una Muestra. Se simboliza con letras del alfabeto X y S. ELEMENTOS: entidades de las cuales recogemos los datos. DATO (OBSERVACION): Es el resultado o medida que se obtiene al realizar la medicin de la caracterstica de la variable en estudio. Pueden ser cuantitativos o cualitativos. TAMAO DE LA MUESTRA: Es la cantidad de ELEMENTOS de una muestra, y por lo general debe ser representativa de la Poblacin. UNIDAD DE ANALISIS: Es el objeto del cual se desea obtener informacin, muchas veces llamado tambin Elementos. Puede ser algo con existencia real, como un automvil, una casa un caldero, o algo ms abstracto como la Temperatura, presin o un intervalo de tiempo. VARIABLE: es una caracterstica o propiedad de inters de cada ELEMENTO, se puede medir o clasificar y cambia o varia con el tiempo. Son caractersticas que varan de individuo a individuo, de objeto a objeto, mientras que las que permanecen inalterables se llaman constantes. Generalmente las variables se designan con las letras maysculas del abecedario X. Y .Z. Ejemplo: La U.N.J.F.S.C., lleva a cabo un estudio para determinar la situacin ocupacional de sus Egresados en la Carrera de Ingeniera Qumica. En este estudio se quiere identificar si son constantes o variables con las siguientes propiedades: a) Sexo ( V ) b) Ingresos Mensual ( V ) c) Profesin ( C) d) Aos de Experiencia ( V ) e) Nivel jerrquico ocupacional. ( V ) Clasificacin de las Variables En qu consiste la clasificacin de las Variables?

11

ESTADISTICA DESCRIPTIVA

Los datos deben manejarse en una investigacin cientfica para describir los objetos de inters, son en general de naturaleza diversa. La consideracin de estas diferencias es esencial para decidir el mtodo de anlisis estadstico adecuado. Por su generalidad o nivel de Abstraccin

a) Tericas son aquellas que necesitan definirse operacionalmente, porque sus cualidades o caractersticas no son fcilmente observables ni medibles. b) Intermedias son aquellas que permiten especificar a las variables tericas, con el fin de hacerlas observables y medibles. c) Empricas son aquellas que no necesitan definirse operacionalmente, porque sus valores se identifican en forma inmediata y son fcilmente medibles. Por su relacin causal

a) Independientes (X) Son aquellas que no dependen de ninguna variable dentro de un contexto determinado. b) Dependientes (Y) Son aquellas que dependen de otra u otras variables dentro de un contexto determinado. c) Interviniente (Z): son aquellas que van a especificar las condiciones o requisitos para que las variables X e Y tomen sus correspondientes valores. Ejemplo: El escaso fomento de la educacin alimentaria en la poblacin, genera mayor desnutricin infantil en las familias con bajo nivel de instruccin. En este ejemplo las variables son: Educacin alimentaria independiente Desnutricin dependiente infantil = = X Variable

Variable

12

ESTADISTICA DESCRIPTIVA

Nivel de instruccin interviniente Por su Naturaleza:

Variable

a) Variables Cualitativas Son caractersticas o atributos que se refieren a cualidades y/o categoras que no se pueden medir ni describir numricamente (por ejemplo afinidad religiosa, nacionalidad, color de piel, color de ojos, sexo, etc.) Variable Nominal: es una variable que nos permite distinguir entre clases, es decir, permite nombrar y diferenciar, adems se pueden utilizar frecuencias, porcentajes, graficos y moda. Ejemplo: Estado Civil, Marca de las calculadoras , etc. Variable Ordinal: En ella existe una relacin de orden en el recorrido de la variables, es decir nombra, ordena, diferencia y jerarquiza, de aqu se pueden calcular frecuencias, porcentajes, graficos sectoriales y la moda. Ejemplo: Grado en las fuerzas armadas, cargos, etc

b) Variables Cuantitativas Tienen valor numrico y pueden ser medibles y contables (por ejemplo edad, precio de un producto, ingresos anuales, etc.) y se pueden clasificar en Discretas y Continuas. Variables Discretas: solo pueden tomar valores enteros (1, 2, 3, 4, etc) Existe una unidad mnima que no puede subdividirse. Ejemplos: Paginas de un libro, nmero de hijos, de hermanos, cantidad de autos, etc.

Variables Continuas: en los valores de estas variables casi siempre existen nmeros entre 2 de ellos y pueden tomar cualquier valor real dentro de un intervalo. Ejemplo: La Temperatura, la longitud, la

13

ESTADISTICA DESCRIPTIVA

ACTIVIDADES DE APRENDIZAJE Contenido: una variable. Poblacin, muestra, elemento, variable, medicin de

I. IDENTIFIQUE EN LOS SIGUIENTES CASOS UNA POBLACIN O UNA MUESTRA: 1- 12 % de ingresantes (muestra) de una universidad en el ao 2011.

2- Nmero de estudiantes egresados de una universidad en el ao 2006. (poblacin) 3- Nios menores de 5 aos de una comunidad como resultado del censo de 2010.(poblacion) 4- Nmero de discapacitados que ingresaron a la universidad en el ao 2005. (poblacion) 5- Se toma el 10 % de viviendas construidas en el ltimo quinquenio. (muestra) 6- Se estudi los antecedentes de 15 choferes de 30 a 50 aos de edad. (muestra) 7- Pacientes atendidos en traumatologa en el Hospital Rebagliati en el ao 2012.(poblacion) 8- Sembros seleccionados en un fundo con ms de cinco hectreas.(muestra)

14

ESTADISTICA DESCRIPTIVA

9- Vacunos en la Selva al 30 de junio de 2005. (poblacin) 10- Diez por ciento de nios seleccionados para un coro infantil. (muestra)

INSTRUMENTO DE RECOLECCION DE INFORMACION

Tema

Planteamiento del Problema

Objetivos

Diseo Metodolgico

Hiptesis

Marco Terico

Universo y Muestra

Recoleccin de Informacin

ESCALAS DE MEDICIN Son de gran importancia en un proceso de Investigacin. Medir: significa asignar nmeros, smbolos o valores a las propiedades de objetos, personas, estados o eventos de acuerdo con reglas especficas para representar la calidad o cantidad de un atributo. En investigacin hay cuatro niveles bsicos de medicin: a) Escala Nominal; divide los datos en categoras, los nmeros que se asignan a objetos o fenmenos son clasificaciones, se emplean para calcular recuentos de frecuencias , porcentajes y modas. b) Escala Ordinal; tiene como propsito dar orden (prioridades) a los datos de forma ascendente o descendente. Se emplean para calcular la Mediana, la Media y la Desviacin Tpica.

15

ESTADISTICA DESCRIPTIVA

c) Escala de Intervalos; son escalas que agrupan las mediciones por intervalos o rangos, donde los puntos de escala son iguales. Se emplean para calcular la media aritmtica, las desviaciones estndares y el coeficiente de correlacin. d) Escala de Razn; es una escala similar a las escalas de intervalos, sin embargo, tienen un cero absoluto u origen. Se utilizan con variables como ingresos, volumen de produccin, rentabilidad, etc. Un instrumento de medicin adecuado es aquel que registra datos observables que representan verdaderamente los conceptos o las variables que el investigador tiene en mente. Requisitos que debe cumplir un instrumento de medicin: Toda Medicin o Instrumento de medicin tiene los siguientes requisitos esenciales: Confiabilidad: se refiere al grado en que su aplicacin repetida al mismo sujeto o objeto produce resultados iguales, consistentes y coherentes. Validez: se refiere al grado en que un instrumento realmente mide aquello para lo cual esta destinado. Indica el grado con que pueden referirse conclusiones a partir de los resultados obtenidos.

Factores que afectan la confiabilidad y la validez de los instrumentos de medicin La improvisacin, consiste en creer que un instrumento de medicin es un cuestionario que resulta de elaborar varias preguntas sin mucha dedicacin ni revisin. La utilizacin de instrumentos desarrollados en el extranjero que no han sido validados en el respectivo contexto.

La validez y la confiabilidad no se asumen se prueban.

ACTVIDADES DE APRENDIZAJE

16

ESTADISTICA DESCRIPTIVA

I.- IDENTIFIQUE EL TIPO DE VARIABLE EN CADA UNO DE LOS SIGUIENTES CASOS: 123456789Nivel socioeconmico Estatura Regiones geogrficas del Per Porcentaje de natalidad Grado de ausentismo escolar Temperatura en grados centgrados Tasa de mortalidad infantil Ingreso per capita variable cualitativa variable cuantitat variable cualitativa variable cuantitat variable cualitativa variable cuantitat variable cuantitat variable cuantitat

Porcentaje de pobreza en el Per variable cuantitat variable cualitat EN CADA UNO DE LOS

10- Facultades de una universidad II- DETERMINE LA ESCALA DE MEDICIN SIGUIENTES CASOS: 1234567Sueldo de los catedrticos Tasa de mortalidad infantil.

(< 5 000 y > 5 000) Escala de razn Escala de razn

Rendimiento escolar (bajo, medio, alto) Escala ordinal Edad en aos cumplidos Temperatura en grados Ingreso familiar (alto, medio, bajo) Escala de razn Escala intervalo Escala ordinal

Categora educacional (empleado, obrero, independiente) Escala ordinal

17

ESTADISTICA DESCRIPTIVA

OBTENCION y RECOLECCION DE INFORMACIN Por qu necesitamos recolectar datos? Proporcionan la evidencia imprescindible en un estudio de investigacin. Permiten medir el desempeo en el proceso de produccin de un bien o servicio. Ayudan a la formulacin de cursos alternativos de accin en un proceso de toma de decisiones. Satisfacen nuestra curiosidad innata La Recoleccin de datos consiste en obtener informacin sobre los atributos, cualidades, conceptos (variables) relacionados con los participantes, eventos, sucesos, casos, comunidades, objetos que participan en el proceso de Investigacin.

Pasos a seguir para la recoleccin de datos 1.- Identificar las fuentes primarias o secundarias: Personas, archivos, expedientes, observaciones

18

ESTADISTICA DESCRIPTIVA

2.- lugar de localizacin de las fuentes: generalmente proviene de la muestra. 3.- medio o mtodos de recoleccin de los datos: Observacin, Encuestas, Entrevistas, Equipos. 4.- Medio o mtodos de procesamiento para dar respuesta al problema. Qu tipos de datos existen? Constante , si el registro de la caracterstica toma un slo valor en todas las unidades elementales. Son muchos datos, pero iguales. Las constantes no son inters en Estadstica, puesto que ella se ocupa del estudio de la variabilidad de los datos. Ejemplos Sexo de las pacientes en el Servicio de Ginecologa Ttulo profesional de los miembros del Colegio de Ingenieros del Per.

Variable, si el registro de la caracterstica toma diversos valores en las unidades elementales. Una misma caracterstica puede generar constantes variables, depende del marco muestral. Ejemplo Edad, sexo y Profesin de los Egresados de la U.N.J.F.S.C Elementos a considerar en un plan de recoleccin de informacin: a) las Variables: conceptos o atributos a medir. b) las definiciones operacionales: la forma como hemos operacionalizado las variables nos permitirn identificar el mtodo para medirlas. c) La Muestra: nmero de unidades de anlisis a medir, la cual debe ser una parte representativa de la poblacin. d) los recursos disponibles: econmicos, humanos, etc. tiempo, apoyo institucional,

19

ESTADISTICA DESCRIPTIVA

INSTRUMENTOS DE RECOLECCIN DE DATOS CUANTITATIVOS

Cuestionario

Encuesta

Entrevista

Observacin

La Experimentacin

20

ESTADISTICA DESCRIPTIVA

Existe una gran variedad de tcnicas para realizar la investigacin, que se debern seleccionar de acuerdo a las necesidades del problema, asi como a diferentes factores como son el tiempo, costo, tipo de actividades a realizar, recursos humanos, etc. Las tcnicas de recopilacin de datos las podemos realizar con: LA INVESTIGACIN DOCUMENTAL. Consiste en el estudio de documentos escritos sobre un objeto determinado, es decir son todos aquellos documentos registrados en diferentes dispositivos fsicos a los que podemos tener acceso en forma directa o indirecta para su consulta y se puede clasificar en :

1.- Documental bibliogrfica 2.- Documental audiografica 3.- Documental hemerografica 4.- Documental videografica 5.- Documental escrita 6.- Documental iconogrfica LA INVESTIGACION DE CAMPO Consiste en obtener informacin directa mediante diferentes actividades por contacto directo con el hecho que se quiere investigar asi como las personas relacionadas y se puede realizar: a) por observacin directa. b) Por interrogacin LA OBSERVACIN Es el procedimiento emprico bsico, el cual consiste en realizar la percepcin intencionada de una actividad determinada mediante la experimentacin la cual consiste en la obtencin de datos cuantitativos de forma directa, por medio de la medicin del fenmeno u objeto de estudio que se est observando, para luego describir y analizar

21

ESTADISTICA DESCRIPTIVA

situaciones sobre la realidad estudiada. Para realizar la observacin se utilizan diversos instrumentos auxiliares los cuales son : 1.- la ficha de campo 2.- La entrevista 3.- La encuesta 4.-Estudio de actividades realizadas con anterioridad, biografas, etc Por lo general se observan caractersticas y condiciones comportamientos, caractersticas ambientales entre otros. o

LA EXPERIMENTACIN Consiste en un procedimiento utilizado en la Investigacin Cientfica para obtener informacin que permita conocer el comportamiento de algn proceso LA ENTREVISTA Es una de las tcnicas ms comunes que consiste en recoger informacin verbal a las interrogantes planteadas sobre el problema, y es considerada como el proceso directo de comunicacin interpersonal establecida entre el investigador (entrevistador) y el objeto de estudio a travs de individuos o grupos (entrevistado); con el fin de obtener testimonios reales. a) Entrevistas formales b) Entrevistas informales El investigador usa un listado de preguntas o temas a tratar, pero sigue teniendo la posibilidad de improvisar o profundizar un tema. LA ENCUESTA La encuesta la podremos definir como una investigacin realizada sobre una muestra de sujetos representativa de un colectivo ms amplio ( Poblacin) , utilizando procedimientos estandarizados de recopilacin de informacin como la interrogacin con la intencin de obtener mediciones cuantitativas de una gran variedad de caractersticas objetivas y subjetivas de la poblacin, con el fin de

22

ESTADISTICA DESCRIPTIVA

identificar las magnitudes del problema. Los datos se recolectan mediante el uso del cuestionario

a) Un cuestionario b) Una cedula de entrevista

Mediante la encuesta se obtienen datos de inters sociolgico interrogando a los miembros de un colectivo o de una poblacin EL CUESTIONARIO: Es un eficaz auxiliar en la observacin cientfica que contiene aspectos del fenmeno esenciales, las cuales son preguntas diseadas y formuladas por escrito para generar los datos necesarios para alcanzar los objetivos del proyecto de investigacin y son contestadas por los encuestados. Cuestionario por correo Cuestionario administrado por el entrevistado Cuestionario administrado por el entrevistador

Se trata posiblemente del instrumento ms utilizado para recabar informacin de la unidad de anlisis, objeto de estudio y/o centro del problema de investigacin, nos permite obtener los datos para llenar los cuadros Estadisticos establecidos. Su preparacin se efectua durante el planeamiento de la Encuesta, despus de que estn definidos aquellos aspectos que son fundamentales para conseguir informacin objetiva y fcil de precisar. CRITERIOS BSICOS PARA EL DISEO DE UN CUESTIONARIO Antes de iniciar la elaboracin del cuestionario, es necesario tener claros los objetivos y las hiptesis o preguntas de investigacin que impulsan a disear el cuestionario. Para preparar un instrumento para recabar datos, deben examinarse los siguientes aspectos bsicos.

23

ESTADISTICA DESCRIPTIVA

Naturaleza de la informacin que se busca Naturaleza de la poblacin o muestra. Medio o medios de aplicacin del instrumento

LA CEDULA. Tiene carcter de annimo, donde el encuestador es quien llena la cedula de entrevista, adems de que es posible aclarar la informacin sobre las preguntas y es utilizada cuando una persona tiene un bajo nivel cultural. Bibliogrfica Hemerografica
I n v e s t i g a c i n

Escrita Documental Audiografica Videografica Iconogrfica Dispositivo Magntico Ficha de campo Observacin directa Campo Por interrogacin Entrevista Actividades anteriores Formal Informal Cuestionario Cedula de Entrevista

Entrevista

FUENTES DE INFORMACION

24

ESTADISTICA DESCRIPTIVA

En un estudio o investigacin estadstica son bsicos los datos. Atendiendo a su procedencia o generacin, las llamadas fuentes de informacin se clasifican en: Fuentes de Informacin Primaria:

Informacin que rene o genera el investigador para alcanzar los objetivos del proyecto, anlisis o estudio de un fenmeno Fuentes de Informacin Secundaria

Recabada por empresas o agentes ajenos a la propia investigacin. Suele ser informacin elaborada en otras investigaciones o recopilada y difundida por organismos oficiales. Investigacin Documental Procedimiento para obtener datos mediante la consulta de informacin ya escrita y concentrada en documentos que se localicen en libros o revistas en bibliotecas, hemerotecas, o en centros virtuales. REDONDEO DE DATOS, NOTACIN CIENTFICA Y CIFRAS SIGNIFICATIVAS Redondeo el redondeo de datos es un procedimiento que consiste en escribir un nmero que representa a una cantidad con menos cifras de las que tiene realmente para tener una idea rpida de la cantidad. Notacin Cientfica Es una manera de escribir en forma breve cifras muy grandes o pequeas. La forma general es: a*10, en donde a es un nmero entre 1 y 9, n es un nmero entero.

Ejemplo: El nmero 25000 se escribe 2.5 * 10 , o el nmero 0.00025 se escribe como 2.5 * 10
-4 4

. 25

ESTADISTICA DESCRIPTIVA

CIFRAS SIGNIFICATIVAS A los dgitos exactos que se utilizan para escribir una cifra, a parte de los ceros para localizar el punto decimal, se les llama cifras significativas. Ejemplos: a) 3.22 tiene 3 cifras significativas 3.22 se encuentra realmente entre 3.215 y 3.225 b) 0.0032 = 3.2*10
-3

tiene 2 cifras significativas

0.0032 se encuentra entre 0.00315 y 0.00325 c) 0.00320 = 3.20*10


-3

tiene 3 cifras significativas

0.00320 se encuentra entre las cifras 0.003195 y 0.003205

ORDEN DE DATOS La ordenacin de datos es el proceso mediante el cual los datos estn acomodados de tal manera que se establece un orden (ascendente o descendente) entre ellos.

Hay 2 mtodos comunes:

Mtodo de Listado en Orden.Proceso de ordenacin agrupamiento de un conjunto de datos en orden ascendente Ejemplo:

26

ESTADISTICA DESCRIPTIVA

Considera que la variable de estudio es el peso de 25 estudiantes. Los pesos se encuentran en la siguiente tabla:

Peso de 25 estudiantes ( en Kg) 40 56 52 63 57 43 44 62 50 66 48 42 44 56 63 51 55 50 55 51 49 52 59 45 58

El proceso consiste en ordenarlos de menor a mayor

Peso de los 25 estudiantes ( kg 40 56 52 63 57 43 44 62 50 66 48 42 44 56 63 51 55 50 55 51 49 52 59 45 58

Peso de los 25 estudiantes ( kg 40 45 51 55 59 42 48 51 56 62 43 49 52 56 63 44 50 52 57 63 44 50 55 58 66

Mtodo de Tallos y Hojas Si los nmeros de los datos estn formados por 2 dgitos, se hace una columna con el primer digito (decenas) y a la derecha de cada uno de ellos se escribe, en la fila, solo el segundo dgito (unidades) de cada uno de los datos27 que tengan el mismo primer digito.

ESTADISTICA DESCRIPTIVA

Del ejemplo anterior tenemos: Datos sin ordenar 0 4 5 6 1 2 6 3 5 6 2 3 2 0 9 0 6 5 7 1 8 3 8 9 4 2 4 5

Datos Ordenados 4 5 6 0 0 2 2 0 3 3 1 3 4 1 6 4 2 5 2 8 5 9 5 6 6 7 8 9

28

ESTADISTICA DESCRIPTIVA

CAPITULO 2 2.1DISTRIBUCION DE FRECUENCIAS 2.1 TABLA DE DISTRIBUCION DE FRECUENCIAS Constituye un cuadro de resumen de la Informacin, en el cual se realiza la tabulacin de los datos en forma de un conteo matemtico, obtenidos en un proceso de investigacin, o de un objeto de Estudio. Ofrece un resumen tabular ms compacto de un conjunto de datos que muestra la frecuencia ( o la cantidad) de artculos en cada una de las clases que no se superponen. Al resumir grandes cantidades de datos, es til distribuirlos en clases o categoras y determinar el nmero de individuos que pertenecen a cada clase, llamado FRECUENCIA DE CLASE. Una disposicin Tabular de los datos por clases junto con las correspondientes frecuencias de clase, se llama DISTRIBUCION DE FRECUENCIAS 2.1.1 PARTES DE UNA TABLA ESTADISTICA Toda tabla para su mejor identificacin y visualizacin de la informacin debe tener las siguientes partes: a) Ttulo Expresa en forma resumida la informacin que contiene y se coloca en la parte superior de la tabla. Debe ser breve completo y concreto, y debe contener lo siguiente: Institucin o rea geogrfica, del fenmeno que se est tratando. El ao en el cual se realiza el estudio.

b) Encabezado

29

ESTADISTICA DESCRIPTIVA

Est formado por la primera fila de la parte superior y nos indica las caractersticas ( las variables) del fenmeno estudiado. c) Columna Matriz Es la primera columna de la izquierda y contiene tambin variables del fenmeno en estudio. Tambin se le denomina ttulo de las filas. d) Cuerpo Es el contenido mismo de la informacin de la Tabla, los valores numricos resumidos de la cantidad de datos se presenta en celdas o casillas de interseccin ordenada por los ttulos de las columnas y filas. e) Fuente Indica el lugar o la fuente de informacin de donde se procedi a la recoleccin de los datos presentados en la tabla, se coloca siempre en la parte inferior de la tabla. 2.1.2 ESTRUCTURA DE UNA TABLA DE DISTRIBUCION DE FRECUENCIAS CUADRO N UNJFSC Alumnos matriculados segn Facultad Agosto 2013

titulo

Encabezado

X
X1 X2 :

fi
f1 f2 : : Fk N

Fi
f1=F1 f1+f2=F2 : :

hi
h1=f1/N h2=f2/N :

Hi
h1=H1=F1/N h2=H2=F2/N :

Columna Matriz

: Xk

E
:

hk=fk/N

30

ESTADISTICA DESCRIPTIVA

Fuente:

Registros Acadmicos de la UNJFSC

2.1.3 TIPOS DE FRECUENCIA EN UNA TABLA ESTADISTICA Definimos: a) Frecuencia absoluta simple (fi) : Nmero de veces que se observa o repite un determinado valor en la muestra seleccionada. fi = N b) Frecuencia absoluta acumulada (Fi) : Es el nmero de veces fi en la muestra N con un valor menor o igual al de la variable. La ultima frecuencia acumulada deber ser igual a N F1 = f1 F3 = f1 + f2 + f3 F4= f1 + f2 + f3 +f4 de la misma forma para los dems valores c) Frecuencia relativa ( hi): Es el cociente entre la frecuencia absoluta y el tamao de la muestra (N). es decir, siendo el fi para todo el conjunto i. si multiplicamos la frecuencia relativa por 100 obtendremos el porcentaje que presenta esta caracterstica respecto al total de N hi = fi /N d) Frecuencia relativa acumulada ( Hi) : Es el cociente entre la frecuencia absoluta acumulada y el nmero total de datos N Hi = Fi /N F2 = f1 + f2

31

ESTADISTICA DESCRIPTIVA

Ejemplo de tablas Estadsticas

2.1.4 CALCULO DEL RANGO (R) Para calcular el rango de una tabla de frecuencias seleccionamos el DATO MAXIMO y el DATO MINIMO del cual hacemos una diferencia (resta) para ver la variabilidad que entre ellos existe.

2.1.5 CALCULO DEL NUMERO DE INTERVALOS Para calcular el nmero de clases de una tabla de frecuencias podemos usar las siguientes expresiones:

Siendo la ms utilizada la Regla de sturges

32

ESTADISTICA DESCRIPTIVA

2.1.6 CALCULO DE LA AMPLITUD O ANCHO DE CLASE (W) Para determinar la Amplitud dividimos el Rango obtenido sobr e el nmero de intervalos. Debemos tener en cuenta que cuando los datos de la investigacin se trabajan con enteros la amplitud tambin se aproximara a un valor entero, y si los datos fueran decimales la amplitud se aproximara a la cantidad de decimales que tengan los datos

Ejemplo: 1.- Considere los siguientes datos aleatorios. 15 14 16 16 2 7 17 7 15 6 5 10 19 13 3 10 13 12 8 9 18 20 1 5 10 20 10 4 20 13 19 11 3 7 19

SOLUCIN: CALCULO DEL NMERO DE INTERVALOS (k)

CALCULO DEL RANGO (R)

33

ESTADISTICA DESCRIPTIVA

CALCULO DE LA AMPLITUD O ANCHO DE CLASE (W)

Para un mejor resultado y mejor sencillez tomamos como k = 5. k = nmero de intervalos Ls = Limite Superior Clase Marca clase Tabul. Li = Lmite inferior W = Ancho de Clases Frec Frec. Acum. Frec. Relat.

W=4y

Frec. Acum. Relat. Hi 5/35 12/35 19/35 27/35 35/35

Li 1.0 5.0 9.0

Ls

Xi 3.0 7.0 11.0 15.0 19.0

F Lllll lllll ll lllll ll lllll lll lllll lll

Fi 5 7 7 8 8 N=35

Fi 5 12 19 27 35

hi 5/35 7/35 7/35 8/35 8/35

- 5.0 - 9.0 - 13.0

13.0 - 17.0 17.0 - 21.0

Ejercicio para practicar. 1.- Los valores de pH, que se obtuvieron en 40 muestras de una solucin salina son los siguientes: 7.32 7.35 7.39 7.35 7.34 7.32 7.29 7.34 7.40 7.33 7.32 7.33 7.28 7.36 7.34 7.36 7.29 7.32 7.30 7.33 7.35 7.34 7.34 7.35 7.33 7.31 7.32 7.31 7.34 7.35 7.30 7.26 7.28 7.36 7.33 7.39 7.31 7.26 7.33 7.35

a) Preparar una tabla de frecuencias agrupando en intervalos de igual amplitud.

34

ESTADISTICA DESCRIPTIVA

2.- Ejemplo para Variables Cualitativas Considere el gusto de las personas por las bebidas de Nctares de varios sabores. Dichos sabores estn en la siguiente tabla: Pia Fresa Naranja Naranja Durazno Naranja Pia Durazno Fresa Naranja Fresa Naranja Fresa Manzana Pia Manzana Durazno Durazno Pia Durazno Durazno Naranja Manzana Fresa Naranja

Categora

Tabul.

Frec

Frec. Relat. Hi 6/25 5/25 3/25 7/25 4/25

Frec. Relat. Hi 0.24 0.2 0.12 0.28 0.16

Frec. Rel %. hi% 24 20 12 28 16

Xi Durazno Fresa Manzana Naranja Pia

F Llllll lllll Lll lllll ll Llll

fi 6 5 3 7 4 N= 25

Ejercicio para practicar. 1.- Considere que la variable de estudio es el color de camisas de 25 estudiantes de la U.N.J.F.S.C; dichos colores son: Rojo Amarillo Rojo Amarillo Amarillo Azul Blanco Azul Azul Blanco Blanco Negro Celeste Blanco Celeste Azul Celeste Blanco Rojo Negro Rojo Blanco Blanco Amarillo Verde

35

ESTADISTICA DESCRIPTIVA

a) Preparar una tabla de frecuencias 3.- Al averiguar el grado de instruccin en una muestra de 120 pacientes que sufren de tuberculosis pulmonar que fueron atendidos durante el mes de Enero de 1992 en el Hospital Loayza, se obtuvieron los siguientes resultados: Analfabetos 38, primaria 63, secundaria 16, superior 3. Se pide: a) Ordenar la informacin proporcionada en un cuadro de frecuencias. b) Interpretar algunos valores de las frecuencias relativas. Solucin: a) Observamos que la variable Grado de Instruccin es una variable que por su medicin pertenece a la escala ordinal. Pro lo tanto aqu no existen intervalos numricos. Luego organizados los datos tendremos el siguiente cuadro: Grado de Instruccin Analfabeto Primaria Secundaria Superior TOTAL Nmero de Pacientes (fi) 38 63 16 03 120 Frecuencia Relativa (hi) 0.317 0.525 0.133 0.025 1.000 Frecuencia Relativa % (hi%) 31.7 52.5 13.3 02.5 100.00

36

ESTADISTICA DESCRIPTIVA

Nota: Las frmula:

frecuencias

relativas

fueron

calculadas

utilizando

la

hi

fi N

Para este caso:

hi

38 0.317 120 63 0.525 120 16 0.133 120 03 0.025 120

h2

h3

h4

El hi (%) se ha obtenido multiplicando por 100 cada frecuencia relativa simple. b) Interpretacin

h1= 31.7% : El 31.7% de los pacientes atendidos con tuberculosis pulmonar, son analfabetos. H2= 52.5%. El 52.5% de los pacientes atendidos con tuberculosis pulmonar, tienen instruccin primaria.

37

ESTADISTICA DESCRIPTIVA

1)

Un investigador social desea determinar en la comunidad X, el nmero de horas semanales que dedican los nios menores de 6 aos de edad, a ver televisin. Una muestra de 25 nios, arroj los siguientes resultados (en nmero de horas semanales). 10 16 23 15 18 Se pide: a) Ordenar la informacin en una tabla de distribucin de frecuencias. b) Interpretar algunos valores de las frecuencias halladas. Solucin: a) Para ordenar la informacin, utilizaremos la Regla de Sturges. Clculo del Rango: R = Xmax Xmin R = 27 10 = 17 Calculo del Nmero de Clases: K = 1 + 3.3 Log. N. K = 1 + 3.3 Log. 25 19 19 22 21 25 25 27 17 23 23 19 27 12 26 24 26 25 20 14 21

K = 1 + 4.62 = 5.62 Necesariamente se de redondear al entero. K =6

38

ESTADISTICA DESCRIPTIVA

Amplitud del intervalo:

R 17 2.83 K 6

W 3
Redondearemos al entero porque la informacin hora semanales est en nmeros enteros. Formacin de intervalos y frecuencias: i 1 2 3 4 5 6 Ii 10-12 13-15 16-18 19-21 22-24 25-27 fi 2 2 3 6 5 7 fi = 25 Fi 2 4 7 13 18 25 hi 0.08 0.08 0.12 0.24 0.20 0.28 hi = 1.00 Hi 0.08 0.16 0.28 0.52 0.72 1.00 hi (%) 08 08 12 24 20 28 hi = 100 Hi (%) 08 16 28 52 72 100

f6

= 7

7 de los 25 nios, ven televisin entre

25 y 27 horas/semanales, o sea, el 28% de los nios est la mayor cantidad de tiempo viendo televisin. f2= 2 : 2 nios, que equivale al 8%, ven televisin entre 10 y

12 horas/semanales.

39

ESTADISTICA DESCRIPTIVA

H4= 52%

El 52% de los nios de esa Comunidad, ve televisin

entre 10 y 21 horas/semanales. 2.2 GRAFICOS ESTADISTICOS la informacin contenida en las tablas de frecuencias resulta ms accesible y fcil de interpretar si se representan por medio de grficos estadsticos. Estos son representaciones visuales que emplean smbolos, barras, polgonos y sectores, de los datos contenidos en tablas de frecuencias. que expresan el comportamiento de una variable en estudio, as como tambin la comparacin visual del comportamiento de 2 o ms variables similares o relacionadas. Un grfico estadstico est compuesto por las siguientes partes: Numeracin de los Graficos Ttulo: Aqu se seala la poblacin en estudio y la Variable Diagrama: dado por el propio comportamiento de los datos. dibujo el cual representa el

Escalas y/0 leyendas: son indicadores donde se precisa la correspondencia entre los elementos del grfico y la naturaleza de las medidas representadas. Fuente: aqu se seala de donde se obtuvo la informacin que permiti obtener el grafico

Podemos usar el programa de Excel para hacerlos

40

ESTADISTICA DESCRIPTIVA

Entre los grficos ms utilizados podemos destacar: 2.2.1 GRAFICOS DE BARRAS Expresa el comportamiento de una variable cualitativa, se representa por un conjunto de rectngulos separados convenientemente, por un ancho apropiado y tiene como altura a su respectiva frecuencia.

GRAFICO N UNJFSC Alumnos matriculados segn Facultad Agosto 2013

Titulo

Grficos de barras simples

Adm. Educac.

CC.SS

Ingen.

Fuente: Registros Acadmicos de la UNJFSC

2.2.2 GRAFICOS DE BARRAS COMPUESTAS. Es utilizado para expresar comparacin entre 2 variables cualitativas, proviniene de una tabla de doble entrada.

41

ESTADISTICA DESCRIPTIVA

Leyenda

2.2.3 GRAFICO DE BASTONES Expresa el comportamiento de una variable cuantitativa discreta. Consiste en dibujar un rectngulo por cada uno de los valores de la variable ( x i ), de modo que las bases sean todas iguales, y la altura de cada rectngulo puede ser la frecuencia absoluta relativa

fi

o la frecuencia

hi

2.2.4 HISTOGRAMA DE FRECUENCIAS Son anlogos a los diagramas de barras o columnas pero para variables cuantitativas continuas

42

ESTADISTICA DESCRIPTIVA

Consisten en rectngulos cuyas bases son cada uno de los intervalos y la altura es la frecuencia absoluta correspondiente a dicho intervalo.

2.2.5 POLIGONO DE FRECUENCIAS Es una lnea poligonal que une los vrtices superiores de las barras de un diagrama de barras, o los puntos medios de las bases superiores de los rectngulos de un histograma.

2.2.6 OJIVAS Es la representacin grfica del polgono de las frecuencias acumuladas mediante un grfico de lnea. En ella se permite ver cuantas

43

ESTADISTICA DESCRIPTIVA

observaciones se encuentran por encima o por debajo de ciertos valores, en lugar de exhibir los nmeros asignados a cada intervalo.

105 90 75 60 45 30 15 5 10 15 20 25 30

DIAGRAMA DE SECTORES Consiste en dividir un circulo en tantos sectores como valores de la variable. La Amplitud de cada sector debe ser proporcional a la frecuencia del valor correspondiente.

PICTOGRAMAS Los pictogramas son grficos similares a los grficos de barras, pero empleando un dibujo en una determinada escala para expresar la unidad de medida de los datos. Generalmente este dibujo debe

44

ESTADISTICA DESCRIPTIVA

cortarse para representar los datos. Se usan para lograr el inters masivo del pblico.

GRAFICO DE LINEAS En este tipo de grfico se representan los valores de los datos en dos ejes cartesianos ortogonales entre s. Se pueden usar para representar una serie o ms series de tiempo.

EJERCICIOS: 1.- Las temperaturas recogidas en un determinada ciudad durante el mes de Enero se muestran en la siguiente tabla:

45

ESTADISTICA DESCRIPTIVA

Temperatura C N de das

19 7

20 9

21 6

22 4

23 3

24 2

a) Cuntos das hizo por encima de 21C? Cuntos por debajo de 23C?Cuntos das hizo la temperatura mxima? b) Hacer el grfico respectivo

SOLUCION a) Temperatura por encima de 21C fueron : das b) Temperatura por debajo de 23C fueron : 26 dias c) Grafico 4+3+2 = 9

7+9+6+4 =

10 8 6 4 2 19 20 21 22 23 24

2.- De una poblacin de estudiantes del Instituto de Educacin Superior VENCEDORES se selecciona una muestra aleatoria de 20 estudiantes y se anota sus pesos en el distrito de Huacho el 15 de Agosto del 2013 y se ha obtenido los siguientes resultados, en Kg:

46

ESTADISTICA DESCRIPTIVA

PESOS EN KG. 46-54 54-62 62-70 70-78 TOTAL

FRECUENCIAS fi 6 10 2 2 20 Fi 6 16 18 20 hi 0,3 0.5 0.1 0,1 1,0 Hi 0,3 0,8 0,9 1,0 hi% 30 50 10 10 100 Hi% 30 80 90 100

Se pide: a) b) Interpretar las siguientes frecuencias: f2,h3%,F4, H2% Hacer un histograma de frecuencias

SOLUCIN: a) Interpretacin:

f2= 10 estudiantes de la I.E Superior VENCEDORES, tienen un peso comprendido entre 54 y 62 kg h3% = el 10% de los estudiantes de la I.E Superior VENCEDORES tienen un peso comprendido entre 62 y 70 kg F4 = 20 estudiantes de la I.E Superior VENCEDORES; tienen un peso comprendido entre 46 y 78 kg H2% = 80% del total de estudiantes de la I.E Superior VENCEDORES, tienen un peso comprendido entre 46 a 61 kg

b)

Graficos fi

47

ESTADISTICA DESCRIPTIVA

10 8 6 4 2 46 54 62 70 78 Peso en Kg 3.- Construya una tabla de frecuencia del siguiente grfico, sobre las edades de 16 personas que trabajan en la empresa hotelera las Gardenias , e interprete algunas frecuencias

SOLUCIN: FRECUENCIAS EDADES 20 - 24 Fi 6 Fi 6 hi 0,375 Hi 0,375 hi% 37.5 Hi% 37.5

48

ESTADISTICA DESCRIPTIVA

24 - 28 28 - 32 32 - 36 TOTAL

5 3 2 16

11 14 16

0.3125 0.1875 0,125 1,0

0,6875 0,875 1,0

31.25 18.75 12.5 100

68.75 87.5 100

f1= 6 personas que trabajan en la Empresa Hotelera Las Gardenias tiene edades comprendidas entre 20 a 24 aos H3%= el 87.5% del total de personas que trabajan en la Empresa Hotelera Las Gardenias tienen edades comprendidas entre 20 y 32 aos. 4.- Del siguiente grafico realizar: Nmero de artculos producidos en la Empresa QUIMPAC (en miles)

6 5 4 3 2

a) Construya una Tabla de Frecuencias b) Hacer un grfico de barras completo y un grfico circular

Lu

Ma

Mi

Ju

Vi

Da s

Cuadro N .. Empresa QUIMPAC N de artculos producidos Agosto 2013

49

ESTADISTICA DESCRIPTIVA

Das de la semana

FRECUENCIAS

ni
Lunes Martes Mircoles Jueves Viernes TOTAL 3 5 4 2 6 20

Ni
3 8 12 14 20

hi
0,15 0.25 0.20 0.10 0.30

Hi
0.15 0.40 0.60 0.70 1.00

hi %
15 25 20 10 30

Hi %
15 40 60 70 100

FUENTE: Almacn de la Empresa QUIMPAC

GRAFICO N..

50

ESTADISTICA DESCRIPTIVA

5.- En una caja hay 10 bolitas marcadas con los nmeros del 1 al 4 En la siguiente tabla se muestra la distribucin de frecuencias de cada uno de los nmeros. Realizar su grafico iv

Cmo se resuelve?

51

ESTADISTICA DESCRIPTIVA

SOLUCIN: Bolitas numeradas FRECUENCIAS

ni
1 2 3 4 TOTAL 3 1 1 5 10

Ni
3 4 5 10

hi
0,30 0.10 0.10 0.50

Hi
0.30 0.40 0.50 1.00

hi %
30 10 10 50

Hi %
30 40 50 100

6.- Supongamos que la distribucin de las edades de 80 alumnos de la Facultad de Ciencias de la U.N.J.F.S.C. es dado por:

[ 5 - 18> [18 - 21> [21 - 24> [24 - 27> [27 - 30] TOTAL

Ii

fi

Fi

hi
0,5875

Hi
0,925

0,0375 80 ---1

52

ESTADISTICA DESCRIPTIVA

Se pide: a) Completar la tabla de frecuencias b) Interpretar las siguientes frecuencias: f2, F4, h2%, H4%. c) Hallar el nmero de alumnos que presenten edades comprendidas entre 18 y 26 aos SOLUCIN: a) Completamos la Tabla:

[ 5 - 18> [18 - 21> [21 - 24> [24 - 27> [27 - 30] TOTAL b) Interpretacin:

Ii

fi

Fi

0,0625 0,5875 0,275 0,0375 0,0375 1

hi

0,0625 0,650 0,925 0,9625 1

Hi

47 22 3 3 80

52 74 77 80 ----

f2= 47 Alumnos de la Facultas de Ciencias de la U.N.J.F.S.C, tienen edades comprendidas entre 18 y 21aos F4= 77 Alumnos de la Facultad de Ciencias de la U.N.J.F.S.C presentan edades comprendidas entre 5 a 27 aos de edad h2% = el 58.75% de los alumnos de la Facultad de Ciencias de la U.N.J.F.S.C; tienen edades comprendidas entre 18 a 21 aos H4% = el 96.250% del total de los alumnos de la Facultad de Ciencias de la U.N.J.F.S.C, tienen edades comprendidas entre 5 a 27 aos de edad. c) El nmero de alumnos que presentan edades comprendidas entre 18 y 26 aos es : 47 + 22 + 3 = 72 alumnos.

7.- La figura muestra el consumo de gas de una familia en todos los meses del ao pasado. De acuerdo al grfico responde lo siguiente:

53

ESTADISTICA DESCRIPTIVA

I) la mayor variacin mensual en el consumo, se produjo cuales meses? II) en mayo no hubo consumo? III) el mayor consumo se produjo en?

SOLUCIN: I.- La mayor variacin mensual en el consumo se produjo durante los meses de FEBRERO A MARZO. II.- En MAYO, si hubo un consumo y fue constante desde ABRIL A JUNIO III.- El mayor consumo se produjo durante JULIO A AGOSTO

EJERCICIOS PROPUESTOS 1.- Las calificaciones obtenidas por los 32 alumnos de una clase de 3 de ESO en una prueba de Matemticas vienen dadas por la siguiente tabla: Nota Alumnos 4 1 6 2 8 4 10 5 12 4 14 6 16 5 18 4 20 1

a) b) c) d) e)

Elabora la tabla de frecuencias completa. Qu porcentaje de alumnos aprueba la materia? Qu porcentaje obtiene ms de 8 puntos? Dibuja un diagrama de frecuencias relativas. Dibuja un polgono de frecuencia acumuladas.

54

ESTADISTICA DESCRIPTIVA

2.- El grfico circular de la figura muestra las preferencias de 30 alumnos en actividades deportivas. Cul(es) de las siguientes afirmaciones es (son) correcta(s) ? La frecuencia relativa del grupo de ftbol es de 40%. La frecuencia relativa del grupo de bsquetbol es de 30%. La mitad del grupo no prefiri ftbol ni tenis.

Construye la tabla de frecuencias correspondiente

3.- La distribucin del gasto en alimentacin de una familia viene dada por los siguientes porcentajes: carne, 26 %; pescado, 14 %; pastas y cereales, 14 %; patatas y hortalizas, 8 %; frutas, 9 %, y otros 29 %. Construye un diagrama de sectores. 4.- Los valores de pH, que se obtuvieron en 40 muestras de una solucin salina son los siguientes: 7.32 7.35 7.39 7.35 7.34 7.32 7.29 7.34 7.40 7.33 7.32 7.33 7.28 7.36 7.34 7.36 7.29 7.32 7.30 7.33 7.35 7.34 7.34 7.35 7.33 7.31 7.32 7.31 7.34 7.35 7.30 7.26 7.28 7.36 7.33 7.39 7.31 7.26 7.33 7.35

a) Preparar una tabla de frecuencias agrupando en intervalos de igual amplitud. b) Construir todos los grficos necesarios para el caso.

5.- Los resultados de un test de inteligencia hecho a 30 personas se han registrado en la siguiente tabla de frecuencias por intervalos. Construye un histograma con las frecuencias porcentuales de los datos propuestos:

55

ESTADISTICA DESCRIPTIVA

Li - Ls 64 74 84 94 73 83 93

Xi

fi 4 5 6 6 5 4 N=

Fi

hi

Hi

hi%

Hi%

- 103

104 - 113 114 - 123

6.- A partir de la siguiente grfica estadstica de gustos deportivos:

6 5 4 3 2 1 0 atletismo ciclismo baloncesto natacin

a) Calcular la tabla de frecuencias. b) A qu porcentaje de las personas no le gusta el ciclismo? 7.- Los datos siguientes representan la temperatura del fluido de descarga de una planta para el tratamiento de aguas negras durante varios das consecutivos. 43 44 47 49 51 46 48 51 52 49 50 45 46 44 49 50 45 48 52 50 46 49 51 50 55 51

a) Calcular la distribucin de frecuencias de los datos. b) Hacer los grficos correspondientes

56

ESTADISTICA DESCRIPTIVA

8.- Dadas las siguientes notas de Estadstica correspondientes a 30 alumnos: 10 9 15 13 7 13 12 8 2 10 14 12 15 13 19 16 10 8 14 14 12 13 9 20 12 10 14 9 11 15

a) Calcula la distribucin de frecuencias, determina el porcentaje de suspendidos y el porcentaje de alumnos con nota entre 10 y 15 ambos inclusive. b) Qu nota mnima hay que sacar para superar al 90% de los alumnos? 9.- Consideremos una muestra de 200 familias en las que contamos el nmero de hijos. Supongamos que se han observado 50 familias sin hijos, 80 familias con 1 hijo, 40 familias con 2 hijos, 20 familias con 3 hijos y 10 familias con 4 hijos. Construir una distribucion de frecuencias, asi como tambin sus Graficos. 10.- Con la finalidad de conocer el comportamiento de algunas variables qumicas del suelo y las correspondientes del sedimento provocado por el proceso de erosin hdrica, se analizaron las prdidas de suelo por escurrimiento de 20 muestras de suelo. Los valores de prdida de agua (cm ) de cada muestra son: 52; 53; 55; 47; 29; 32; 51; 23, 24; 28; 24; 65; 64; 56; 29; 31; 34, 35 22; 21;
3

11.-Construir una distribucion de frecuencias, asi como tambin sus Graficos. Las calificaciones obtenidas por 90 alumnos del Curso de Estadstica Aplicada a la Ingeniera han sido las siguientes:

3 1 4

4 0 2

6 3 4

8 3 4

7 1 2

5 6 7

3 0 1

2 2 1

5 3 4

9 9 8

7 2 7

2 6 0

9 1 3

7 6 3

8 5 8

10 10 2

8 5 4

4 8 6

57

ESTADISTICA DESCRIPTIVA

1 7

3 6

6 5

5 3

1 4

4 2

2 6

4 3

5 2

5 5

7 9

5 4

8 3

6 0

2 1

1 2

4 4

2 1

a) Se pide construir la tabla de frecuencias b) Representar el histograma de frecuencias relativas y el diagrama de sectores

MEDIDAS DE RESUMEN

58

ESTADISTICA DESCRIPTIVA

Hasta el momento se ha estudiado los cuadros y grficos como formas para ordenar, describir y reducir un conjunto de datos, sin embargo el anlisis es aun incompleto, por lo que se hace necesario que los datos de la tabla se resuman an mas, para facilitar el anlisis e interpretacin de la informacin, utilizando ciertos indicadores llamados MEDIDAS DE RESUMEN O ESTADIGRAFOS, el cual permite hallar un solo valor numrico, el mismo que representa a toda la poblacin. Estas medidas o estadgrafos importantes son: De Tendencia Central ( media aritmtica, armnica, geomtrica, mediana, moda, etc) De Posicin los deciles, cuartiles y percentiles De dispersin Rango, desviacin media, tpica ,etc

CAPITULO 3 3.1 DESARROLLO DE LOS DISTINTOS APARTADOS 3.1 MEDIDAS DE TENDENCIA CENTRAL Estadgrafos que resumen la informacin en un solo valor numrico e indican el centro de un conjunto de datos. - Distribucin por datos no agrupados es cuando se especifican todos y cada uno de los valores de la variable.

59

ESTADISTICA DESCRIPTIVA

- Distribucin por datos agrupados los valores de la variable se miden en intervalos. 3.1.1 MEDIA ARITMETICA Es el valor resultante que se obtiene al dividir la sumatoria de un conjunto de datos sobre el n total de datos. Solo es aplicable para el tratamiento de datos cuantitativos Media aritmtica para datos no agrupados

Media aritmtica para datos agrupados Para poder calcular la media, se supondr que dentro de cada categora, las observaciones se distribuyen uniformemente dentro alrededor del punto medio de la clase,

Ejemplo de Media Aritmtica de datos No Agrupados 1.- Supngase que se determin que a 22C una pipeta de 5,00 ml, despus de pesar por 6 ocasiones, su volumen vertido, gener los siguientes pesos aparentes de agua en gramos: 4,996 4,993 4,994 4,997 4,998 4,992

60

ESTADISTICA DESCRIPTIVA

Ejemplo de Media Aritmtica de datos Agrupados 2.- La distribucin siguiente corresponde a las lecturas con un contador Geiger del nmero de partculas emitidas por una sustancia radiactiva en 100 intervalos sucesivos de 40 segundos. N partculas 5 - 10 10 - 15 15 - 20 20 - 25 25 - 30 30 - 35 35 - 40 Determinar la Media Aritmtica SOLUCIN: N partculas 5 - 10 10 - 15 15 - 20 20 - 25 25 - 30 30 - 35 35 - 40 Xi 7.5 12.5 17.5 22.5 27.5 32.5 37.5 fi 1 10 37 36 13 2 1 100 Xifi 7.5 125 647.5 810 357.5 65 37.5 2050 La media aritmtica es: Fi 1 10 37 36 13 2 1 N=

Interpretacin: El nmero promedio de partculas es 20.5

3.1.2 MEDIANA. Es el estadgrafo que representa el punto medio de los datos, en el cual cae el 50% de las observaciones, es decir que separa a la serie de datos ordenados (en forma creciente o decreciente), en 2 partes de igual nmero de datos. Mediana para datos no agrupados: se debe ordenar los datos, y tener en cuenta si la cantidad de datos son pares o impares. Ejemplo:

61

ESTADISTICA DESCRIPTIVA

Supngase que se determin que a 22C una pipeta de 5,00 ml, despus de pesar por 6 ocasiones, su volumen vertido, gener los siguientes pesos aparentes de agua en gramos: Calcular la Mediana: Si fuera impar 4,992 4,993 4,994 4,996 4,997

Me= 4.994

Ahora si fuera par 4,992 4,993 4,994 4,996 4,997 4,998

Me = X3 + X4 = 2

4.994 + 4.996 = 4.995 2

Mediana para datos agrupados Del ejemplo anterior sobre la distribucin correspondiente a las lecturas con un contador Geiger del nmero de partculas emitidas por una sustancia radiactiva en 100 intervalos sucesivos de 40 segundos. Se pide determinar la mediana.

K 1 2 3 4 5 6 7

N partculas 5 10 15 20 25 30 35 -

Fi 1 10 37 36 13 2 1 100

Fi 1 11 48 84 97 99 100

10 15 20 25 30 35 40 N=

62

ESTADISTICA DESCRIPTIVA

3.1.3 MODO O MODA Es un estadgrafo que nos indica el valor o cualidad que se presenta con Mayor frecuencia dentro de una variable. Se halla de acuerdo a: Moda para datos no agrupados.Supngase que se determin que a 22C una pipeta de 5,00 ml, despus de pesar por 6 ocasiones, su volumen vertido, gener los siguientes pesos aparentes de agua en gramos: 4,992 4,993 4,994 4,994 4,997 4,998

Calcular la moda. SOLUCION: Mo = 4,994 ( valor que es ms frecuente)

Moda para datos agrupados Del ejercicio anterior para datos agrupados tenemos: K 1 2 3 4 5 6 7 N partculas 5 10 15 20 25 30 35 10 15 20 25 30 35 40 Fi 1 10 37 36 13 2 1 Fi 1 11 48 84 97 99 100

63

ESTADISTICA DESCRIPTIVA

La moda se halla mediante las siguientes frmulas:

3.1.4 MEDIA GEOMETRICA Es un estadstico que permite promediar proporciones, ndices y tasas de crecimiento, que varan con el tiempo. Se obtiene de acuerdo a: Media Geomtrica para datos no agrupados Es la raz de ndice n del producto continuado de los n datos, es decir:

Xn = Valor de los datos n = nmero de datos. EJEMPLO Supngase que se determin que a 22C una pipeta de 5,00 ml, despus de pesar por 5 ocasiones, su volumen vertido, gener los siguientes pesos aparentes de agua en gramos 4,992 SOLUCIN 4,993 4,994 4,996 4,997

Media Geomtrica para datos agrupados: Ejemplo

64

ESTADISTICA DESCRIPTIVA

La distribucin siguiente corresponde a las lecturas con un contador Geiger del nmero de partculas emitidas por una sustancia radiactiva en 100 intervalos sucesivos de 40 segundos: SOLUCIN

K 1 2 3 4 5 6 7

N partculas 5 10 15 20 25 30 35 10 15 20 25 30 35 40

Xi 7.5 12.5 17.5 22.5 27.5 32.5 37.5

fi 1 10 37 36 13 2 1 n= 100

log Xi 0.875 1.097 1.243 1.352 1.439 1.512 1.574

fi*logXi 0.875 10.97 45.991 48.672 18.707 3.024 1.574 129.813

3.1.5 MEDIA ARMONICA Media armnica para datos no agrupados: La media armnica se denominada H, de una cantidad finita de nmeros es igual al recproco, o inverso, de la media aritmtica de los recprocos de dichos nmeros. As, dados los nmeros a1,a2, .an, la media armnica ser igual a:

Ejemplo:

65

ESTADISTICA DESCRIPTIVA

Supngase que se determin que a 22C una pipeta de 5,00 ml, despus de pesar por 5 ocasiones, su volumen vertido, gener los siguientes pesos aparentes de agua en gramos 4,992 4,993 4,994 4,996 4,997

Media armnica para datos agrupados:

Se aplica para obtener promedios de un conjunto expresados en forma de tasas de unidades de otro tipo.

de

valores

Ejemplo: La distribucin siguiente corresponde a las lecturas con un contador Geiger del nmero de partculas emitidas por una sustancia radiactiva en 100 intervalos sucesivos de 40 segundos K 1 2 3 4 5 6 7 N partculas 5 10 15 20 25 30 35 10 15 20 25 30 35 40 Xi 7.5 12.5 17.5 22.5 27.5 32.5 37.5 Fi 1 10 37 36 13 2 1 log Xi fi*logXi

66

ESTADISTICA DESCRIPTIVA

N= 100 2.- en el diario el Peruano , el 18 de Agosto del 2013 , se public una tabla estadstica que hacia referencia a los sueldos mnimos de los peruanos en el 2012 y es como se detalla a continuacin: Nivel de los Salarios: Ao Anual, BRUTO ANUAL. Remuneracin En soles
6600 8600 10600 12600 14600 16600 18600 20600 8600 10600 12600 14600 16600 18600 20600 22600

N de Trabajad en %
12.9 37.5 25.7 11.4 5.4 2.8 2.5 0.9

Fuente: INEI - el Peruano

a) Qu variables es la que se est presentando en la tabla? b) Qu tipo de variable es? c) Construya la tabla de frecuencia, teniendo en cuenta que en el 2012, haba 7,6 millones de personas trabajando. d) calcule las marcas de clase e) Represente el cuadro en un histograma de frecuencias. f) Qu nmero de trabajadores tiene una Remuneracin superior a 16600.
g) Calcule la media mediana y la moda aritmtica, la

SOLUCION.Remuneracin en Soles 6,600 8600 10600 12600 14600 16600 8600 Xi N Trabaj (fi) 980400 2850000 1953200 866400 410400 212800 Fi hi %hi Xihi

7600 9600 11600 13600 15600 17600

980400 3830400 0.257 0.114 0.054 0.028

0.129 0.375 0.257 0.114 0.054 0.028

12.9 37.5 25.7 11.4 5.4 2.8

980.4 3600 2981.2 1550.4 842.4 492.8

- 10600 - 12600 - 14600 - 16600 - 18600

67

ESTADISTICA DESCRIPTIVA

18600 20600

- 20600 - 22600

19600 21600

190000 68400 n=7600,000

0.025 0.009

0.025 0.009

2.5 0.9

490 194.4

a) b) c) d)

La variable que se esta presentando es : LOS SUELDOS Es un tipo de Variable Cuantitativo Construccin de la Tabla de frecuencias: Marcas de clase ( Xi) : estn representadas en la tabla. Clculos de las frecuencias absolutas simples
hi= fi/n fi=hi*n

f1= 12.9*7600,000 = 98,040 f2= 37.5*7600,000 = 2850000 f3= 25.7*7600,000 = 1953200 f4= 11.4*7600,000 = 866400 f5= 5.4 *7600,000 = 410400 f6= 2.8 *7600,000 = 212800 f7= 2.5 *7600,000 = 190000 f8= 0.9 *7600,000 = 68400

e)

Grfico de histograma de frecuencias

68

ESTADISTICA DESCRIPTIVA

f) El nmero de trabajadores que tiene una remuneracin superior a 16600 es: 68400 +212800 + 190000 = 471200 g) La media aritmtica ser: X= Xihi = 11131.6

3.2 MEDIDAS DE POSICIN Se define como la posicin x.. a un valor de la variable por debajo del cual se encuentra una frecuencia acumulada

69

ESTADISTICA DESCRIPTIVA

Estadgrafos que dividen un conjunto de datos ordenados en grupos con el mismo nmero de observaciones, etc Para calcular las medidas de posicin es necesario que los datos estn ordenados de menor a mayor. Casos particulares son los percentiles, cuartiles, deciles 3.2.1. CUARTILES son los 3 valores que dividen a un conjunto de datos ordenados en 4 partes iguales. Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos. Q2 coincide con la mediana. Ordenamos los datos de menor a mayor. Buscamos el lugar que ocupa cada cuartil, mediante la expresin:

Donde i = 1 , 2 , 3 Determinar los cuartiles para el n de hijos de los trabajadores de la Empresa Alicorp, cuyos datos son: 3; 5; 3; 6; 7; 9; 4 3, 3, 4, 5,6, 7, 9 Nmero impar

Q1

Q2

Q3
Numero par

1, 2 , 3, 4 , 5, 6 , 7, 9 2.5 Q1 4.5 Q2 6.5 Q3

Calculo de los CUARTILES para datos agrupados En primer lugar buscamos la clase donde se encuentra

70

ESTADISTICA DESCRIPTIVA

i = 1, 2, 3 Segn se trate de hallar el primer, segundo o tercer cuartil 3.2.2 DECILES. son los 9 valores que dividen la serie de datos en diez partes iguales. Los deciles dan los valores correspondientes al 10, 20, 30 ,,,,,,90% de las observaciones. D5 coincide con la mediana. Determinar los deciles para el n de hijos de los trabajadores de la Empresa Alicorp, cuyos datos son: 2; 5; 3; 6; 7;4; 9

3, X1

3, 4, 5, X2 X3 X4

6, 7, X5 X6

9 X7

Nmero impar

2, 3, 4, 4, X1 X2 X3 X4

6, 7, 8, 9 X5 X6 X7 X8

Numero par

Calculo de los DECILES para datos agrupados : Se busca la clase:

i =1,2,3,..9

71

ESTADISTICA DESCRIPTIVA

i = 1,2,3,9 Segn se trate de hallar el primer, segundo o noveno decil 3.2.3 PERCENTILES. son los 99 valores que dividen la serie de datos en 100 partes iguales. dan los valores correspondientes al 1,2,3,4,..y al 99% de las observaciones. P50 coincide con la mediana

2,

3,

4,

4,

6,

7,

8,

9 Numero par

X1 X2 X3 X4

X5 X6 X7 X8

Calculo de PERCENTILES para datos agrupados

Se busca la clase

i =1,2,3,4..99

i = 1,2,3,99
Segn se trate de hallar el primer, segundo o noventainueveavo percentil

EJERCICIO RESUELTO Dada la siguiente distribucin estadstica Li - Ls 0 - 5 3 5 - 10 5 10 15 decil 7 15 20 8 20 - 25 2 25 - 30 6

72

ESTADISTICA DESCRIPTIVA

Calcular: La media y la moda Cuartil 1 y cuartil 3 SOLUCIN K 1 2 3 4 5 6 N partculas 0 5 10 15 20 25 5 10 15 20 25 30 Xi Fi Fi 3 8 15 23 25 31

2.5 3 7.5 5 12.5 7 17.5 8 22.5 2 27.5 6 n=31

La moda es:

La mediana es:

Los cuartiles sern:

3.3 MEDIDAS DE DISPERSION Este tipo de medida muestra la variabilidad de una distribucin de observaciones. Las medidas de tendencia central tienen como objetivo el resumir o sintetizar los datos con un solo valor representativo, mientras que las

73

ESTADISTICA DESCRIPTIVA

medidas de dispersin nos dicen o nos dan una idea hasta que punto las medidas centrales son representativas como sntesis de la informacin. Las medidas de dispersin, cuantifican la separacin, indicando el mayor o menor alejamiento de los valores de la distribucin respecto al valor central, es decir si estos valores se encuentran + o concentrados o + o - dispersos. A mayor dispersin menor representatividad. 3.3.1 RANGO: a) para datos no agrupados Es la amplitud de los valores de la muestra, es decir la diferencia entre el valor mayor yel menor de la variable. R = Xmax - Xmin Ejemplo : contenido de residuos slidos en ppm, analizados en una muestra: 2.8 , 2.9 , 3.0 , 3.0 , 3.3 R = 3.3 2-8 = 0.5

b) para datos agrupados es la diferencia entre el limite superior de la ultima clase y el limite inferior de la 1era clase, es decir: R = Lsup L
inf

Ejemplo: a continuacin se presentan las notas de estadstica de los alumnos de la escuela de ingeniera:

74

ESTADISTICA DESCRIPTIVA

Notas 0 4 8 4 8

fi 5 10 20 10 5 n= 50

Fi 5 15 35 45 50

R = 20 0 = 20 nota: el rango es un estadgrafo de clculo fcil, pero de uso limitado ya que no considera a todas las observaciones, si no solo a los datos mnimos y mximos. Por lo tanto, esta fuertemente influenciado por los datos extremos.

12

12 16 16 - 20

3.3.2 RECORRIDO SEMI INTERCUARTLICO Para datos no agrupados Es la diferencia entre el tercer cuartil y el primer cuartil. RI = Q3 Q1 Notas 0 4 8 4 8 Xi 2 6 10 14 18 n= 50 3.3.3 DESVIACION MEDIA ( DM) a).- Para datos no agrupados Es un promedio de la suma de las desviaciones en valor absoluto de cada observacin con respecto a la media aritmtica. Se expresan de la siguiente manera: Calcular la DM del contenido de residuos slidos en ppm analizados en una muestra: 2.8 , 2.9 , 3.0 , 3.0 , 3.3 fi 5 10 20 10 5 Fi 5 15 35 45 50 RI = 13 7 = 6

12

12 16 16 - 20

75

ESTADISTICA DESCRIPTIVA

b).- Para datos Agrupados Es el promedio de la suma de las desviaciones en valor absoluto de la diferencia entre cada valor de la variable (marca de clase) y la media aritmtica multiplicado por su frecuencia respectiva y dividido por el nmero de datos.

Notas 0 4 8 4 8

Xi 2 6 10 14 18

Fi 5 10 20 10 5 n= 50

Fi 5 15 35 45 50

Xifi 10 60 200 140 90

|Xi-X| 8 4 0 4 8

|Xi-X|fi 40 40 0 40 40

12

12 16 16 - 20

3.3.4 VARIANZA Es el promedio de la suma de los cuadrados de las desviaciones de la variable respecto a la media aritmtica.

a) Para datos no agrupados

76

ESTADISTICA DESCRIPTIVA

Siempre es positiva (por estar al cuadrado). Como la varianza es siempre positiva, a mayor varianza mayor ser la dispersin Calcular la

S2

del contenido de residuos slidos en ppm analizados en

una muestra:

2.8 , 2.9 , 3.0 , 3.0 , 3.3

b) Para datos agrupados. Se calcula como la sumatoria de los cuadrados de las desviaciones de la variable respecto a su media aritmtica multiplicada por su frecuencia respectiva. Notas 0 4 8 4 8 Xi 2 6 10 14 18 fi 5 10 20 10 5 n= 50 Fi 5 15 35 45 50 Xifi 10 60 200 140 90
2 2

(Xi-X) 64 16 0 16 64

(Xi-X) fi 320 160 0 160 320 960

12

12 16 16 - 20

3.3.5 DESVIACION ESTANDAR O TIPICA La deviacin tpica es la raz cuadrada de la varianza.

77

ESTADISTICA DESCRIPTIVA

a) Para datos no agrupados

Calcular la

del contenido de residuos slidos en ppm analizados en

una muestra: 2.8 , 2.9 , 3.0 , 3.0 , 3.3

b) Para datos agrupados. Es la raz cuadrada del promedio de la suma de las desviaciones de cada marca de clase de la variable con respecto a su media aritmtica multiplicada por su frecuencia respectiva.

3.3.6 COEFICIENTE DE VARIABILIDAD Es el cociente de la desviacin estndar y la media aritmtica, expresado en porcentaje, es decir:

Nota: el coeficiente de variabilidad, es un indicador de la dispersin relativa de los datos, y la unidad de medida esta expresada en porcentaje. Es muy til cuando se compara dos o mas distribuciones. Las unidades de medida pueden ser pesos en Kg o en edad en aos, etc.

78

ESTADISTICA DESCRIPTIVA

Para datos no agrupados Calcular el CV del contenido de residuos slidos en ppm analizados en una muestra: 2.8 , 2.9 , 3.0 , 3.0 , 3.3 Siendo la media = 3 y la desviacin = 0.19 Luego el coeficiente de variabilidad ser:

Para datos agrupados Notas 0 4 8 4 8 Xi 2 6 10 14 18 fi 5 10 20 10 5 n= 50 Fi 5 15 35 45 50 Xifi 10 60 200 140 90


2 2

(Xi-X) 64 16 0 16 64

(Xi-X) fi 320 160 0 160 320 960

12

12 16 16 - 20

4.- Los salarios por hora de los obreros de dos empresas A y B, son los que se dan en la siguiente tabla:
Salarios Emp. A Emp. B

Determinar: (a) El salario medio de cada una de las empresas 79 (b) El salario ms frecuente de cada una de las empresas

ESTADISTICA DESCRIPTIVA [550,750) [750,1050) [1050,1550) [1550,2550) 10 32 57 54 7 20 37 78

SOLUCIN Salarios Xi Empresa A (fi) 10 32 57 54 n = 153 a) El salario medio de la Empresa A es: Xifi (Xi X)2fi

[550,750) [750,1050) [1050,1550) [1550,2550)

650 900 1300 2050

6500 28800 74100 110700 220100

6218269 9281500 1094336 20188379 36782484

b) El salario ms frecuente de la Empresa A es:

c) Coeficiente de variacin

80

ESTADISTICA DESCRIPTIVA

Salarios

Xi

Empresa A (fi) 7 20 37 78 n= 142

Xifi

(Xi X)2fi

[550,750) [750,1050) [1050,1550) [1550,2550)

650 900 1300 2050

4550 18000 48100 159900 230550

7050350 11357958 4625958 12256989 35291255

a) El salario medio de la empresa B es:

b) El salario mas frecuente de la empresa B es:

c) Coeficiente de variacin

La Empresa B tiene mayor homogeneidad salarial. EJERCICIOS DE APRENDIZAJE

81

ESTADISTICA DESCRIPTIVA

Para los ejercicios propuestos determinar: La media, mediana, moda, media geomtrica y media armnica. 1.- a continuacin se da 25 mediciones del punto ebullicin de un compuesto de silicio ( en grados Celsius ) 166 141 136 153 170 162 155 146 183 157 148 132 160 150 145 134 145 147 148 158 164 165 168 170 172 SOLUCION Calculo del Rango

Calculo del Nmero de Intervalos

Calculo de la Amplitud

1 2 3 4 5 6

132 - 139 139 - 146 146 153 153 - 160 160 - 167 167 - 173

136.5 145.5 154.5 163.5 172.5 181.5

3 3 6 4 5 4

3 6 12 16 21 25

0.12 0.12 0.24 0.16 0.20 0.16

0.12 0.24 0.48 0.64 0.84 1

0.021 0.021 0.039 0.025 0.029 0.022

2.135 2.162 2.188 2.213 2.236 2.258

6.405 6.486 13.128 8.852 11.18 9.032

409.5 436.5 927 654 862.5 726

0.157

55.

Media aritmtica :

82

ESTADISTICA DESCRIPTIVA

Mediana

Moda

MEDIDAS DE FORMA ASIMETRIA

83

ESTADISTICA DESCRIPTIVA

Se refiere a si la curva que forman los valores de la serie presenta la misma forma a la izquierda y derecha de un valor central ( promedio aritmtico) Miden el grado de deformacin horizontal de la distribucin de frecuencias y se definen como:

COEFICIENTE DE ASIMETRIA Para medir el nivel de asimetra utilizamos el COEFICIENTE DE ASIMETRIA, que viene dado por:

Coeficiente de Asimetra De Pearson

Coeficiente de Asimetra De Fisher


los resultados obtenidos pueden ser los siguientes: As = 0 la distribucin es simtrica; existe la misma concentracin de valores a la derecha y a la izquierda de la media As > 0 la distribucin es asimtrica positiva; existe mayor concentracin de valores a la derecha de la media que a su derecha. As < 0 la distribucin es asimtrica negativa; existe mayor concentracin de valores a la izquierda de la media que a su derecha. COEFICIENTE DE KURTOSIS (k)

84

ESTADISTICA DESCRIPTIVA

Mide el grado de deformacin vertical que presentan los valores de la distribucin de frecuencias alrededor de la zona central de la distribucin y se define como:

Los resultados del coeficiente de Curtosis se interpretan:

k = 0; la distribucin es Mesocrtica: Al igual que en la asimetra es bastante difcil encontrar un coeficiente de Curtosis de cero (0), por lo que se suelen aceptar los valores cercanos ( 0.5 aprox.). k > 0; la distribucin es Leptocrtica k < 0; la distribucin es Platicrtica Cuando la distribucin de los datos cuenta con : un coeficiente de asimetra (As = 0.5) y un coeficiente de Curtosis de (k = 0.5),Se le denomina Curva Normal. Este criterio es de suma importancia ya que para la mayora de los procedimientos de la estadstica de inferencia se requiere que los datos se distribuyan normalmente

Ejemplo 1.- Se ha aplicado un test a los empleados de la Empresa Los Sauces obtenindose la siguiente tabla: Li- Ls 38-44 44-50 50-56 56-62 62-68 68-74 74-80

85

ESTADISTICA DESCRIPTIVA

Fi

15

25

18

Dibujar la Ojiva de frecuencias acumuladas, asi como la asimetra y Curtosis SOLUCIN Li Ls 38-44 44-50 50-56 56-62 62-68 68-74 74-80 Xi 41 47 53 59 65 71 77 Fi 7 8 15 25 18 9 6 Xifi 287 376 795 1475 1170 639 462

(X-X)2fi
2302.5 1178.3 564.8 0.5 618.9 1266.7 1914.7

(X-X)3fi
-41758.9 -14300.6 -3466.0 -0.1 3628.9 15027.8 34202.7 -6666.10

(X-X)4fi
757354.0 173557.9 21268.4 0.00864 21278.5 178284.6 610985.3 1762728.6

88

5204

7846.4

As=-0.09 k= -0.54

ACTIVIDAD DE APRENDIZAJE N 04 1.- Los siguientes datos representan una muestra de 8 instituciones educativas de la UGEL. Z, segn su nmero de trabajadores (entre docentes, administrativos y personal de servicio). 30; 72; 40; 35; 26;

86

ESTADISTICA DESCRIPTIVA

50; 64 y 18 se pide: Calcular e interpretar media aritmtica, mediana y moda. N=8 (muestra) Datos del # de trabajadores: 30, 72, 40, 35, 26, 50, 64,18. Media Aritmtica:

Mediana (ordenar) 18, 26, 30 ,35 ,40 ,50 ,64 ,72 Me= 35+40 Moda: (Amodal) no hay moda 2.- En un supermercado trabajan 35 mujeres con un salario promedio de S/500.00 y 15 hombres que en promedio ganan un 30% ms que las mujeres Cul es el salario promedio de los empleados de dicho supermercado? Solucion: M=35 mujeres H= 15 hombres Me=37.5 =38 trabaj

87

ESTADISTICA DESCRIPTIVA

3.- Teniendo en cuenta las tablas de distribucin de frecuencias 1 y 2 de esta gua, calcular e interpretar media aritmtica, mediana y moda. Adems para cada caso, presentar e interpretar la relacin entre las medidas calculadas, utilizando la curva de Gauss. TABLA N 01 N Asignaturas Desaprobados Xi 0 1 2 3 4 Total N Estudiantes fi 4 8 7 5 6 N=30 4 12 19 24 30 0 8 14 15 24 61

Fi

Xi fi

(+) Mo<Me =X ( curva asimtrica positiva)

Media Aritmtica

88

ESTADISTICA DESCRIPTIVA

Interpretacin: El promedio por asignaturas desaprobadas por los estudiantes es de 2. Mediana

Me= 2 asignaturas Interpretacin: El 50 % de los estudiantes de la institucin educativa X tiene como mximo 2 asignaturas desaprobadas, muestra que el otro 50% supera dichas asignaturas desaprobadas. Moda Mo (mayor frecuencia) Mo = 1 asignatura. Interpretacin: Las asignaturas desaprobadas por los estudiantes mas frecuentes es de 1.

TABLA N 02 Peso en Kg N

89

ESTADISTICA DESCRIPTIVA

estudiantes fi [40-48> [48-56> [56-64> [64-72> [72-80> [80-88> [88-96] 6 10 16 11 5 4 1 N=53

Fi

Xi

Xifi

6 16 32 43 48 52 53

44 52 60 68 76 84 92

264 520 960 748 380 336 92 3300

(+)

Mo<Me<X (curva asimtrica positiva derecha) Media Aritmtica

Mediana

90

ESTADISTICA DESCRIPTIVA

Moda

4.- Como gerente de ventas de IBM, usted desea calcular las medidas de tendencia central para los niveles de utilidad de dicha firma durante los ltimos nueve meses, ya que las siguientes utilidades estn dadas en miles de dlares. Xi: 21.6; 22.3; -3.4; 21.6; 18.9; -12.8; 23.1; 22.3. Se pide: Calcular la media, mediana y moda e interpretar. Media: X= 21.6 + 22.3 + (-3.4) + 21.6 + 18.9 + (-12.8) + 23.1 + 22.3 9 X= 14.6 dlares. Interpretacin: El promedio de las utilidades durante los 9 meses es de 14.6 dlares. Mediana

91

ESTADISTICA DESCRIPTIVA

(ordenar) -12.8 ; -3.4 ; 17.9; 18.9; 21.6; 21.6; 22.3; 22.3; 23.1 (impar) Me=21.6 dlares Interpretacin: El 50% de las utilidades es como mximo 21.6 dlares, el otro 50% supera dichas cantidad. Moda: es Bimodal (2 moda) Mo=21.6 ; Mo=22.3

92

ESTADISTICA DESCRIPTIVA

ACTIVIDAD DE APRENDIZAJE N 05 1.- Los datos siguientes representan una muestra de 7 docentes de la institucin Educativa X, segn sus aos de servicios: 10; 4; 6; 12; 8 ; 15 y 5

Se pide calcular e interpretar cuarteles de 1 y 3, deciles 5 y 8, percentil 15.

Muestra: 7 docentes antes de servicio. 4 ; 5 ; 6 ; 8 ; 10 ; 12 ; 15,. x1 Calcular: SOLUCION Ubicacin del lugar : x2 x3 x4 x5 x6 x7 N= 7

Q1 ; Q3 ; D5 ; D8 ; P15

Interpretacin: El 25 % de los docentes tienen como mximo 5 aos de servicio, mientras que el 15% superan esa cantidad y tienen mas de 5 aos de servicio Ubicacin del lugar:

93

ESTADISTICA DESCRIPTIVA

Interpretacin: El 75 % de los docentes tienen como mximo 12aos de servicio mientras que el 25 % supera esa cantidad , y tienen mas de 12 aos de servicio.

Ubicacin del lugar:

Interpretacin: El 50% de los docentes tienen como mximo 8 aos de servicio, mientras que el 50 % supera esa cantidad y tienen mas de 8 aos de servicio.

Ubicacin del lugar :

Interpretacin:

El 80 % de los docentes tienen como mximo ..Aos de servicio, mientras que el supera esa cantidad y tienen mas de. Aos de servicio.

De la siguiente tabla, calcular e interpretar cuartel 3,decil 6 y percentil 50

94

ESTADISTICA DESCRIPTIVA

TABLA N 01

N Asignaturas desaprobadas X1 0 1 2 3 4 total

N de estudiantes f1

F1

4 8 7 5 6 N=30

4 12 19 24 30

Cuartil 3 Q3 > 3 x 30 = 90 = 22,5 4 4 Q3 = 3 ASIGNATURAS DESAPROBADAS. Decil 6 D6 = 6 x 30 = 18 > D6 = 2 asignaturas desaprobadas. 10

Percentil 60 P60 = 60 x 30 = 18 > P60 = 2 asignaturas desaprobadas. 100

De la siguiente tabla , calcular e interpretar cuartiles 2 y 3 deciles 4 y 9, percentiles 40 y 75.

95

ESTADISTICA DESCRIPTIVA

TABLA N 03

Calificacin L.I - L.S 0 3

N estad. (fi) 1 4 9 3 18 12 4

Fi

1 5 14 17 34 46 50 N = 50

3 - 6 6- 9 9 - 12 12 - 15 15 - 18 18 - 21

96

ESTADISTICA DESCRIPTIVA

D4 => 4 x 50 = 20 10

D4= 12 +(20-17) 3 17

D4= 12.53

D9 => 9 x 50 = 45 10

D9= 15 +(45-34) 3 12

D9= 17.15

P40 => 40 x 50 = 20 100

P40= 12 +(20-17) 3 17

P40= 12.53

P75 => 75 x 50 = 37.5 100

P75= 15 +(37.5-34) 3 12

P75= 15,875

97

ESTADISTICA DESCRIPTIVA

BIBLIOGRAFIA

HINES William W./MONGOMERY, DOUGLAS C. PROBABILIDAD Y ESTADISTICA PARA INGENIEROS Y ADMINISTRACION 1era edicin. DOUGLAS A. LIND WILLIAM G. MARCHAL, SAMUEL A. WATHEN , Estadstica Aplicada a los negocios y a la Economa 12 edicin, 2005 MURRAY R. SPIEGEL, LARRY J. STEPHENS, Estadistica Schaum, 4ta Edicion 2009 VILA ACOSTA, Estadstica Aplicada a las Ciencias, Edicin 2006. MONTGOMERY Y RUNGER , Probabilidad y Estadistica , Aplicacin ala ingeniera 2da edicin 2004. CRDOVA ZAMORA, MANUEL; Estadistica Descriptiva e Inferencial, Editorial Moshera 5ta edicin 2003 ROBERT JOHNSON, PATRICIA HUBY, Estadstica Elemental, lo esencial , Editorial THOMSON 2da Edicin 1998 CELESTINO GARCIA ORE, Estadstica Descriptiva y Probabilidades 2da Edicion,1999 MOYA C. RUFINO, Estadstica Descriptiva editorial San Marcos 2da Edicin, 1998 DEVORE, JAY L. Probabilidad y Estadstica para Ingeniera y Ciencias. 4ta Edicin Internacional Thomson Publishing 1998.

98