You are on page 1of 395

UNIDAD 1

LA
ESTADISTICA
DESCRIPTIVA
MAPA CONCEPTUAL DE
LA UNIDAD
POBLACION
MUESTRA

DATOS
MEDIDA

TABLAS DESCRIPTIVAS
GRAFICOS

INFORMACION PARA TOMAR DECISIONES


OBJETIVOS

AL CONCLUIR ESTA UNIDAD, EL


ALUMNO
SERA CAPAZ DE:
COMPRENDER LA RAZON POR LA QUE ESTUDIA
ESTADISTICA.-
EXPLICAR LOS CONCEPTOS DE ESTADISTICA
DESCRIPTIVA Y ESTADISTICA INFERENCIAL.-
DINTINGUIR ENTRE UNA VARIABLE CUALITATIVA Y
UNA VARIABLE CUANTITATIVA.-
DESCRIBIR LA DIFERENCIA ENTRE VARIABLE
DISCRETA Y VARIABLE CONTINUA.-
DISTINGUIR ENTRE LOS NIVELES DE MEDICION ,
NOMINAL, ORDINAL, INTERVALAR Y DE RAZON.-
ORGANIZAR LOS DATOS CUALITATIVOS EN UNA
TABLA DE FRECUENCIAS.-
REPRESENTAR UNA TABLA DE FRECUENCIA COMO
UNA GRAFICA DE BARRAS Y GRAFICA DE PASTEL.-
ORGANIZAR DATOS CUANTITATIVOS EN UNA
DISTRIBUCION DE FRECUENCIA.-
REPRESENTAR UNA DISTRIBUCION DE FRECUENCIAS
DE DATOS CUANTITATIVOS POR MEDIO DE
HISTOGRAMAS, POLIGONOS DE FRECUENCIA Y
POLIGONOS DE FRECUENCIAS ACUMULADAS.-
CALCULAR LA MEDIA ARITMETICA, LA MEDIA
PONDERADA Y LA MEDIA GEOMETRICA.-
EXPLICAR LAS CARACTERISTICAS, USOS, VENTAJAS
Y DESVENTAJAS DE CADA MEDIDA DE UBICACIN.-
IDENTIFICAR LA POSICION DE LA MEDIA, LA MEDIANA
Y EL MODO PARA LAS DISTRIBUCIONES SIMETRICAS Y
SESGADAS.-
CALCULAR E INTERPRETAR EL RANGO, LA VARIANCIA
Y EL DESVIO ESTANDAR.-
COMPRENDER LAS CARACTERISTICAS, USOS,
VENTAJAS Y DESVENTAJAS DE CADA MEDIDA DE
DISPERSION.-
COMPRENDER SOBRE EL TEOREMA DE CHEBYSHEV Y
LA REGLA EMPIRICA EN RELACION CON UN CONJUNTO
DE OBSERVACIONES.-
ELABORAR E INTERPRETAR UN DIAGRAMA DE
PUNTOS.-
CREAR E INTERPRETAR UN GRAFICO DE TALLO Y
HOJAS.-
CALCULAR Y COMPRENDER LOS CUARTLES, DECILES
Y PERCENTILES.-
CONSTRUIR E INTERPRETAR DIAGRAMAS DE CAJA.-
CALCULAR Y ENTENDER EL COEFICIENTE DE SESGO.-
TRAZAR E INTERPRETAR UN DIAGRAMA DE
DISPERSION.-
CONSTRUIR, ANALIZAR E INTERPRETAR UNA TABLA
DE CONTINGENCIA.-
APLICACIONES
DE LA ESTADISTICA
EN EL REA DE LA
ECONOMA, ADMINISTRACIN
Y LA EMPRESA EN GENERAL
Con lo que vamos a ver en esta ctedra, observaremos
como las tcnicas estadsticas pueden servir al
administrador, economista y empresario para obtener un
conocimiento amplio sobre su realidad econmica y
social.- Es obvio que toda persona que se dedique al
mundo de los negocios (industria, empresa, comercio,
etc) necesita informacin sobre las caractersticas del
ambiente y medio en que realiza su actividad.- Cualquier
informacin, ya sea de tipo cualitativo o cuantitativo,
debidamente tratada, puede servir para el estudio de la
economa en general y para el conocimiento, desarrollo y
control de los principales subsistemas funcionales de la
empresa, entre los que podemos mencionar, recursos
humanos, marketing, produccin, finanzas, etc.- Si
analizamos algunos de estos subsistemas es posible
encontrar ejemplos en los que la Estadstica puede
constituir un autntico elemento de ayuda.-
RECURSOS
HUMANOS

Para la seleccin del personal los


administradores, empresarios etc, suelen usar
cada vez con ms frecuencia, adems de los
juicios subjetivos obtenido en las entrevistas a
los candidatos, los resultados obtenidos en
tests de aptitudes y conocimientos deseables en
la persona a contratar.- Las tcnicas
descriptivas son instrumentos adecuados para
el tratamiento de las puntuaciones numricas
alcanzadas en dichos tests.-
MARQUETING
Los estudios de mercado
dirigidos al conocimiento de la demanda
de productos, productos competidores,
efectos de campaas publicitarias, etc, se llevan a cabo con
regularidad en la empresa y el comercio.- Antes de sacar un
producto al mercado se suele realizar una investigacin al
respecto mediante muestreo con objeto de obtener alguna
informacin.-Las tcnicas estadsticas permiten en estas
situaciones inferir valores de parmetros poblacionales a partir de
informacin muestral.- Por supuesto, a partir de una muestra no se
puede conocer con exactitud y precisin las caractersticas de
toda la poblacin; siempre habr un grado de incertidumbre sobre
el verdadero valor poblacional; la cual puede ser cuantificada en
cierta medida en trminos de probabilidad.-
FINANZAS
El conocimiento de las fuentes de
financiacin y los movimientos de
los tipos de inters son esenciales
para que un comercio, empresa decida si se somete a
algn tipo de endeudamiento en un momento dado.- As,
las decisiones de inversin en nuevos productos,
locales, maquinarias, etc, vendrn condicionadas por los
precios esperados del dinero.- Para ello son de gran
utilidad las tcnicas de prediccin, que constituyen una
autntica necesidad en el mundo de los negocios. En
toda empresa suele ser necesario el conocimiento del
volumen y precios de acciones, obligaciones, futuros y
productos derivados de los mercados de valores, tanto si
la empresa cotiza en Bolsa como si se posee una Cartera
de Valores.-
Cualquier inversor que haya de decidir como equilibrar
su Cartera de Valores debe hacer un anlisis de
inversiones para seleccionar entre los distintos
productos financieros ofertados por el mercado de
valores, y ha de tomar sus decisiones cuando an
desconoce los movimientos futuros del mercado,
aunque pueda tener alguna informacin al respecto.-
Las tcnicas estadstica pueden ayudar en dicha tarea e
incluso cuantificar el grado de incertidumbre de sus
operaciones.-
CONTABILIDAD.-
Las empresas de contadura pblica emplean
procedimientos estadstico de muestreo para llevar a cabo
auditorias a sus clientes.- Por ejemplo, suponga que una
empresa de Contadores desea determinar la cantidad que
aparece en las cuentas por cobrar en el balance de un
cliente, representa fielmente la cantidad real de ese rubro.-
Usualmente, la cantidad de cuentas individuales por
cobrar es tan grande que sera demasiado lento y costoso
revisar y validar cada cuenta.- En casos como ste,
regularmente se acostumbra que el personal del auditor
seleccione un subconjunto de las cuentas llamado
muestra.- Despus de revisar la exactitud de las cuentas
muestreadas, los auditores llegan a una conclusin acerca
de si la cantidad que aparece en cuentas por cobrar, en los
estados financieros de su cliente, es aceptable.-
PRODUCCION
En el proceso de fabricacin de
un producto Intervienen innumerables factores
( materias primas, maquinarias, obreros, etc) que afectan
a las caractersticas de calidad de ese producto.- En muchas
fbricas es corriente ver como los productos llegan a una cinta
transportadora en cuyo final hay una mquina de empaquetar que
los enva al almacn .- Entre la cinta transportadora y la mquina de
empaquetar hay un obrero que observa atentamente los productos
que llegan y ocasionalmente arroja algunos a un cesto cercano.-
Est eliminando productos defectuosos.- Hoy en da el control de
calidad de la produccin es bsico para que los artculos
producidos cumplan los requisitos de calidad establecidos por las
normas tantos nacionales como las internacionales.- los mtodos
estadsticos son una herramienta eficaz en esta rea para mejorar
los procesos de produccin reducir sus defectos.-
Resulta evidente que cualquier profesional de la empresa, comercios,
administracin o los negocios debe adquirir una formacin bsica
en estadstica en su proceso de aprendizaje, que le permita
moverse con soltura en el mundo que le rodea.- Si su objetivo va ms
all del entendimiento y ha de tomar decisiones en un entorno de
fluctuaciones y riesgo, no bastar con entender la terminologa
estadstica.- Necesitar conocerla lo suficiente como para aplicarla y
hacer de ella una herramienta realmente eficaz en el ejercicio de su
actividad.- Considerando adems, el desarrollo y uso generalizado que
la informtica ha tenido en los ltimo aos- Lo que facilita actualmente
una gran disponibilidad tanto en lo que respecta a la capacidad de
almacenamiento como en la rapidez en el clculo y procesamiento de
datos-, Podemos asegurar que con el empleo de las tcnicas
estadsticas, las posibilidades de utilizar la informacin de una manera
adecuada y eficiente son casi infinita.-
ECONOMIA
Con frecuencia se pide a los Economistas su
pronsticos acerca del futuro de la economa o
de algunos de sus aspectos, por lo que recurren
a informacin estadstica diversa para elaborarlo.- As,
para pronosticar las tasas de inflacin usan indicadores
como ndices de precios del productor, la tasa de
desempleo y la ocupacin de la capacidad de produccin.-
Muchas veces, esos indicadores estadsticos se
introducen en modelos computarizados de pronsticos,
cuyo resultado son predicciones sobre las tasas de
inflacin.-
LAS
LAS APLICACIONES
APLICACIONES
DE
DE LA
LA ESTADISTICA
ESTADISTICA
EN
EN SITUACIONES
SITUACIONES
COMO
COMO LAS
LAS
MOSTRADAS
MOSTRADAS Y Y
OTRAS,
OTRAS, SON
SON PARTE
PARTE
DE
DE LO
LO QUE
QUE
VEREMOS
VEREMOS EN EN ESTA
ESTA
CATEDRA
CATEDRA
TRATEMOS DE
DAR UNA
DEFINICIN
DE ESTADISTICA
SEGN EL AUTOR QUE
TOMEMOS COMO
BIBLIOGRAFIA, NOS
ENCONTRAREMOS CON
MUCHAS DEFINICIONES DE
ESTADISTICA.-
Moore D. S., dice:
La estadstica es la ciencia que trata sobre la
obtencin de informacin a partir de datos
numricos Para la mayora de las personas
que utilizan la estadstica e incluso para muchos
estadsticos profesionales, la estadstica es la
disciplina que proporciona instrumentos e ideas
que permite utilizar datos numricos para
profundizar en la comprensin de distintos
temas.- A pesar de que la estadstica se
fundamenta en una slida base matemtica,
nuestro inters se centra en la estadstica
aplicada, que se puede dividir en tres campos de
estudio: la obtencin de datos, el anlisis
de datos, y la inferencia estadstica.-
Anderson, Sweeney y Williams ,
dice:
En un sentido amplio, la estadstica es el
arte y la ciencia de reunir, analizar,
presentar e interpretar datos.-
Especialmente en los negocios y la
economa, una razn bsica para esa
recopilacin e interpretacin de datos, es
proporcionar a los administradores y a
quienes toman decisiones, una mejor
comprensin del entorno para permitirles
tomar las mejores decisiones.-
Segn Jack Levin y William C. Levin, definen
a la ESTADISTICA como
Un conjunto de tcnicas para tomar decisiones
que ayuden a los investigadores a hacer inferencias
de la muestra a la poblacin y, en consecuencia
a comprobar hiptesis relativas a la naturaleza
de la realidad social.-
Es una palabra que
encontramos y usamos
frecuentemente en
nuestro lenguaje
cotidiano.-

En realidad, es una
palabra que tiene tres
acepciones diferentes:
Primera
Acepcin (*)
No es ms que
una coleccin de
datos ordenados
y clasificados
segn un criterio

Segunda
Acepcin

Es la ciencia, que con ayuda del calculo de


(**) probabilidades estudia las leyes del
comportamiento de aquellos fenmenos que
dependen del azar.-
(*) En este sentido se la tomo en la antigedad.-

Cuando las sociedades primitivas se organizaron y


superaron su mbito local, se vieron en la necesidad de
tener que tomar decisiones que exigan un conocimiento
numrico de los recursos disponibles.- Esta necesidad
dio lugar a la utilizacin y desarrollo de las primeras
tcnicas estadsticas basadas en un principio,
exclusivamente, en el recuento y presentacin de datos.-
La Historia nos muestra que las primeras estadsticas
fueron realizadas con efectos recaudatorios en la mayora
de los casos, por los gobernantes de las grandes
civilizaciones antiguas, para conseguir conocer el
nmero de bienes que posea el Estado y como estaban
repartidos entre la poblacin.-
La utilizacin de estas tcnicas, en su comienzos,
exclusivamente por el Estado hace que esta propia
palabra sea la raz del trmino Estadstica.-
El primer dato que se dispone de la elaboracin de una
estadstica nos la proporciona Herdoto que seala como
en el ao 3050 a de C, se efectu un recuento de las
riquezas y de la poblacin de Egipto, cuya finalidad era
conocer los recursos humanos y econmicos disponibles
para construir las pirmides.-
En el ao 2238 a de C, se realiza una estadstica industrial
y comercial por el emperador Yao de China, segn cita de
Chu King en el libro de Confucio.-
En el ao 1400 a de C, Ramses II realiz un censo de las
tierras de Egipto a fin de efectuar un nuevo reparto.-
Moiss en el ao 1400 a de C, segn aparece en el
Pentateuco, y David en el 1018 a de C. segn aparece en el
Libro de Los Reyes, realizaron sendos censos para conocer
que nmero de guerreros disponan las tribus de Israel.-
Los griegos realizaron diversos censos con fines
tributarios, reparto de tierras, as como disponibilidad de
recursos y guerreros para sus campaas.-
En poca romana de contabilizaban, al menos, la realizacin
de 69 censos con diversos fines; tributarios, nmero de
hombres con derecho al voto, y posibilidades para la
realizacin de sus campaas militares.-
Desde la cada del imperio romano pasa prcticamente un
milenio sin que se conozca ninguna estadstica importante,
salvo las recopilaciones realizadas por Pepino el Breve en
el ao758 y por Carlomagno en el 762 sobre las tierras
propiedad de la Iglesia.-
Durante el siglo IX se realizaron en Francia recuentos
parciales de siervos.- Recuentos similares se realizaron
en Inglaterra que fueron recopilados por Guillermo el
Conquistador en 1086 y muy posteriormente en el siglo
XIV, por Eduardo II.-
Es con el nacimiento de las Naciones cuando la
Estadstica va adquiriendo un rigor cientfico en las
tcnicas de recogida y presentacin de datos que van a
facilitar el anlisis de las conclusiones y por tanto, la
toma de decisiones.- En 1540, Sebastin Munter, realiz
una recopilacin estadstica de los recursos nacionales
alemanes, en la que se inclua la organizacin poltica de
la nacin alemana, as como sus instituciones sociales,
su comercio y su potencia militar.-
Estudios parecidos fueron realizados durante el siglo XVI
en Italia y Francia.-
La estadstica demogrfica tiene un gran auge durante el
siglo XVII.- La gran pregunta era saber si la poblacin se
modificaba, aumentando o disminuyendo o si ste era un
parmetro esttico.- Estos estudios dieron lugar a la
creacin de los ndices de natalidad y mortalidad.-
(**) Durante el siglo XVII y principios del XVIII, se
desarrolla la Teora de las Probabilidades, teora que
proporciona a la Estadstica mtodos de investigacin que
la permiten alcanzar la categora de ciencia.- El primer
tratado sobre esta teora fue escrita por Bernoulli en el
que se dice que la regularidad que aparece en el orden
social se debe a la probabilidad ms que al designo
sobrenatural.- Durante el siglo XVII son conocidos los
trabajos realizados por Pascal y Farmat, sobre problemas
de juegos de azar, que tuvieron sus antecedentes en
algunos matemticos del siglo XV como, Paccioli,
Cardano, Tartaglia, Kepler y Galileo.-
En este perodo tambin aparecen los grandes
matemticos con diversos mtodos estadsticos.-
Quetelet (1796 1874) aplic la teora de las
probabilidades a las ciencias sociales, elaborando una
teora determinista en las que las caractersticas de un
hombre quedara determinadas por su entorno social, con
lo que se podra aplicar el principio de los promedios,
pudindose hablar de un hombre medio.-
A principio del siglo XIX, se desarrolla dos nuevas teoras
matemticas de gran influencia en la teora estadstica que
son; la teora de los errores de observacin de laplace y
Gauss y la teora de los mnimos cuadrados desarrollada
por los dos anteriores y Legendre.-
Es a finales del siglo XIX cuando Sir Francis Galton
desarrolla el mtodo de la correlacin, que tiene por
objeto medir la influencia relativa de los factores sobre
las variables.- De este modo parti el mtodo de
correlacin creado por Klar Pearson.-
Los progresos ms recientes en el campo de la
estadstica se refieren al clculo de las probabilidades
basado en el principio de indeterminismo, que supone que
la uniformidad de la naturaleza debe considerase como
una serie de posibles resultados procedentes de cualquier
causa o causas dadas, ms que de un nico resultados
exacto y preciso en cada caso.-
Tercera Acepcin

Es la ciencia que aporta las


tcnicas o mtodos que se sigue
para recoger, organizar, resumir,
presentar, analizar, interpretar,
generalizar y contrastar resultados
de las observaciones de los
fenmenos reales para ayudar a
tomar decisiones ms efectivas.-
Para pensar en trminos estadsticos hay que seguir una
serie de pasos que van desde la definicin del problema
hasta la toma de decisiones.-
Una vez identificado y definido el problema, se recogen
datos producidos mediante diversos procesos de
acuerdo con un diseo y se analizan utilizando uno o
mas mtodos estadsticos.- De este anlisis se obtiene
informacin.-
La informacin se convierte a su vez, en conocimiento,
utilizando los resultados de las experiencias especificas,
la teora y la literatura y aplicando mtodos estadsticos
adicionales.- Para convertir los datos en un conocimiento
que lleva a tomar mejores decisiones se utiliza tanto la
estadstica descriptiva como la inferencial.-
TIPOS
TIPOS DE
DE
ESTADISTICAS.-
ESTADISTICAS.-

Dependiente del propsito del


estudio, la estadstica puede ser
Descriptiva o Deductiva e
Inferencial o Inductiva .-
La Estadstica Descriptiva
comprende aquellos mtodos grficos y
numricos usados para recopilar,
organizar y describir la informacin que
se ha recogido con el fin de describir
sus caractersticas.-

La Estadstica Inferencial
comprende aquellos mtodos y tcnicas
usadas para hacer generalizaciones,
predicciones y estimaciones que se
utilizan para transformar la informacin
en conocimiento.-
Veamos un ejemplo de como acta en parte la
estadstica descriptiva:

Produccin diaria de una fabrica de cereales.-


Un jefe de produccin de cereales de Trigo formo un
equipo de empleados para estudiar el proceso de
produccin de cereales.- Durante la primera fase del
estudio se peso una seleccin aleatoria de cajas y se
midi la densidad del producto.- A continuacin, el jefe
quera estudiar datos relacionados con las pautas de
produccin diaria.- Se hallaron los niveles de produccin
(en miles) de un periodo de 10 das.- Represente estos
resultados grficamente y comente sus observaciones:
Da 1 2 3 4 5 6 7 8 9 10
Cajas 84 81 85 82 85 84 109 110 60 63
(miles)
Scatterplot of CAJ AS (MI LES) vs DI A

110

100
CAJAS (MILES)

90

80

70

60

0 2 4 6 8 10
DIA

Solucin
En la figura, el jefe de produccin puede identificar los
das de baja produccin, as como los das de mayor
produccin.-
No parecera que hubiera mucha diferencia en el numero
de cajas producidas en los seis primeros das.-
Sin embargo, en los das 7 y 8 el nivel de
produccin parecera que era mas alto.- En
cambio, en los das 9 y 10 parecera que era mas
bajo.-
Basndose en estas observaciones, el equipo
intento identificar las causas por las que la
productividad era mas alta y mas baja.-
Por ejemplo, tal vez en los das 9 y 10 estuvieron
ausentes trabajadores clave o hubieran cambiado
las materias primas.- Tambin se podran
identificar las causas por las que aumento la
productividad en los das 7 y 8.-
Respecto a la Estadstica Inferencial, diremos:

La estadstica inferencial es un proceso, no un mero


resultado numrico.- Este proceso puede consistir en una
estimacin, una prueba de hiptesis, un anlisis de
relaciones o una prediccin.-
En primer lugar , podemos querer estimar un
parmetro.- Supongamos que Florera Sicar SRL, quiere
desarrollar una nueva estrategia de comercializacin.-
Podra ser til la informacin sobre los hbitos de gasto
de los clientes de la florera.- Puede querer:
Estimar la edad media de los clientes de la florera.-
Estimar la diferencia entre la cantidad media que los
clientes pagan con Tarjeta American Express y la
cantidad media que pagan con Visa.-
Estimar la proporcin de clientes que estn insatisfecho
con el sistema de reparto de la florera.- Etc.

En segundo lugar , podemos querer probar una


hiptesis sobre un parmetro.- Por ejemplo, la Florera
Sicar puede querer:
Probar la hiptesis si los clientes tienen este ao una
preferencia por el color de las rosas distintas a la del ao
pasado.-
Probar la hiptesis si menos del 25 por ciento de los
clientes de la florera son turistas.-
Probar la hiptesis si las ventas son mayores los fines
de semana que el resto de los das de la semana.-
Probar la hiptesis si la cantidad media que gastaron los
clientes es su ultima compra supero los 50$.-
Las respuestas a estas preguntas pueden ayudar a la
Florera Sicar SRL a lanzar una campaa publicitaria que
le permita reducir costos, incrementar beneficios y
aumentar la satisfaccin de los clientes.-

En tercer lugar , podemos querer analizar las


relaciones entre dos o mas variables.- El director
financiero de la General Motors, quiere tomar decisiones
estratgicas que afectan a toda la compaa.- En esos
casos, puede utilizar series de datos macroeconmicos
de los que puede disponerse en diversas publicaciones,
para analizar las relaciones entre variables como el
producto bruto interno, tipo de inters, la renta per capita,
la inversin total y oferta monetaria, etc., que indican la
situacin general de la economa nacional.- El director
financiero puede hacerse las siguientes preguntas:
Influye la tasa de crecimiento de la oferta monetaria en
la tasa de inflacin?.-
Si General Motors sube un 5 por ciento el precio de los
automviles de tamao intermedio, Cmo afectara la
subida a las ventas de estos automviles?.-
Afecta la legislacin sobre el salario mnimo de
desempleo?.-
Etc..
Cmo se comienza a responder a la pregunta sobre el
efecto que puede producir una subida de los precios en la
demanda de automviles?.- La teora econmica bsica
nos dice que mantenindose todo lo dems constante,
una subida del precio va acompaada de una reduccin
de la cantidad demandada.- Sin embargo, esta teora es
puramente cualitativa.-
No nos dice cuanto disminuye la cantidad demandada.-
Para avanzar mas, hay que recoger informacin sobre
como ha respondido la demanda a las variaciones del
precio en el pasado y evaluarla.- Estudiando estadstica
inferencial aprenderemos a recoger informacin y a
analizar relaciones.-

En cuarto lugar , podemos necesitar predecir, es decir,


hacer predicciones confiables.- Las decisiones de
inversin deben hacerse mucho antes de que pueda
llevarse un nuevo producto al mercado y evidentemente,
es deseable tener predicciones de la situacin en la que
se encontrara probablemente el mercado dentro de unos
aos.- Cuando los productos estn consolidados, las
predicciones sobre las ventas a corto plazo son
importantes para decidir los niveles de existencias y los
programas de produccin.-
Las predicciones de los futuros tipos de inters son
importantes para una empresa que tiene que decidir si
emite o no nueva deuda.- Para formular una poltica
econmica coherente, el gobierno necesita predicciones
de los resultados probables de variables como el
producto bruto interno.-
Las predicciones de los futuros valores dependen de las
regularidades descubiertas en la conducta anterior de
estas variables.- por lo tanto, se recogen datos sobre la
conducta anterior de la variable que va a predecir y sobre
la conducta de otra variable relacionadas con ella.-
Utilizaremos la estadstica inferencial para analizar esta
informacin y sugerir entonces las tendencias futuras
probables.-
EJERCICIOS PARA HACER EN CLASE

1.- Suponga que usted asesora al dueo de un


Supermercado,
a) Ponga un ejemplo de una pregunta que podra
responderse utilizando la estadstica
descriptiva.-
b) Ponga un ejemplo de una pregunta en la que
seria til estimar un parmetro.-
c) Ponga un ejemplo de una pregunta sobre una
posible relacin entre dos variables que tienen
inters para su Supermercado.-
d) Ponga un ejemplo de una cuestin en la que
hay que hacer una prediccin.-
2.- Averige si debe utilizarse la estadstica
descriptiva o la inferencial para obtener la
siguiente informacin:
a) Un grafico que muestra el numero de botellas
defectuosas producidas durante el turno de da
a lo largo de una semana.-
b) Un estimacin del porcentaje de empleados
que llegan tarde a trabajar.-
c) Una indicacin de la relacin entre los aos
de experiencia de los empleados y la escala
salarial..-
POBLACION
Definicin 1 : El conjunto de
personas, animales o cosas que
son objeto de nuestro estudio.-
Definicin 2 : es la que esta
formada por la totalidad de las
observaciones en las cuales se
tiene cierto inters.-

Elemento o Unidad
Se Estadstica : Son las
simboliza personas, animales o cosas
con N que forman la poblacin.-
Tamao
Poblacin finita : cuando el nmero de
elementos que la forman es numerable, se puede
contar, por ejemplo el nmero de alumnos de la
universidad, cantidad de empleados de una
fbrica, etc.-

Poblacin infinita : cuando el nmero de


elementos que la forman es incontable o tan
grande que puede considerarse infinito. Como
por ejemplo, si se realizara un estudio estadstico
sobre los productos que hay en el mercado,
produccin de un torno, etc.-
Ejemplos de poblaciones son:
Todos los estudiantes de una universidad.-
Todos los votantes inscriptos en un pas.-
Todas las familias que viven en una ciudad.-
Todas las acciones que se cotizan en una bolsa de
valores.-
Todas las reclamaciones que recibe en un ao una
compaa de seguros.-
Todas las cuentas pendientes de cobro de un comercio.-
Todas las boletas de ventas correspondientes a un ao
de un comercio que hay que auditar.-
Etc
Los elementos de una poblacin
ELEMENTOS poseen una serie de cualidades,
propiedades o rasgos comunes que se
O UNIDAD denominan en estadstica
ESTADISTICA CARACTERES.

Por ejemplo: si tenemos un estudio sobre personal


de la administracin pblica provincial, todos los
empleados poseen una serie de caractersticas:
Edad.
Estado civil.
Nmero de hijos.
Nivel de instruccin alcanzado.-
Antigedad en el trabajo.
Tarea que realiza.-
Remuneracin que recibe.-
Etc..............................
Los caracteres de los elemento de la poblacin
pueden ser:

CARACTERES CUALITATIVOS, ATRIBUTOS O


VARIABLES CATEGRICAS , son aquellas que por su
propia naturaleza no se pueden medir y se describen mediante
palabras. Son producto de conteo.- Por ejemplo: el sexo, nacionalidad,
raza, color de pelo, estado de nimo, tipo de trabajo, .. etc.-
Las variables categricas tiene modalidades.-

CARACTERES CUANTITATIVOS O VARIABLES


NUMRICAS son aquellos que se pueden describir mediante
nmero, es decir, que son susceptibles de cuantificacin o de
medicin. Por ejemplo: puntajes de un test, edad, el peso, la altura,
ingreso de una empresa, salario de una persona, minutos de demora
en recorrer una distancia, tiempo en elaborar una determinada pieza
de produccin, etc.-
Dentro de los caracteres cuantitativos o variables
numricas pueden encontrarse dos clases de variables;
variables discretas y variables
continuas .
Una variable estadstica es DISCRETA si toma
un nmero finito o infinito numerable de valores, o
dicho de otra forma, si entre dos valores
consecutivos puede tomar a lo sumo un nmero
finito de valores. Por ejemplo: cantidad de hijos,
cantidad de alumnos por grado, cantidad de
obreros de una fbrica, cantidad de errores de
ortografa en un dictado, cantidad de nios en
edad escolar por hogares, cantidad de pacientes
de un hospital, cantidad de productos producidos
por una mquina, etc...-
Una variable estadstica es CONTINUA si
toma un nmero infinito de valores en un
intervalo, o dicho de otra manera si entre
dos valores consecutivos puede tomar
cualquier otro. Por ejemplo: peso de
alumnos, altura, produccin de fbrica,
salarios de mdicos de un hospital, montos
de ventas de un comercio, tiempo de
armado de una determinada pieza para
autos, metros de tela producidos por un
telar, etc.-
DEFINICION
OPERACIONAL

Todas las variables deben tener una definicin


operacional, es decir, un significado universal
aceptado que sea claro para todos aquellos
que estn relacionados con el anlisis.- La
falta de las definiciones operacionales genera
confusin.-
ESCALAS
ESCALAS
DE
DE
MEDICIO
MEDICIO
NN
DE LA VARIABLE EN
ESTUDIO
Para el anlisis de datos se debe estar
familiarizado con que existen cuatro escalas
numricas de medida de las variables que
estamos estudiando.- Cuanto ms alta sea la
jerarqua o posicin que ocupe el tipo de datos en
estas medidas ms informacin contendrn.-

NOMINAL DE INTERVALOS

ORDINAL

DE RAZON, COCIENTE O PROPORCION


Nominal o de
Estas escalas tienen ciertas
clasificacin
propiedades bsicas:
La escalas nominales o de Entre los objetos clasificados
clasificacin consisten en existe una relacin de
clasificar objetos reales segn equivalencia o no equivalencia.-
cierta caractersticas, tipologas
o nombres, dndoles una Si se utilizan nmeros, estos
denominacin o smbolo, sin que solo distinguen orden de
implique ninguna relacin de posiciones de determinada
orden, distancia o proporcin categora o clase, pero de
entre esos objetos.- ningn modo establecen
relacin numrica entre los
objetos numerados.-
Los objetos estn clasificados
u ordenados en relacin a una
igualdad o equivalencia de un
aspecto o caracterstica.-
Escala ordinal o de orden
jerrquico
Las propiedades bsicas de
Con esta escala se establecen esta escala son:
posiciones relativas de objetos
o individuos en relacin a una Entre los objetos ordenados
caracterstica, sin que se existe la relacin mayor,
reflejen distancias entre ellos.- menor o igual y las relaciones
Hay un sentido de mayor(>) lgicas de transitividad y
menor (<).- asimetra.-
La ordenacin implica
diferentes niveles de posicin
de un atributo: la utilizacin de
nmeros establece relaciones
entre los objetos, pero no
distancia entre los intervalos.-
Escala de intervalos Podemos sealar las siguientes
o de distancias caractersticas esenciales de este tipo
iguales de escala:
Representan un nivel de Entre los objetos y ordenados existe
medicin ms preciso una relacin de mayor, igual o menor.-
que las anteriores; no
solo se establece un La escala se presenta bajo una forma
orden en las posiciones cuantitativa.-
relativas de los objetos o La utilizacin de nmeros indica
individuos sino que se relaciones entre los objetos y distancia
mide tambin la entre los intervalos, que cuando son
distancia entre los numricamente iguales representan
intervalos o las distancias tambin iguales en el atributo
diferentes categoras.- medido: as por ejemplo la distancia
entre 10 y 20 es la misma que entre 82 y
92.-
El punto cero de la escala es arbitrario
y convencional, por ello no indica
ausencia de lo que estamos midiendo.-
Escala de
La caracterizaremos del siguiente
razones o de
modo:
cocientes
Entre los objetos ordenados existe
Esta es una escala que
un orden jerrquico, igualdad de
adems de distincin,
intervalos y por ltimo igualdad de
orden y distancia, permite
razn, proporcin.-
establecer en que
proporcin es mayor una Los nmero utilizados son
categora de la escala que nmeros reales.-
otra.- Tiene un cero
La serie de nmeros reales tienen
absoluto o natural que
un origen llamado cero que por ser
representa la nulidad de lo
natural es inalterable.-
que se estudia.-
Si una persona gana 200$ y otra
gana 400$, decimos que la segunda
gana el doble que la primera.-
EJERCICIOS PARA HACER EN CLASE

1.- Indique si cada una de las siguientes variables es


categrica o numrica.- Si es categrica, indique el nivel
de medicin.- Si es numrica si es discreta o continua.-

a) Numero de mensajes de correo electrnico enviados


diariamente por un planificador financiero.-
b) Costo efectivo de los libros de texto de un estudiante
para un cuatrimestre.-
c) Su factura mensual de electricidad.-
d) Las clasificacin de profesores universitarios segn
cargos.-
e) Tiempo en minutos que demora usted en llegar a la
universidad.-
f) Ventas diarias del comercio donde trabaja.-
2.- En una facultad universitaria se ha repartido un
cuestionario entre los estudiantes para averiguar su
grado de satisfaccin con diversas actividades y
servicios.- Por ejemplo, por lo que se refiere al mtodo
de matriculacin para las clases del prximo
cuatrimestre, se pide a los estudiantes que pongan una
cruz en una de las siguientes casillas:
muy satisfecho
moderadamente satisfecho
neutral
moderadamente insatisfecho
muy insatisfecho

Es la respuesta de un estudiante a esta pregunta,


numrica o categrica?.- Especifique.-
3.- En una encuesta reciente se pidi al profesorado de
una universidad que respondiera a una serie de
preguntas.- Indique el tipo de datos de cada pregunta.-
a) Indique su nivel de satisfaccin con la carga docente
(muy satisfecho, moderadamente satisfecho; neutral;
moderadamente insatisfecho; muy insatisfecho).-
b) Cuntos artculos ha publicado en revistas con
evaluacin annima durante el ltimo ao?.-
c) Ha asistido a la ltima reunin del consejo de
departamento?.-
d) Cree usted que el proceso de evaluacin de la
docencia debe revisarse?.-
4.- Se ha formulado una serie de preguntas a una muestra
de clientes de un negocio de ventas de helado.-
identifique el tipo de datos que se pide en cada
pregunta:
Cul es su sabor favorito?.-
Cuntas veces al mes toma helado?.-
Tiene hijos de menos de 10 aos que vivan en casa?.-
Ha probado el ltimo sabor de helado?.-

5.- La comunidad de propietarios de viviendas ha


formulado una serie de preguntas a los residentes de
un country grande muy importante:
a) Jug al golf el mes pasado en el nuevo campo de golf
del country?.-
b) Cuntas veces ha comido en el restaurante del
country en los ltimos tres meses?.-
c) Tiene usted una cuatro por cuatro?.-
d) Valore al nuevo sistema de seguridad de la
urbanizacin (muy buena, buena, mala y muy mala).-
LA ESTADISTICA
EN LAS
DECISIONES EN EL
MUNDO DE LOS
NEGOCIOS
Un aspecto de los negocios en donde la estadstica
cumple una funcin muy especial es en la toma de
decisiones.- Cada ao, las empresas del mundo
arriesgan miles de millones de dlares en decisiones
importantes relacionadas con la expansin de la planta
productiva, el desarrollo de productos nuevos, la
captacin de personal, el control de la calidad, las
tcnicas de produccin, la seleccin de proveedores y
muchas ms.- Estas decisiones, casi siempre contiene
un elemento de incertidumbre.- Los competidores, el
gobierno, la tecnologa y el ambiente social y
econmico, junto con clientes y electores a veces
caprichosos, constituyen factores incontrolables que,
en ocasiones, pueden frustrar los planes mejor
trazados.-
Antes de tomar decisiones, a menudo las empresas
recolectan informacin a travs de una serie de pasos,
lo que se denomina, proceso de investigacin.-
Entre estos pasos estn:
1) Definir el problema en trminos especficos de forma
que la investigacin pueda dar resultados.-
2) Definir tipo de datos requeridos.-
3) Determinar de que forma se obtendrn los datos.-
4) Planificar la recoleccin de los datos y si es
necesario, la seleccin de una muestra.-
5) Recolectar y analizar los datos.-
6) Sacar conclusiones y elaborar un informe con los
resultados.-
7) Culminar con la toma de decisiones con base a los
resultados.-
Las investigaciones en los negocios y las encuestas,
sirven tanto a la estadstica descriptiva como a la
inferencia estadstica para mejorar las decisiones en
los negocios en diversas situaciones, incluyendo las
siguientes:

Un fabricante de automviles examina datos


relativos a los vehculos de los fabricantes
locales y encuentra que sus vehculos reciben
una evaluacin superior a la de los productos
de los competidores.- Esta informacin puede
ser til en la toma de decisiones relacionadas
con tcnicas de produccin y proveedores de
componentes.-
Un fabricante de un colonia para hombres piensa
contratar a un atleta profesional para anunciar su
producto en la televisin nacional.- Antes de decidir el
pago de los cuantiosos honorarios del atleta, la
compaa realiza un estudio para determinar el grado
en que el pblico objetivo reconoce al deportista y
cree en l.-

Antes de comenzar a negociar un nuevo contrato de


trabajo, los funcionarios de una empresa determinan
que los sueldos y las prestaciones de los empleados
ya son un 10% ms altos que los que reciben los
empleados que realizan funciones similares con un
importante competidor.- Tales datos pueden ser tiles
para el resultado final cuando los representantes de la
compaa elijan el punto de discusin en su
posicin negociadora.-
NECESIDAD
DE DATOS
Los datos pueden concebirse como informacin
numrica o no necesaria para ayudarnos a tomar
decisiones con fundamentos, en una situacin
particular.-

Un DATO, es el registro (numrico o no)


que se obtiene como resultado de
observar cierta caracterstica de inters
en un individuo (persona, animal, cosa o
entidad de naturaleza abstracta) que
constituye el objeto de estudio.-
Es en extremo importante empezar el
anlisis estadstico con la identificacin
de las fuentes de datos ms adecuadas.-
Si los datos presentan sesgos,
ambigedades u otro tipo de errores por
ms que apliquemos las ms sofisticadas
metodologas del anlisis estadstico, las
conclusiones a que lleguemos estarn mal
o sern muy deficientes.-
Para el anlisis estadstico, es importante
distinguir entre datos transversales y datos
longitudinales.-

Datos
longitudinales
Datos .
transversales. Son los datos de
Se renen al mismo series de tiempo, se
tiempo y bajo las coleccionan a lo
mismas condiciones.- largo de varios
perodos de
tiempo.-
LOS DATOS SE PUEDEN OBTENER
POR DOS TIPOS DE FUENTES

PRIMARIAS SECUNDARIAS
SECUNDARIAS
PRIMARIAS
DATOS PRIMARIOS.-
Son aquellos que se encuentran en la forma original en
que fueron registrados (datos brutos), sin haber sufrido
ningn tipo de tratamiento o elaboracin posterior.
Ejemplos: una encuesta, un censo.-

DATOS SECUNDARIOS.-
Son aquellos que fueron producidos (diseados y
recopilados) por terceros con un fin ajeno al de la
investigacin y que ya han sido sometidos a alguna
forma de elaboracin posterior.- En consecuencia,
estos datos siempre se originan en terceras fuentes.-
Ejemplo; los datos que publican las oficinas de
estadsticas de organismos oficiales, de empresas, etc.-
FUENTES PRIMARIAS .-
Los datos los podemos obtener
mediante dos tipos de estudios
estadsticos:

1.-Experimentales
2.- Observacionales
ESTUDIO EXPERIMENTALES.-
En un estudio experimental, primero se
identifican las variables de inters.- Luego se
identifican o controlan una o ms variables, de
modo que se pueda obtener datos de cmo
influyen en la variable de inters.- Por ejemplo,
una empresa farmacutica.-

ESTUDIO OBSERVACIONALES O NO
EXPERIMENTAL.-
En este tipo de estudios no se trata de
controlarlas variables de inters, ni de influir
sobre ellas.- Quiz los tipo ms comn de
estudios observacionales sean:
a) Realizacin de un CENSO.
b) Conduccin de una encuesta.-

Los estudios observacionales hoy se


presentan en formas muy variadas en
las empresas, principalmente en todo
lo referente a estudios grupales o la
importancia de los trabajos en equipo.-
Se hace hincapi en la Administracin
de la Calidad Total.-
Los administradores, economistas, etc, que deseen
emplear datos y anlisis estadstico como un apoyo para
la toma de decisiones deben considerar el tiempo y el
costo necesario para obtenerlos.-
Es preferible usar fuentes existentes cuando los datos se
deben recabar en un perodo relativamente corto.- Si no
se dispone de ellos fcilmente, es necesario tener en
cuenta el tiempo y el costo adicional para conseguirlos.-
En todo caso, quien toma la decisin debe pensar en la
contribucin del anlisis estadstico al proceso de toma
de decisiones.-
El costo de recopilar datos y su anlisis estadstico
posterior no debe ser mayor que los ahorros generados al
usar la informacin para determinar la mejor opcin.-
LA TOMA DE DECISIONES EN UN ENTORNO
INCIERTO

Las decisiones a menudo se basan en informacin


incompleta.- Por ejemplo, se supone que los estudiantes
universitarios de primer ao, cuando son admitidos en la
universidad, seleccionan una carrera.- Asimismo, las
decisiones empresariales normalmente se toman en un
entorno en el que los responsables de tomarlas no
pueden estar seguros de la futura conducta de los
factores que acabaran afectando al resultado de las
distintas opciones consideradas.-
Cuando un fabricante presenta una oferta para hacerse
con un contrato, no esta totalmente seguro de cuales
sern los costos totales ni de que ofertas presentaran los
competidores.-
A pesar de esta incertidumbre, debe hacer una oferta.- Un
inversor no sabe con seguridad si los mercados
financieros estarn en alzas, estables o deprimidos.- No
obstante, debe elegir las acciones, los bonos y los
instrumentos del mercado de dinero de manera que su
cartera este equilibrada sin saber como evolucionara el
mercado en el futuro.-
Consideremos las siguientes afirmaciones:
El precio de las acciones de IBM ser mas alto dentro de
seis meses que ahora.-
Si el dficit presupuestario publico es tan elevado como
se prev, los tipos de inters se mantendrn altos el resto
del ao,.
La renta anual de un titulado universitario ser mayor
que la renta de una persona que no tenga titulo
universitario.-
Cada una de estas afirmaciones contiene un lenguaje que
sugiere la existencia de una cantidad espuria de certeza.-
En el momento en que se hicieron las afirmaciones, era
importante estar seguro de que eran ciertas.- Aunque un
analista crea que lo que ocurrir en los prximos meses
ser tal que se prev que el precio de las acciones de IBM
subir durante ese periodo, no estar seguro de eso.- Por
lo tanto, las afirmaciones deben modificarse como
indican los siguientes ejemplos:
El precio de las acciones de IBM probablemente ser
mas alto dentro de seis meses que ahora.-
Si el dficit presupuestario publico es tan elevado como
se prev, es probable que los tipos de inters se
mantengan altos durante el resto del ao.-

La renta anual de un titulado universitario


probablemente ser mayor que la renta anual de una
persona sin estudios universitarios.-
Es muy importante pensar bien como se dicen las cosas.-
No es correcto sustituir las afirmaciones
injustificadamente precisas por afirmaciones
innecesariamente vagas.- Al fin y al cabo Qu significa
probablemente ? o es probable que?.- Debe ponerse
especial cuidado en expresar las ideas que se pretende
expresar, sobre todo cuando se trata de probabilidades o
cuando hay incertidumbre.-
PARA HACER EN CLASE

1.- Modificar las afirmaciones siguientes para que reflejen una


posible incertidumbre:

a) El mejor instrumento para mejorar la cuota de mercado de este


producto es una campaa publicitaria destinada al grupo de edad
18 a 24 aos.-
b) Si se presenta una oferta de esta cuanta, ser mas baja que las
del competidor y el contrato estar asegurado.-
c) El costo de la nafta Sper ser mas alto en Argentina dentro de
dos meses.-

2.- Ponga un ejemplo de una decisin de comercializacin que debe


tomarse en condiciones de incertidumbre.-

3.- Ponga un ejemplo de una decisin financiera que debe tomarse en


condiciones de incertidumbre.-
EL MUESTREO.-

Antes de introducir un nuevo producto en el mercado, su


fabricante quiere saber cual ser el nivel probable de
demanda y es posible que realice una encuesta de
mercado.- Lo que le interesa, en realidad son todos los
compradores potenciales (la poblacin).- Sin embargo,
las poblaciones a menudo son tan grandes que es difcil
analizarlas; seria imposible o prohibitivo recoger toda la
informacin de una poblacin.- Incluso en las
circunstancias en las que parece que se dispone de
suficientes recursos, las limitaciones de tiempo obligan a
examinar un subconjunto de ella (muestra).-
Nuestro objetivo final es hacer afirmaciones basadas en
datos muestrales que tengan alguna validez sobre la
poblacin en general.- Necesitamos, pues, una muestra
que sea representativa de la poblacin.-
Como podemos lograrlo?.- Uno de los principios
importantes que debemos seguir en el proceso de la
muestra es la aleatoriedad .-
El muestreo aleatorio simple es un mtodo que se
emplea para seleccionar una muestra de n objetos de una
poblacin en el que cada miembro de la poblacin se
elige estrictamente al azar, cada miembro de la poblacin
se elige con la misma probabilidad y todas las muestras
posibles de un tamao dado n, tienen la misma
probabilidad de ser seleccionadas.- Este mtodo es tan
frecuente que generalmente se denomina muestra
aleatoria.-
El muestreo se utiliza mucho en todas las reas de los
negocios, as como en otras disciplinas.- Para averiguar
si un proceso de produccin esta funcionando
correctamente, se selecciona una muestra de bienes
producidos.-
Las auditorias de las cuentas pendientes de cobro
generalmente se basan en una muestra.- Durante los aos
de elecciones presidenciales se hacen estimaciones de
las preferencias de los votantes a partir de muestras de
votantes, tambin puede hacerse una encuesta a la salida
de los colegios electorales para predecir que candidato
obtendr mas votos.-
Sin embargo, tomar una muestra es meramente un medio
para llegar a un fin.- Necesitamos estudiar estadstica, no
para hacer afirmaciones sobre la muestra sino, mas bien,
para extraer conclusiones sobre la poblacin en general.-
La estadstica es el estudio de cmo se toman decisiones
sobre una poblacin cuando la informacin procede de
una muestra.- Siempre quedara alguna incertidumbre.-
Supongamos que queremos saber cual es la edad media
de los votantes de un pas.- Es evidente que la poblacin
es tan grande que solo podramos tomar una muestra
aleatoria, por ejemplo, 500 votantes y calcular su edad
media.- Como esta media se basa en datos muestrales se
llama estadstico .- Si pudiramos calcular la media de
toda la poblacin, la media resultante se llamara
parmetro.- Mas adelante veremos como se toman
decisiones sobre un parmetro, basndose en un
estadstico.-
Debemos darnos cuenta de que siempre habr una cierta
incertidumbre, ya que no se conoce el valor exacto del
parmetro.-

DESPUES DE LO EXPRESADO
PODEMOS RESUMIR DICIENDO:
Muy frecuentemente es necesario seleccionar una muestra y en base
a sta, extraer conclusiones respecto de la poblacin.-

Una muestra estadstica es un subconjunto de


la poblacin.- Se la simboliza con n.-
N
x x
x x x x
x x
x x x
x x x x
x x
xxx x x x x
x x x
x x x x x x
x x x x x
x x x x x n
x x x x x
La seleccin de una muestra representativa es un
problema importante en la investigacin estadstica ya
que sta puede proporcionar una visin til de la
naturaleza de la poblacin que se estudia, mientras que
una muestra no representativa puede sugerir
conclusiones totalmente errneas sobre la poblacin.-

El punto esencial en el muestreo es estar seguro de que


los elementos de la muestra representan a la poblacin
tan fielmente como sea posible.- Por lo general, esta
tarea es ms difcil de lo que parece.- Con frecuencia
debe dedicarse mucho tiempo y atencin al proceso de
seleccin, ya que una vez medidos los elementos se
supondr que la muestra es representativa de la
poblacin.-
METODOS DE SELECCIN DE LA MUESTRA

Existen dos mtodos bsicos para seleccionar los


elementos de una poblacin:

Si cada elemento de la poblacin tiene la misma


posibilidad de ser elegido, esto constituye una
muestra aleatoria .-

Si algunos elementos de la poblacin tienen mayores


posibilidades de seleccin que otros, esto constituye
una muestra no aleatoria .-

Estos dos mtodos tambin se conocen con el nombre


de muestras probabilsticas y muestras no
probabilsticas.-
MUESTRA ALEATORIA SIMPLE.-
Una muestra aleatoria simple, es aquella en la cual cada
individuo o elemento de una poblacin tiene la misma
oportunidad de ser elegido.- Adems, cada muestra de
un tamao fijo tiene la misma probabilidad de ser
elegida, que cualquier otra muestra del mismo tamao.-
El muestreo aleatorio simple, es la tcnica de muestreo
aleatorio ms elemental y constituye la base para otras
tcnicas.-
En el muestreo aleatorio simple, se usa n para
representar el tamao de la muestra y N para representar
el tamao de la poblacin.- Cada persona o elemento en
el marco se enumera de 1 a N.-
La probabilidad de seleccionar a cualquier miembro en
particular de la poblacin la primera vez es igual a 1/N.-
Existen dos mtodos bsicos para seleccionar muestras:

Con
C on
reeem
re plaazo
mpl zo

Sin
Sin
reemplazo
reemplazo
El muestreo con reemplazo , implica que una vez
seleccionada una persona o elemento, se regresa al
marco donde tiene la misma probabilidad de ser elegida
de nuevo.- Imagine que tiene una urna con 500 tarjetas de
presentacin.- Suponga que en el primer sorteo sale la
ficha de Juan Llanos.- La informacin pertinente se
registra y se regresa la tarjeta a la urna.- Despus se
mezclan bien las tarjetas y se saca una segunda tarjeta,.
En esta segunda extraccin Juan Llanos, tiene la misma
probabilidad de salir 1/N, de ser elegida de nuevo.- Se
repite el procedimiento hasta alcanzar el tamao muestra
n deseado.- Sin embargo, suele considerarse ms
adecuado tener una muestra de personas o elementos
diferentes en lugar de permitir la repeticin de
mediciones de la misma persona o elemento.-
En el muestreo sin reemplazo , no se regresa la
persona o elemento al marco una vez seleccionado y por
lo tanto, no puede elegirse otra vez.- Como antes, en el
muestreo sin reemplazo la probabilidad de que algn
miembro especfico de la poblacin, por ejemplo Juan
Llanos, sea elegido en el primer intento es 1/N.- La
probabilidad de que, cualquier individuo no
seleccionado, salga elegido en el segundo intento ser 1 /
N-1.- Este proceso continua hasta alcanzar el tamao de
muestra n deseado.-

Sin importar si el muestreo es con o sin reemplazo,


los mtodos de urna para elegir una muestra tienen
un gran inconveniente: la habilidad para revolver
perfectamente las tarjetas y elegir la muestra en
forma aleatoria.- Como resultado, los mtodos de
urna no son muy tiles.- Son preferibles otros
mtodos de seleccin con menos problemas y
mejor base cientfica.-
Uno de estos mtodos utiliza una TABLA DE
NUMEROS ALEATORIOS , para obtener la
muestra.- Una tabla de nmeros aleatorios esta
formada por una serie de dgitos que se generan
en forma aleatoria y se colocan en la secuencia
en que se generaron.- Hay muchas tablas de
nmeros aleatorios, como la que veremos en
prctica.- De hecho, lo normal es que los
investigadores antes de usar una tabla de
nmeros aleatorio verifiquen la aleatoriedad de
los dgitos generados antes de emplearlos.-
Debido a que cada dgito o secuencia de dgitos
de la tabla es aleatorio, se puede leer en sentido
horizontal o vertical.-
Para usar una tabla como la que vemos en prctica en
lugar de una urna para seleccionar una muestra,
primero debemos asignar nmeros de cdigos a los
miembros individuales de la poblacin.- Entonces se
obtiene la muestra aleatoria leyendo la tabla y
seleccionando los elementos del marco de poblacin
cuyos nmeros de cdigo coinciden con los dgitos
encontrados en la tabla.- Para entender mejor, hagamos
un ejemplo con el curso.-
Hoy gracias a los avances de los paquetes estadsticos
de PC, las tablas se usan menos.- Los programas tienen
una secuencia para generar los nmeros aleatorios que
se necesita.-
ESTADISTICO Y PARAMETRO.-

Un estadstico es cualquier caracterstica numrica de una


muestra.-
Un parmetro es cualquier caracterstica numrica de una
poblacin.-

Por ejemplo, en un estudio realizado en 2007 por cierta Consultora


sobre la moda de compras en supermercados, una muestra de
respuestas dadas por los compradores revel que el promedio de
consumo familiar de alimentos por semanas era de 280 pesos.- Ese
promedio es un ejemplo de estadstico.- Si por ejemplo del mismo
estudio se revelo que la permanencia de las personas en el recorrido
para sus compras tiene un promedio de 80 minutos, este tambin es
un ejemplo de estadstico.-
Si en cambio les preguntamos a todos los clientes del supermercado
la cantidad de viajes al supermercado por mes que realiza y este nos
da un promedio de 3 viajes, este valor es un ejemplo de parmetro, ya
que la consulta se hizo a toda la poblacin.-
EJERCICIOS PARA HACER EN CLASE

1.- Ponga un ejemplo de un parmetro en cada una de las


siguientes poblaciones:

a) La rentas de todas las familias que viven en una


ciudad.-
b) Los rendimientos anuales de todas las acciones que
cotizan en una bolsa de valores.-
c) Los costos de todas las reclamaciones que recibe en
un ao dado una compaa de seguros mdicos.-
d) Los valores de todas las cuentas pendientes de cobro
de una empresa.-
2.- Su universidad ha encuestado a sus estudiantes para averiguar el
tiempo semanal medio que dedican a navegar por Internet.-
a) Cul es la poblacin?.-
b) Cul es la muestra?.-
c) Cual es el estadstico?.-
d) Es el valor de 6,1 horas un parmetro o un estadstico?.-

3.- Una compaa area sostiene que menos de un 1 % de los vuelos


programados que despegan del aeropuerto de Ezeiza sale tarde.-
Se ha observado que el 1,5 por ciento de una muestra aleatoria de
200 vuelos salio mas tarde de la hora prevista.-
Cul es la poblacin?.-
Cul es la muestra?.-
Cual es el estadstico?.-
Es el valor 1,5 por ciento un parmetro o un estadstico?.-
PRESENTACION DE
DATOS ESTADISTICOS

COMO HEMOS DICHO, AL


PLANTEARNOS UN ESTUDIO
ESTADISTICO Y OBTENER LOS
DATOS NECESARIOS, NOS
ENCONTRAMOS QUE PODEMOS
ESTUDIAR VARIABLES
CATEGRICAS Y/O
NUMRICAS
PRESENTACION
PRESENTACION DEDE
VARIABLE
VARIABLE CATEGORICA
CATEGORICA
EN
EN TABLAS
TABLAS Y
Y
GRAFICOS.-
GRAFICOS.-
NOS PREGUNTAMOS CUANTAS
VARIABLES MOSTRAMOS

1 var + 2 var 2 var


TABLA TABLA DE
SUPERTABLA
RESUMEN CONTINGENCIA

CUADRO
ESTADISTICO

PORCENTAJES
DEL TOTAL, DE FILAS
GRAFICOS Y DE COLUMNAS
PARTES DE UN CUADRO ESTADISTICO

TITULO
NOTA DE
CALCE

Encabezado
y
sub.-
encabezado
CUERPO
Columna
Matriz o
concepto
FUENTE

Nota al pie
1.-TITULO.- Se coloca siempre sobre el cuadro, ya que
leemos de arriba hacia abajo.- Si el titulo es muy largo,
se coloca en forma de pirmide truncada.-
Un titulo debe responder a cuatro preguntas bsicas:
QUE?, que es lo que queremos mostrar.-
DONDE?, se refiere al lugar donde fueron obtenidos.-
COMO?, se refiere a como queremos mostrar los datos.-
CUANDO?, hace referencia cuando fueron obtenidos los
datos.-

2.-ENCABEZADO Y
SUBENCABEZADOS .- Son las
denominaciones de las columnas y responde al
Como del titulo.- Una columna puede tener
3.-COLUMNA MATRIZ O CONCEPTO .-
Son las denominaciones de la filas.- Responde
tambin al Como del titulo.-

4.-CUERPO .- Son las diversas casillas donde


se colocan los datos.-

5.-FUENTE .- Nos indica la institucin,


investigacin o el texto de donde provienen los
datos.- Nos sirve para saber donde consultar, si
queremos ms informacin o si deseamos
presentar alguna disconformidad o aclaracin.-
Las cinco partes mencionadas nunca deben faltar al
elaborarse un cuadro estadstico.- Hay dos partes
restantes que pueden ir o no segn el cuadro
estadstico que elaboremos.-

NOTA DE CALCE .- Se coloca entre el titulo y


el cuadro estadstico, hace referencia a como
debemos leer los datos del cuerpo del cuadro.-
Por ejemplo, (en %), (en miles), etc.-

NOTA AL PIE .- Hace referencia a como leer


algunos smbolos que pueden aparecer en el
cuerpo del cuadro, por ejemplo, (-) dato no
relevado, (*) dato estimado, etc.-
CUADRO RESUMEN. Ejemplo
Supongamos que se selecciono en la Universidad una muestra al
azar de 120 alumnos en Marzo 2008 y se les pregunto en que
carrera estaban inscriptos.- Resulto la siguiente tabla:

Matricula de la UNLAR segn carreras.


Frecuencia
Marzo 2008
absoluta
CARRERA TOTAL
Contador 28
Psicopedagoga 11
Sistema 23
Medicina 19
Arquitectura 15
Abogaca 24
TOTAL 120
Fuente: Elaboracin propia
Matricula de la UNLAR segn carreras.
Marzo 2008
CARRERA TOTAL % del total
Contador 28 23,3
Psicopedagoga 11 9,2
Frecuencia
Sistema 23 19,2
Medicina 19 15,8 Relativa %
Arquitectura 15 12,5
Abogaca 24 20,0
TOTAL 120 100,0
Fuente: Elaboracin propia
Matricula de la UNLAR segn carreras.
Marzo 2008

Abogaca

Arquitectura
Medicina
Sistema

Psicopedagoga
Contador
0 5 10 15 20 25 30
Matricula de la UNLAR segn carreras.
Marzo 2008

20% 23%

13% 9%

16% 19%

Contador Psicopedagoga Sistema


Medicina Arquitectura Abogaca
Supongamos que tenemos un cuadro resumen donde
mostramos datos para tres tiempos diferentes, por
ejemplo:

Total de alumnos matriculados en la UNC, en tres


especialidades de Administracin de Empresa.- Aos
2006, 2007 y 2008

Especialidad 2006 2007 2008


Finanzas 82 120 100
Marketing 114 135 156
Contabilidad 56 100 85
TOTAL 252 355 341

Fuente: UNC
Si queremos explicar el cuadro, podremos mostrar lo
siguiente:

Total de alumnos matriculados en la UNC, en tres


especialidades de Administracin de Empresa.- Aos
2006, 2007 y 2008

En %

Especialidad 2006 2007 2008


Finanzas 32,5 33,8 29,3
Marketing 45,2 38,1 45,7
Contabilidad 22,2 28,1 25,0
TOTAL 100,0 100,0 100,0
Fuente: UNC
Total de alumnos matriculados en la UNC, en tres
especialidades de Administracin de Empresa.-
Aos 2006, 2007 y 2008

100%
90%
80%
70%
60% Contabilidad
50% Marketing
40%
Finanzas
30%
20%
10%
0%
2006 2007 2008

Fuente: UNC
Total de alumnos matriculados en la UNC, en tres
especialidades de Administracin de Empresa.-
Aos 2006, 2007 y 2008
Total de alumnos matriculados en la UNC, en tres
especialidades de Administracin de Empresa.-
Aos 2006, 2007 y 2008
TABLA DE CONTINGENCIA.-
Supongamos que ahora a la muestra de estudiantes se observo el
sexo y se registro la informacin:

Carrera Sexo TOTAL


Varn Mujer
Contador 16 12 28 Frecuencias
Psicopedagoga 3 8 11 absolutas
Sistemas 13 10 23 conjuntas
Medicina 15 4 19

Arquitectura 5 10 15
Abogaca 17 7 24 Frecuencias
TOTAL 69 51 120 absolutas
marginales
Matricula de la UNLAR por carreras y sexo. Marzo 2008.-

Abogaca

Arquitectura

Medicina Mujeres
Sistemas Varones

Psicopedagoga

Contador

0 5 10 15 20
Analizamos una tabla de contingencia, segn lo que queramos
explicar.-

Porcentajes segn las carreras que cursan.-

CARRERAS SEXO TOTAL


Varn Mujer
Contador 57,0 43,0 100,0
Psicopedagoga 27,3 72,7 100,0
Sistemas 56,5 43,5 100,0
Medicina 78,9 21,1 100,0
Arquitectura 33,3 66,7 100,0
Abogaca 70,8 29,2 100,0
TOTAL 57,5 42,5 100,0
MATRICULA DE LA UNLAR SEGN CARRERA
YSEXO
AO 2008
(EN %)
MATRICULA DE LA UNLAR SEGN CARRERA
YSEXO
AO 2008
(EN %)
Porcentajes segn el sexo del alumnado

CARRERAS SEXO TOTAL


Varn Mujer
Contador 23,4 23,5 23,3
Psicopedagoga 4,3 15,7 9,2
Sistemas 18,8 19,6 19,2
Medicina 21,7 7,8 15,8
Arquitectura 7,2 19,6 12,5
Abogaca 24,6 13,7 20,0
TOTAL 100,0 100,0 100,0
MATRICULA DE LA UNLAR SEGN SEXO Y
CARRERA
AO 2008
(EN %)
Porcentajes segn el total general

CARRERAS SEXO
Varn Mujer
Contador 13,3 10,0
Psicopedagoga 2,5 6,7
Sistemas 10,8 8,3
Medicina 12,5 3,3
Arquitectura 4,2 8,3
Abogaca 14,2 5,8
MATRICULA DE LA UNLAR SEGN TOTAL GENERAL
POR CARRERA Y SEXO
AO 2008
(EN %)
EJERCICIO PARA DISCUTIR EN CLASE
Demanda de un producto por zonas

Un minorista de materiales de construccin ha estado


estudiando un plan para abrir sucursales en nuevos
lugares dentro de su programa de expansin regional.-
En una ciudad propuesta para la expansin hay tres
lugares posibles; norte, este y oeste.- El minorista sabe
por experiencia que los tres mayores centros de
beneficios de sus negocios son los de herramientas,
madera y pintura.- Para seleccionar un lugar, son
importantes las pautas de demanda de las diferentes
partes de la ciudad.- Ha pedido, pues, ayuda al
departamento de estudios de mercado para obtener y
analizar los datos relevantes.- Este minorista cree que
tiene una ventaja comparativa en la venta de
herramientas.-
a) Comente como hara el relevamiento de la informacin.- De
sugerencias.-
b) El Departamento de estudios de mercado selecciono una
muestra aleatoria de 750 hogares, con 250 en cada una de las
zonas.- Surge la siguiente tabla de contingencia (3 x 4) de las
variables lugar residencial y producto comprado.-
c) Analice toda esta informacin y comente como lo mostrara
grficamente.-

Este Norte Oeste TOTAL


Herramienta 100 50 65 215
Madera 50 95 70 215
Pintura 50 45 75 170
Ninguno 50 60 40 150
TOTAL 250 250 250 750
Este Norte Oeste TOTAL
Herramienta 13,33% 6,67% 8,67% 29%
Madera 6,67% 12,67% 9,33% 29%
Pintura 6,67% 6,00% 10,00% 23%
Ninguno 6,67% 8,00% 5,33% 20%
TOTAL 33% 33% 33% 100%
ALGUNOS TIPOS DE GRFICOS ESTADISTICOS

DE BARRAS DE SECTOR LINEALES PICTOGRAMAS

VERTICALES SIMPLES

HORIZONTALES DOBLES

COMPUESTAS

SUBDIVIDIDAS
Veamos algunos grficos para interpretar en
clase.-

Pie Chart of Frecuencia vs Curso


Porcentaje
Category
Primer Primer ao
3,2%
Ao 3,2% Segundi ao
Tercer ao
14,6%
Cuarto ao
Segundo 28,0% Quinto ao
Ao 14,6% Recibidos

Tercer
Ao 18,5%
Cuarto 18,5%
Ao 12,7%
Quinto
Ao 22,9%
22,9%
Recibidos 28% 12,7%

TOTAL 99,9%
NO USAR este tipo de Grafico
Chart of Curso
30

25

20
Percent

15

10

0
Cuarto ao Primer ao Quinto ao Recibidos Segundi ao Tercer ao
Curso
Percent within all data.
SI USAR este tipo de Grafico
MONTO VENTAS
Enero 10500
Febrero 8300
Marzo 17500
Abril 15200
Mayo 13000
Junio 8000
Julio 10300
Agosto 12000
Septiembre 11000
Octubre 16000
Noviembre 15000
Diciembre 19000
Scatterplot of Montos de Ventas vs Meses
20000

18000
Montos de Ventas

16000

14000

12000

10000

8000

Enero Marzo Mayo Julio Septiembre Noviembre


Meses
Scatterplot of ao 2006. ao 2007 vs Meses
20000 Variable
ao 2006
ao 2007
18000

16000
Y-Data

14000

12000

10000

8000

Enero Marzo Mayo J ulio Septiembre Noviembre


Meses
PRINCIPIOS DE
EXCELENCIA
GRAFICA
Hasta ahora hemos analizado como presentar un conjunto de
datos en forma de tablas y grficos cuando las variables que se
observan son variables categricas.- Entre los mtodos para
describir y comunicar informacin estadstica, las presentaciones
grficas bien diseadas por lo general son ms sencillas y
poderosas.- Las buenas exposiciones grficas revelan lo que
transmiten los datos.-
Para que el anlisis mejore con la presentacin visual de los datos,
es esencial que las tablas y los grficos tengan una presentacin
cuidadosa y clara.- Todo lo innecesario debe eliminarse para no
ocultar el mensaje que contienen los datos.-
El amplio uso de las hojas de clculo y de software grfico ha
llevado a una proliferacin de grficas en los ltimos aos.-
Aunque muchas de las grficas presentadas sirven como
representaciones tiles de los datos, por desgracia la naturaleza
impropia e inadecuada de muchas presentaciones ha perjudicado
la comprensin y el anlisis de las mismas.-
El profesor Edward R. Tufte, es quien escribi una serie de libros que
describen los mtodos adecuados de diseos de grficos
estadsticos.- El considera que las caractersticas bsicas
esenciales de una representacin grfica adecuada
incluyen:

1.- Mostrar los datos.-


2.- Hacer que el observador se concentre en lo
sustancial de la grfica y no en como se desarrollo.-
3.- Evitar distorsiones.-
4.- Facilitar la comparacin de los datos.-
5.- Cumplir con un objetivo claro.-
6.- Que est integrada con las descripciones
estadsticas y verbales de la grfica.-
Tufte establece cinco principios de excelencia
grfica que son:

1.- La excelencia grfica es una presentacin bien


diseada de los datos que proporciona sustancia,
estadstica y diseo.-
2.- La excelencia grfica comunica ideas complejas con
claridad, precisin y eficiencia.-
3.- La excelencia grfica proporciona al observador el
mayor nmero de ideas en el menor tiempo y con el
mnimo de tinta.-
4.- La excelencia grfica casi siempre involucra varias
dimensiones.-
5.- La excelencia grfica requiere decir la verdad acerca
de los datos.-
Una caracterstica principal de la excelencia grfica es la
importancia que tiene el evitar usar una grfica para
distorsionar los datos que representa.-
Una grfica no distorsiona si su presentacin visual es
consistente con su representacin numrica.- La cantidad
de distorsin puede medirse con el factor mentira.- El
factor mentira, es la razn del tamao del efecto que
muestra la grfica con respecto al tamao de los efectos
que muestran los datos.-
Un principio incluido aqu es que cualquier variacin en el
diseo de una grfica debe ser consistente con las
variaciones que presentan los datos.- Con frecuencia, los
cambios en la grfica no son consistentes con las
variaciones en los datos y se produce una distorsin entre
lo que representan los datos y lo que muestra la grfica.-
Esto se da en general cuando usamos grficas de
pictogramas.-
En resumen :
Somos consumidores activos de la informacin
que escuchamos o vemos cada da en los
distintos medios de comunicacin.- Debido a
que mucho de lo que se escucha o se lee es
basura, necesitamos aprender a evaluar en
forma crtica y desechar lo que no tiene un
valor real.- Tambin es imperativo tener en
cuenta que a veces la basura que se presenta
est fundamentada en la ignorancia; otra veces;
es planteada y maliciosa.- Lo importante es
analizar y dudar de la informacin
proporcionada.-
EJERICICIOS PARA HACER EN CLASE

1.- Los gastos de viaje de una empresa son:

Concepto Porcentajes
Compaas areas 41.0
Alojamiento 25.0
Comidas 12.0
Alquileres de automviles 18.0
Otros 4.0

a) Construya un grfico de sectores.- Explique


b) Construya un grfico de barras.- Explique
2.- Se le ha pedido a los empleados que indiquen su grado
de satisfaccin con el seguro mdico actual.- Estas son
las respuestas de una muestra aleatoria de empleados:

Concepto frecuencia
Muy satisfechos 29
Moderadamente satisfecho 55
Ninguna opinin 5
Moderadamente insatisfecho 20
Muy insatisfecho 0

a) Trace un grfico de barras.- Explique


b) Trace un grfico de sectores y explique.-
3.- El supervisor de una planta ha obtenido una muestra
aleatoria de las edades de los empleados y del tiempo que
tardan en realizar una tarea (en segundos).-
a) Elabore un cuadro completo en valores relativos en
funcin de las edades.-
b) Represente los datos originales con un grfico de
barras compuestas.- Explique.-

Edades Tiempo
Menos de 40 Entre 40 y menos Un minuto como
segundos de 60 segundos mnimo
Menos de 21 10 13 25
21 a menos de 35 16 20 12

35 a menos de 50 18 22 8
50 Aos o ms 10 27 19
4.- Suponga usted que segn una estimacin del gasto
pblico, el 46 por ciento se destina a pensiones, el 18 por
ciento a defensa, el 15 por ciento a regiones y municipios,
el 14 por ciento a intereses de la deuda, el 6 por ciento a
otros gastos de la administracin central y el 1 por ciento
al seguro de depsito.- Represente grficamente esta
informacin mediante un grfico de sectores.-

5.- Tres subcontratistas A, B y C suministraron 58, 70 y 72 piezas


respectivamente a una planta la semana pasada.- De las piezas
suministradas por el subcontratista A, solo cuatro estaban
defectuosas.- De las suministradas por el B, 60 estaban bien, de las
suministradas por el C solo seis estaban defectuosas.-
a) Presente estos datos en una tabla (con todas sus partes).-
b) Elabore un cuadro completo en valores relativos teniendo en
cuenta los Subcontratistas.-
c) Muestre esta informacin en un grafico (segn corresponda).-
6.- Retomando el ejercicio de demanda de un producto,
suponga que los datos de la encuesta de mercado no
fueron los de la tabla que vimos sino los de la tabla
siguiente.- Explique las conclusiones de esta encuesta
desde el punto de vista de la estrategia de produccin.-

Zona Herrami Madera Pintura Ninguno Total


entas
Este 100 40 60 50 250
Norte 70 45 95 40 250
Oeste 75 70 65 40 250
Total 245 155 220 130 750
DIAGRAMA
DE
PARETO
Los directivos que necesitan identificar las principales
causas de los problemas e intentar corregirlas
rpidamente con un costo mnimo a menudo utilizan un
grafico de barras especial llamado diagrama de Pareto
El economista italiano Vilfredo Pareto (1848-1923)
sealo que en la mayora de los casos un pequeo
numero de factores es responsable de la mayora de los
problemas.- Ordenamos las barras de un diagrama de
Pareto de izquierda a derecha para poner nfasis en las
causas mas frecuentes de los defectos.-

Un diagrama de Pareto es un grafico de barras de las


causas de los defectos.- La barra de la izquierda indica
la causa mas frecuente y las de la derecha indican las
causas con frecuencias decreciente.- Los diagramas de
Pareto se utilizan para separar lo poco vital de lo
mucho trivial.-
El resultado de Pareto se aplica a una amplia variedad
de conductas en muchos sistemas.- A veces se
denomina regla de 80-20, por ejemplo un fabricante de
cereales puede observar que la mayora de los errores
de empaquetado se deben nicamente a unas cuantas
causas.- Un estudiante podra pensar que el 80 por
ciento del trabajo de un proyecto de grupo ha sido
realizado nicamente por el 20 por ciento de los
miembros del equipo.-
La utilizacin de Pareto tambin puede mejorar la
comunicacin con los empleados o con la direccin y
dentro de los equipos de produccin.-

Veamos el uso de Pareto aplicado a un


problema de una compaa de seguros
mdicos.-
Errores de tramitacin de las reclamaciones a un seguro.-

El anlisis y pago de las reclamaciones a un seguro es


un complejo proceso que puede llevar a tramitar
incorrectamente algunas reclamaciones.- Estos errores
provocan un aumento del tiempo que dedica el personal
a obtener informacin correcta y posiblemente a pagar
indemnizaciones indebidas.- El beneficiario
normalmente detecta los errores cuando cobra una
indemnizacin menor a la debida y a menudo puede
pasar por alto indemnizaciones superiores a las
debidas.- Estos errores pueden incrementar
considerablemente los costos, adems de afectar
negativamente a las relaciones con los clientes.- Se
realizan considerables esfuerzos para analizar la
actividad de presentacin y de tramitacin de las
reclamaciones con el fin de poder desarrollar mtodos
para reducir lo mas posibles los errores.-
Una importante compaa de seguros mdicos se fijo el
objetivo de reducir un 50 por ciento los errores.-
Muestre como utilizara el anlisis de Pareto para ayudar
a averiguar los factores importantes que contribuyen a
eliminar los errores.-
Solucin

La compaa de seguros mdicos realizo una intensa


investigacin de todo el proceso de presentacin de
reclamaciones y pago de indemnizaciones.- Se
selecciono un equipo de personas clave de los
departamentos encargados de tramitar reclamaciones,
de relaciones con los proveedores y de marketing, de
auditoria interna, de procesamiento de datos y de
revisiones medicas.-
Basndose en su experiencia y en una revisin del
proceso, los miembros del equipo llegaron finalmente a
un acuerdo sobre una lista de posibles errores.- tres de
ellos (cdigos de procesamiento y diagnostico,
informacin de los proveedores e informacin de los
pacientes) estn relacionados con el proceso de
presentacin de reclamaciones y deben comprobarse
revisando los historiales mdicos de los pacientes en
las clnicas y los hospitales.- Tres posibles errores
(tablas de precios, solicitudes de contratos y ajuste de
los proveedores) estn relacionados con la tramitacin
de las reclamaciones de indemnizacin dentro de la
oficina en la compaa de seguros.- Los errores de los
programas y de los sistemas estn incluidos en la
categora Otros.-
Se puso en marcha una auditoria completa de una
muestra aleatoria de 120 reclamaciones contrastando
cada reclamacin con los historiales mdicos de las
clnicas y los hospitales hasta llegar a la fase final del
pago de la indemnizacin.- Se separaron las
reclamaciones que contenan errores y se anoto el
numero de errores de cada tipo.- Si una reclamacin
tenia mltiples errores, se anotaron todas.- En este
proceso se tomaron muchas decisiones sobre la
definicin de error.-
Si se haba dado a un nio un tratamiento que se daba
normalmente a los adultos y el sistema informtico de
procesamiento no lo detecto, este error deba registrase
como un error 7 (errores de los programas y de los
sistemas) y tambin como un error 3 (informacin de los
pacientes).-
Si el tratamiento de un esguince estaba codificado como
una fractura, deba registrarse un error 1 (cdigo de
procedimiento y diagnostico).- A continuacin se
elaboro una tabla de distribucin de frecuencia de las
categoras y el numero de errores cometidos en cada
categora:

Categoras Tipos de errores Frecuencia


1 Cdigo de procedimiento y 40
diagnostico
2 Informacin del proveedor 9
3 Informacin del paciente 6
4 Tabla de precios 17
5 Solicitudes de contratos 37
6 Ajuste de los proveedores 7
7 Otros 4
Vemos en la figura anterior , que cuando se van
sumando los porcentajes de defectos correspondientes a
los tipos de error (de izquierda a derecha), el ascenso de
la lnea de frecuencias acumuladas indica la mejora
relativa que se obtendra corrigiendo cada uno de los
problemas mas frecuentes.-
En el diagrama de Pareto, los analistas vieron que el
error 1 (cdigo de procedimiento y diagnostico) y el error
5 (solicitudes de contratos) eran las principales causas
de errores.- La combinacin de los errores 1, 5 y 4 (tablas
de precios) provocaba casi un 80 por ciento de los
errores.- Examinando el diagrama de Pareto de la figura
anterior, los analistas pueden averiguar rpidamente a
que causas debe dedicarse la mayor parte de los
esfuerzos para corregir los problemas.- El anlisis de
Pareto separo las pocas causas vitales de las muchas
triviales.-
Con esta informacin, el equipo hizo una serie
de recomendaciones para reducir los errores
y controlar el proceso.-
1) Se haran sesiones especiales de formacin
para los encargados de tramitar las
reclamaciones de los hospitales y clnicas.-
2) Se haran auditorias aleatorias por sorpresa
para verificar los errores de codificacin.-
3) Se evaluara la posibilidad de imponer
sanciones monetarias a las organizaciones
que cometieran excesivos errores.-
4) Dos personas prepararan cada una por
separado el conjunto completo de tablas de
solicitud de contrato.- A continuacin, se
compararan todas las entradas de las tablas
utilizando un programa informtico y se
resolveran las diferencias que hubiera.-
5) Se preparara unos modelos tipo de
reclamacin que se utilizaran para verificar las
solicitudes correctas de contrato.-

El diagrama de Pareto, y las recomendaciones ayudaron


a reducir los errores.- Se redujeron los casos en los que
se pagaban indemnizaciones de mas, as como la
burocracia necesaria para corregir los errores.-
VEAMOS
VEAMOS OTRO
OTRO
EJEMPLO
EJEMPLO
DE
DE USO
USO DEL
DEL
DIAGRAMA
DIAGRAMA DEDE
PARETO
PARETO
Usted es el Analista de Sistemas encargado de mantener la Base de Datos
de una empresa que fabrica heladeras, ante la gran cantidad de quejas, le
comenta al Gerente que le pida a los Ingenieros que deben analizar cuales
son los defectos ms frecuentes que aparecen en las unidades al salir de la
lnea de produccin.- Para esto, empezaron por clasificar todos los defectos
posibles en sus diversos tipos:

TIPOS DE DEFECTOS DETALLE DEL PROBLEMA


Motor no detiene No para el motor cuando alcanza temperatura
No enfra El motor arranca pero la heladera no enfria
Burlete defectuoso Burlete roto o deforme que no ajusta
Pintura defectuosa Defectos de pintura en superficie externa
Rayas Rayas en las superficies externas
No funciona Al enchufar no arranca el motor
Puerta no cierra La puerta no cierra correctamente
Gavetas defectuosa Gavetas interiores con rajaduras
Motor no arranca El motor no arranca despus de ciclo de parada
Mala nivelacin La heladera se balancea y no se puede nivelar
Puerta defectuosa Puerta del refrigerador no cierra hermticamente
Otros Otros defectos no incluidos en los anteriores
Posteriormente un inspector revisa cada heladera que sale de
produccin registrando sus defectos de acuerdo con dichos tipos, .-
Despus de inspeccionar 88 heladeras se obtuvo una tabla como
esta:

TIPO DE DEFECTO DETALLE DEL PROBLEMA Frec.


Burlete defectuoso Burlete roto o deforme que no ajusta 9
Pintura defectuosa Defectos de pintura en superficie exterior 5
Gavetas defectuosas Gavetas interiores con rajaduras 1
Mal Nivelacin La heladera se balancea y no se puede cerrar 1
Motor no arranca El motor no arranca despus de ciclos de paradas 1
Motor no se detiene No para el motor cuando alcanza temperatura 36
No enfra El motor arranca pero la heladera no enfra 27
No funciona Al enchufar no arranca el motor 2
Otros Otros defectos no incluidos en los anteriores 0
Puerta defectuosa Puerta del refrigerador no cierra hermticamente 0
Puerta no cierra La puerta no cierra correctamente 2
Rayas Rayas en la superficie externas 4
TOTAL 88
La ltima columna muestra el nmero de heladeras que presentaban
cada tipo de defectos, es decir, la frecuencia con que se presenta
cada defectos.- En lugar de la frecuencia numrica utilizar la
frecuencia porcentual, es decir, el % de heladeras en cada tipo de
defectos:
TIPO DE DEFECTO DETALLE DEL PROBLEMA Frec. Frec.%
Burlete defectuoso Burlete roto o deforme que no ajusta 9 10,2
Pintura defectuosa Defectos de pintura en superficie exterior 5 5,7
Gavetas defectuosas Gavetas interiores con rajaduras 1 1,1
Mal Nivelacin La heladera se balancea y no se puede cerrar 1 1,1
Motor no arranca El motor no arranca despus de ciclos de paradas 1 1,1
Motor no se detiene No para el motor cuando alcanza temperatura 36 40,9
No enfra El motor arranca pero la heladera no enfra 27 30,7
No funciona Al enchufar no arranca el motor 2 2,3
Otros Otros defectos no incluidos en los anteriores 0 0,0
Puerta defectuosa Puerta del refrigerador no cierra hermticamente 0 0,0
Puerta no cierra La puerta no cierra correctamente 2 2,3
Rayas Rayas en la superficie externas 4 4,5
TOTAL 88 100,0
Pero, Cules son los defectos que aparecen con mayor
frecuencia?.- Para hacerlo ms evidente, antes de graficar podemos
ordenar los datos de la tabla en orden decreciente de frecuencia:

TIPO DE DEFECTO DETALLE DEL PROBLEMA Frec. Frec.%


Motor no se detiene No para el motor cuando alcanza temperatura 36 40,9
No enfra El motor arranca pero la heladera no enfra 27 30,7
Burlete defectuoso Burlete roto o deforme que no ajusta 9 10,2
Pintura defectuosa Defectos de pintura en superficie exterior 5 5,7
Rayas Rayas en la superficie externas 4 4,5
No funciona Al enchufar no arranca el motor 2 2,3
Puerta no cierra La puerta no cierra correctamente 2 2,3
Gavetas defectuosas Gavetas interiores con rajaduras 1 1,1
Mal Nivelacin La heladera se balancea y no se puede cerrar 1 1,1
Motor no arranca El motor no arranca despus de ciclos de paradas 1 1,1
Otros Otros defectos no incluidos en los anteriores 0 0,0
Puerta defectuosa Puerta del refrigerador no cierra hermticamente 0 0,0
TOTAL 88 100,0
Pareto Chart of TIPO DE DEFECTO
90 100
80
70 80
60

Percent
60
Count

50
40
40
30
20
20
10
0 0
TIPO DE DEFECTO

Count 36 27 9 5 4 2 2 3
Percent 40,9 30,7 10,2 5,7 4,5 2,3 2,3 3,4
Cum % 40,9 71,6 81,8 87,5 92,0 94,3 96,6 100,0
Vemos que la categora otros siempre debe ir al final,
sin importar su valor.- De esta manera, si hubiese
tenido un valor ms alto, igual debera haberse ubicado
en la ltima fila.-
Ahora resulta evidente cuales son los tipos de defectos
ms frecuentes.- Podemos observar que los tres
primeros tipos de defectos se presentan en el 82% de
las heladeras, aproximadamente.-

Por el principio de Pareto, concluimos que: La


mayor parte de los defectos encontrados en el
lote pertenece a solo tres tipos de defectos, de
manera que si se eliminan las causas que los
provocan desaparecera la mayor parte de los
defectos.-
EJERCICIOS PARA HACER EN CLASE

1.- Una empresa ha llegado a la conclusin de que hay


siete defectos posibles en una de sus lneas de
produccin.- Construya un diagrama de Pareto de las
siguientes frecuencias de defectos:

CODIGO DE LOS DEFECTOS FRECUENCIA


A 10
B 70
C 15
D 90
E 8
F 4
G 1
GRAFICOS PARA
DESCRIBIR
DATOS DE
SERIES TEMPORALES
Supongamos que tomamos una muestra aleatoria de 100
cajas de una nueva variedad de galletitas.- Si recogemos
nuestra muestra en un momento del tiempo y
ponderamos cada caja, las mediciones obtenidas se
conocen como vimos, con el nombre de datos
transversales.- Sin embargo, podramos recoger y medir
una muestra aleatoria de 5 cajas cada 15 minutos o de 10
cajas cada 20 minutos.- Los datos medidos en sucesivos
momentos de tiempo se denominan con sabemos, datos
de series temporales.-
El estudio de Series de Tiempos, esta fuera del alcance de
esta ctedra, por lo tanto solo veremos los grficos de las
series temporales.-
Un grafico de series temporales representa una serie de
datos en varios intervalos de tiempo.- Midiendo el tiempo
en el eje de abscisa y la cantidad numrica que interesa
en el eje de la ordenada, se obtiene un punto en el grafico
por cada observacin.- Uniendo los puntos contiguos en
el tiempo por medio de lneas rectas se obtiene un grafico
de series temporales.-

La tecnologa del siglo XXI permite acceder rpidamente a


datos que pueden ayudar a tomar decisiones y muchos
de estos datos son de series temporales.-
El comercio electrnico es importante para todos
nosotros.- Se puede comprar casi todo; boletos de avin,
automviles, electrnica. libros, flores, acciones,
comestibles, etc.-
Los minoristas del pas notifican a las autoridades
cuanto negocio hacen en lnea y esta informacin se
utiliza en los informes oficiales mensuales sobre la
situacin de la economa.- Estos datos se recogen a
intervalos sucesivos de tiempo.-
Numerosas empresas analizan y venden encuestas y
datos estadsticos por Internet.- Para desarrollar planes
de marketing, muchas empresas necesitan las
caractersticas demogrficas de los compradores por
Internet, as como del resto de los compradores.- Muchas
veces las observaciones se miden a sucesivos intervalos
de tiempo (anual, mensual, semanal, por da, por horas,
etc).- Las universidades estudian la evolucin de las
cifras de matriculados para comprender mejor sus
tendencias.- Un Contador estudia la evolucin de las
ventas diarias de un comercio que asesora, etc.-
Un medico controla semanalmente o mensualmente los
anlisis de sangre de pacientes con cierta patologa.-
Para describir grficamente todos estos ejemplos, se
utiliza un grafico de series temporales.-

Veamos dos ejemplos de grficos de series


temporales.-

El rector de una pequea universidad privada


solicito datos sobre el numero de estudiantes de
primer ao y sobre el numero de estudiantes
procedentes de otras universidades que entraron
en la universidad entre 1995 y 2005.-
Los datos fueron:
AO 1 Ao Otras Univ.
1995 460 145
1996 475 165
1997 485 150
1998 460 150
1999 486 162
2000 478 147
2001 557 190
2002 545 160
2003 560 140
2004 588 185
2005 575 200
Time Series Plot of First Year. Transfers
600 Variable
First Year
Transfers

500

400
Data

300

200

100
1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
Year

Solucin
En la figura de arriba, podemos ver que el numero de
matriculados de primer ao ha aumentado desde 2000 y
que el mximo que alcanzo el numero de estudiantes
procedentes de otras universidades en 2001 fue seguido
de un continuo descenso.- El personal de administracin
debe averiguar cuales son los factores que explican
ambas tendencias.-
La tabla siguiente muestra las ventas trimestrales
realizadas por una empresa durante un periodo de 6 aos,
desde el 2001 al 2006.- Describa grficamente los datos:

AOS TRIMESTRE
1 2 3 4
2001 271 199 240 255
2002 341 246 245 275
2003 351 283 353 292
2004 401 282 306 291
2005 370 242 281 274
2006 356 245 304 279
La figura anterior es un grafico de serie
temporales de los 24 intervalos de tiempo.-
Observamos que las ventas del primer trimestre
van seguidas sistemticamente de una
disminucin de las ventas en el segundo.- Tal vez
la estacin del ao sea una explicacin.- En el
estudio de Series de Tiempo se ven modelos para
ajustar los datos de las series temporales con el
fin de tener en cuenta la estacionalidad, las
tendencias, la conducta cclica o algn otro
componente irregular.-
Si solo nos interesa comparar las ventas del primer trimestre con las
del segundo, puede hacerse un grafico de series temporales como el
de la figura siguiente:
EJERCICIOS PARA HACER EN CLASE

1.- Construya un grfico de serie temporales de los


siguientes datos sobre uso del telfono mvil durante el
fin de semana o por la noche, en minutos.-

Mes Fin de semana o noche


Enero 575
Febrero 603
Marzo 469
Abril 500
Mayo 586
Junio 540
2.- Qu porcentaje de antiguos alumnos hizo donaciones
a su universidad?.- La tabla adjunta muestra los
porcentajes que obtuvo una universidad en el perodo
2001- 2005.- Trace un grfico de serie temporales de los
datos.- Qu medida podra tomar la universidad?.-

Ao Porcentaje
2001 26.72
2002 27.48
2003 24.89
2004 25.83
2005 30.22
2006 31.14
GRAFICOS PARA
DESCRIBIR
RELACIONES ENTRE
DOS VARIABLES
NUMERICAS
En todos los temas anteriores nos hemos
ocupado de mostrar grficamente una nica
variable.- Estas imgenes nos han ayudado a
entender y analizar mejor la informacin que
contena un gran volumen de datos.- En este
apartado ampliamos las medidas graficas para
describir las relaciones entre dos variables
numricas.- Aqu elaboramos lo que llamamos
los diagramas de dispersin, algunos autores
los llaman diagrama de puntos dispersos o
nube de puntos.-
Los analistas empresariales y economistas a
menudo se refieren a relaciones entre variables
numricas.-
Por ejemplo, Cunto varia la cantidad vendida
cuando varia el precio?, obtienen mejores
clasificaciones medias en la universidad los
alumnos que tienen mejores notas en los
exmenes de ingreso?, aumenta la publicidad
las ventas?, Cmo influye en las ventas los
ingresos total de las familias de la regin?.....etc.-
En estos ejemplos, observamos que una variable
puede depender de alguna medida de la otra
variable, es decir que tenemos pares de valores
que llamamos X e Y.- Por ejemplo, los montos de
ventas puede depender de cuanto se haya
gastado en publicidad.- En este caso llamamos a
la variable Y dependiente y a la X independiente.-
El diagrama de dispersin, es una imagen que muestra a
menudo la relacin entre las dos variables.-
Podemos trazar un diagrama de dispersin, localizando
un punto por cada par de dos variables que
representan una observacin del conjunto de datos.-
Nos muestra:
a) El rango de cada variable.-
b) La pauta de valores existentes dentro del rango.-
c) Una sugerencia sobre la posible relacin entre las dos
variables.-
d) Una indicacin de los casos atpicos (puntos muy
extremos).-
Veamos un ejemplo:
Notas de los exmenes de admisin en las
universidades en los EEUU y las calificaciones
media de los estudios universitarios.-
Son las notas obtenidas en la prueba de
matemticas del SAT para acceder a la
universidad un buen indicador de xito en la
universidad?.- En los EEUU, todos los
estudiantes realizan uno o mas test de aptitud
para ingresar en una universidad.- El personal de
admisiones de las universidades utilizan los
resultados para admitir o no a los estudiantes.-
En la tabla siguiente se muestra las notas
obtenidas en la prueba de admisin por una
muestra aleatoria de 11 estudiantes de una
pequea universidad del oeste, y la calificacin
media obtenida al terminar los estudios
universitarios.- Trace un diagrama de dispersin
y comente que informacin le suministra.- Los
datos fueron:

Nota de matemticas en el SAT.-

450 480 500 520 560 580 590 600 620 650 700

Calificacin media en los estudios universitarios.-


3,25 2,60 2,88 2,85 3,30 3,10 3,35 3,20 3,50 3,59 3,95
Scatterplot of Calificacion media vs Notas en matematicas
4,00

3,75
Calificacion media

3,50

3,25

3,00

2,75

2,50
450 500 550 600 650 700
Notas en matematicas
Hemos utilizado un programa Minitab, para hacer el
diagrama, hoy todos los paquetes tienen este grafico,
incluso Excel.-
Observamos que las calificaciones medias van desde
alrededor de 2,5 hasta 4 y las notas de matemticas van
desde 450 hasta 700.- Una interesante pauta es la
tendencia ascendente positiva; las calificaciones medias
tienden a aumentar directamente con los aumentos de las
notas obtenida en la prueba de matemticas.- Observe
tambin que la relacin no suministra una prediccin
exacta.- Algunos estudiantes que obtienen una baja nota
en la prueba de matemticas tiene una calificacin media
mas alta que los estudiantes que obtienen una nota
mejor en la prueba de matemticas.- Vemos que la pauta
bsica indica que las notas mas altas obtenidas en los
exmenes de admisin predicen mayores calificaciones
medias pero los resultados no son perfectos.-
EJERCICIO PARA HACER EN CLASE.-

Una empresa de bienes de consumo ha estado


estudiando la influencia de la publicidad en los
beneficios totales.- Se han recogido como parte
del estudio datos sobre los gastos publicitarios
(en miles) y las ventas totales (en miles) de un
periodo de 10 meses y son los siguientes:

Gastos 10 15 7 12 14 18 14 9 15 13 16 17

Ventas 100 200 80 120 150 270 160 120 220 170 240 200

Muestre esta informacin en un diagrama de dispersin y comente.-


PRESENTACION
PRESENTACION DE
DE
VARIABLE
VARIABLE NUMERICA
NUMERICA EN
EN
TABLAS
TABLAS Y
Y GRAFICOS
GRAFICOS
Hemos dicho que cuando la variable en estudio es numrica
debemos distinguir entre variable discreta y continua.-
Adems debemos tener en cuenta que en este caso vamos a
estudiar una sola variable numrica por vez, es decir
distribuciones unidimensionales.-

Otra cosa que debemos tener en claro es que segn la cantidad de


datos que forman nuestra poblacin o muestra segn con lo que
hayamos decidido trabajar, a estos los podemos tratar como:

a) Datos sin agrupar


(pocos)
b1) Sin intervalos
(discreta)
b) Datos agrupados
(muchos)
b2) Con intervalos
(continua)
a) DATOS SIN AGRUPAR.-

Vamos a verlo mediante un ejemplo.- Supongamos que el Gerente


de un Supermercado esta interesado en saber que cantidad de
gente entra a el durante la siesta (13 a 16 horas).- Tomamos una
muestra de 80 das y contamos la gente que entr en ese horario
al Supermercado.- Resultaron los siguientes valores:

4 5 2 6 4 6 4 4 7 6
3 7 5 3 6 5 5 6 6 7
6 4 5 4 5 6 3 8 4 8
7 6 8 2 4 5 4 5 5 5
4 5 4 7 8 7 4 8 3 6
6 3 4 3 5 5 2 5 4 7
5 6 5 4 6 3 6 7 6 6
3 6 6 6 6 6 7 5 6 5
Podemos ordenarlos en forma creciente y algo podemos decir:

2 2 2 3 3 3 3 3 3 3
3 4 4 4 4 4 4 4 4 4
4 4 4 4 4 4 5 5 5 5
5 5 5 5 5 5 5 5 5 5
5 5 5 5 6 6 6 6 6 6
6 6 6 6 6 6 6 6 6 6
6 6 6 6 6 6 7 7 7 7
7 7 7 7 7 8 8 8 8 8

Qu comentario puede hacer el alumnos?


Un grfico que se suele hacer cuando los datos no
son muchos es el grfico de puntos o Dotplot.-

Grfica de puntos de C1

2 3 4 5 6 7 8
C1
b 1) Datos
agrupados sin
intervalos.-
Variable
discreta.-
Vamos a verlo mediante un ejemplo.- Supongamos que
el Gerente de un Supermercado esta interesado en
saber que cantidad de gente entra a el durante la siesta
(13 a 16 horas).- Tomamos una muestra de 80 das y
contamos la gente que entr en ese horario al
Supermercado.- Resultaron los siguientes valores:

4 5 2 6 4 6 4 4 7 6
3 7 5 3 6 5 5 6 6 7
6 4 5 4 5 6 3 8 4 8
7 6 8 2 4 5 4 5 5 5
4 5 4 7 8 7 4 8 3 6
6 3 4 3 5 5 2 5 4 7
5 6 5 4 6 3 6 7 6 6
3 6 6 6 6 6 7 5 6 5
Xi = cantidad de personas que entraron en ese horario.-
Xi variable discreta.-
Agrupamos en una tabla que llamamos DISTRIBUCIN DE
FRECUENCIA.-

Xi Conteo fi hi Fi Hi Fi%
2 III 3 0,0375 3 0.0375 3,75
3 IIIIIIII 8 0,1000 11 0.1375 13.75
4 IIIIIIIIIIIIIII 15 0,1875 26 0.3250 32,50
5 IIIIIIIIIIIIIIIIII 18 0,2250 44 0.5500 55,00
6 IIIIIIIIIIIIIIIIIIIIII 22 0,2750 66 0.8250 82,50
7 IIIIIIIII 9 0,1125 75 0.9375 93,75
8 IIIII 5 0,0625 80 1.0000 100,0
TOTAL --------- 80 1,0000 ------ --------- -------------

En el analizamos toda la cuarta fila.-


Xi = es la variable en estudio, me indica cantidad de personas, 5.-
fi = hay 18 das que entraron 5 personas.-
hi = el 22,5 % de los das entraron 5 personas.-
Fi = hay 44 das que entraron entre 2 y 5 personas.-
Fi = el 55,0% de los das entraron entre 2 y 5 personas.-

Si decidimos mostrar grficamente esta distribucin ser por


medio de un GRAFICO DE BASTONES.-

Das
25
20
15
10
5
0 1 2 3 4 5 6 7 8 Cantidad personas
b 2) Datos
agrupados con
intervalos.-
Variable
continua.-
Para agrupar los datos en una distribucin de
frecuencia con intervalos, debemos pensar varias
cosas, como cuantos intervalos vamos a hacer, que
amplitud usamos, etc.- Se recomienda no usar menos
de 5 ni ms de 15 intervalos.- Cuando agrupamos los
datos en intervalos, perdemos la individualidad del
dato.-

a) Sacamos la cantidad de Intervalos ( I ) haciendo:

k
2 n
Donde k nos indica la cantidad de intervalos a realizar.-
b) Amplitud a utilizar:
Rx = rango o recorrido de la variable.
Rx =Xi mximo --- Xi mnimo
Ci = amplitud Ci = Rx / I

Debemos ahora determinar con que valor de variable


empezamos los intervalos, para ello definimos el
siguiente criterio:
Li Xi < Ls
Tomamos el dato donde es lmite inferior.-
Veamos esto con un ejemplo.- Supongamos tener las
ventas (en $ por 100) de cierto comercio.- Se observo una
muestra de 30 das.- Estas fueron:

61 88 70 76 66 79 64 75 78 76

80 61 75 79 76 60 74 68 76 78

70 65 52 78 72 76 58 86 94 78

I = 5
Rx = 94 - 52 = 42
Ci = 42 / 5 = 8,4 9
La distribucin de frecuencia ser:

Li - Ls Conteo fi hi Fi Hi Fi %

52 61 III 3 0,100 3 0.1000 10,0

61 70 IIIIII 6 0,200 9 0.3000 30,0

70 79 IIIIIIIIIIIII 15 0,500 24 0.8000 80,0


II
79 88 IIII 4 0,133 28 0.9300 93,0

88 97 II 2 0,067 30 1.0000 100,0

TOTAL ---------- 30 1,000 ---- --------- -----------


fi = 15 Significa que durante 15 das vendi entre 70 y
79 pesos.-
hi = 0,500 .- El 50% de los das vendi entre 70 y 79
pesos.-
Fi = 24 das vendi entre 52 y 79 pesos.-
Fi % = 80.0 %.- El 80% de los das vendi entre 52 y 79
pesos.-
Representacin grfica de una
distribucin de frecuencia con
intervalos

POLIGONO DE OJIVA O GRAFICO


HISTOGRAMA
FRECUENCIA DE Fi %
Comentarios sobre los
grficos de una
distribucin de
frecuencia con
intervalos.-
HISTOGRAMA
HISTOGRAMA

Es un grfico de barras verticales adyacentes y


me muestra la forma en que se distribuyen los
datos que estamos estudiando.- Todas las
barras tienen el mismo ancho y se diferencia en
la altura que corresponde a cada frecuencia
absoluta o frecuencia relativa del intervalo.- El
histograma nos muestra como estn repartidos
los datos.- Por ejemplo si estamos analizando
ventas de un comercio y nos encontramos con
Histogramas de las siguientes formas:
Histogram of X1
20

15
Frequency

10

0
-4 -2 0 2 4 6 8 10
X1
Histogram of X3
18

16

14

12
Frequency

10

0
0 10 20 30 40
X3
Histogram of HSPct
30

25

20
Frequency

15

10

0
30 40 50 60 70 80 90 100
HSPct
POLIGONO
POLIGONO DE
DE
FRECUENCIA
FRECUENCIA

Es un grfico lineal.- Los puntos medios


de los intervalos representa los datos de
ese intervalo.- Me cuenta lo mismo que el
histograma, como se distribuyen mis
datos.- Es apropiado cuando se quieren
comparar distribuciones, ya que pueden
encimarse dos polgonos con distintas
tramas.-
OJIVA
OJIVA O
O GRAFICO
GRAFICO DE
DE
FRECUENCIA
FRECUENCIA ACUMULADA
ACUMULADA

Con este grfico podemos calcular


alguna medidas descriptivas, adems,
podemos decir que porcentaje de
observaciones son menores a cierto
valor de variable.-
Veamos estos tres
grficos en el ejemplo
que venimos viendo
sobre las ventas de un
comercio.
HISTOGRAMA

V entas del comercio

16
fre c u e n c ia a b s o lu ta
12

0
43 52 61 70 79 88 97 106
Montos de ventas
POLIGONO DE FRECUENCIA CON EL HISTOGRAMA

V entas del comercio

16
fre c u e n c ia a b s o lu ta

12

0
43 52 61 70 79 88 97 106
Montos de ventas
POLIGONO DE FRECUENCIA SIN EL HISTOGRAMA

V entas del comercio

16
fre cu e n cia a b so lu ta

12

0
43 52 61 70 79 88 97 106
Montos de ventas
OJIVA O GRFICO DE FRECUENCIA ACUMULADA

Ventas del comercio

32
fre c. a b s. a cu m u la d a

24

16

0
43 52 61 70 79 88 97 106
Montos de ventas
VEAMOS UN
EJEMPLO DE DOS
DISTRIBUCIONES:
Suponga que decide llevar a cabo un estudio
comparativo del costo de una comida en un restaurante
de una gran ciudad con el de una comida similar en un
restaurante fuera de la ciudad.-
CIUDAD
50 38 43 56 51 36 25 33 41 44
34 39 49 37 40 50 50 35 22 45
44 38 14 44 51 27 44 39 50 35
31 34 48 48 30 42 26 35 32 63
36 38 52 23 39 45 37 31 39 53
FUERA DE LA CIUDAD
37 37 29 38 37 38 39 29 36 38
44 27 24 34 44 23 30 32 25 29
43 31 26 34 23 41 32 30 28 33
26 51 26 48 39 55 24 38 31 30
51 30 27 38 26 28 33 38 32 25
C:\Archivos de programa\InfoStat\datos\Mauri. Precio comida 2007.IDB2:
16/06/07 - 6:42:25

Tablas de frecuencias

Variable Clase LI LS MC FA FR FAA FRA


Ciudad 1 11,00 20,00 15,50 1 0,02 1 0,02
Ciudad 2 20,00 29,00 24,50 5 0,10 6 0,12
Ciudad 3 29,00 38,00 33,50 17 0,34 23 0,46
Ciudad 4 38,00 47,00 42,50 14 0,28 37 0,74
Ciudad 5 47,00 56,00 51,50 12 0,24 49 0,98
Ciudad 6 56,00 65,00 60,50 1 0,02 50 1,00
17,85
fre c u e n c ia a b s o lu ta

13,39

8,93

4,46

0,00
2 11 20 29 38 47 56 65 74
Ciudad
0,36

0,27
frecuencia relativa

0,18

0,09

0,00
7 16 25 34 43 52 61 70
Ciudad
1,00

0,88
fre c. re l. a cu m u la d a

0,75

0,63

0,50

0,38

0,25

0,13

0,00
2 12 23 33 43 53 64 74
Ciudad
C:\Archivos de programa\InfoStat\datos\Mauri. Precio comida 2007.IDB2: 16/06/07 -
6:42:25

Tablas de frecuencias

Variable Clase LI LS MC FA FR FAA FRA


Fuera 1 20,00 26,00 23,00 10 0,20 10 0,20
Fuera 2 26,00 32,00 29,00 16 0,32 26 0,52
Fuera 3 32,00 38,00 35,00 14 0,28 40 0,80
Fuera 4 38,00 44,00 41,00 6 0,12 46 0,92
Fuera 5 44,00 50,00 47,00 1 0,02 47 0,94
Fuera 6 50,00 56,00 53,00 3 0,06 50 1,00
16,80

12,60
frecuencia absoluta

8,40

4,20

0,00
14 20 26 32 38 44 50 56 62
fuera de la ciudad
16,80

12,60
frecuencia absoluta

8,40

4,20

0,00
14 20 26 32 38 44 50 56 62
fuera de la ciudad
1,00

0,88

0,75
frec. rel. acumulada

0,63

0,50

0,38

0,25

0,13

0,00
14 22 30 38 46 54 62
fuera de la ciudad
OTRA FORMA DE
TRABAJAR
ESTAS
DOS
DISTRIBUCIONES

TRABAJAREMOS LAS DOS


DISTRIBUCIONES SOBRE LOS
MISMOS INTERVALOS DE
CLASE
Exploramos un poco los datos, porque tratamos
de elaborar una sola distribucin de frecuencia
para las dos distribuciones.- Observamos que
una de las distribuciones el recorrido de la
variable va desde 14 $ a 63$ y en la otra desde
23$ a 55$.- Podemos modificar el menor valor y
llevarlo a 10$ y usar una amplitud de intervalo
igual a 5$.- Elaboramos tantos intervalos como
para cubrir nuestro valor mximo de variable.-
La distribucin de frecuencia quedara de la
siguiente manera, realizamos el conteo y
obtenemos las frecuencias absoluta.-
Costo por comida Frecuencia Frecuencia Fuera
en $ Ciudad de la ciudad
10 15 1 0
15 20 0 0
20 25 2 4
25 30 3 13
30 35 7 13
35 40 14 12
40 45 8 4
45 50 5 1
50 55 8 2
55 60 1 1
60 65 1 0
TOTAL 50 50
La distribucin de frecuencia permite obtener
conclusiones acerca de las caractersticas principales de
los datos.- Por ejemplo, la tabla anterior muestra que el
costo de las comidas en los restaurantes de la ciudad
est concentrado entre los 30 y 55$, en comparacin con
las comidas en los restaurante fuera de la ciudad, los
cuales estn concentrado entre 25 y 40$.-
Si el conjunto de datos no contiene muchos valores, un
conjunto de lmites de clase refleja una imagen diferente
de la que da otro conjunto de lmites.- Siempre es
conveniente no tener demasiados datos en cada
intervalo.-
Por fortuna, conforme aumenta el tamao de la muestra,
las alteraciones en la seleccin de los lmites de clase
afectan cada vez menos la concentracin de los datos.-
DISTRIBUCION DE
FRECUENCIAS
RELATIVAS Y
DISTRIBUCIN DE
PORCENTAJES.-
Costo por Ciudad Fuera de la ciudad
comida Frecuencia Porcentaje Frecuencia Porcentaje
en $ Relativa Relativa

10 15 0,02 2,00 0,00 0,00


15 20 0,00 0,00 0,00 0,00
20 25 0,04 4,00 0,08 8,00
25 30 0,06 6,00 0,26 26,00
30 35 0,14 14,00 0,26 26,00
35 40 0,28 28,00 0,24 24,00
40 45 0,16 16,00 0,08 8,00
45 50 0,10 10,00 0,02 2,00
50 55 0,16 16,00 0,04 4,00
55 60 0,02 2,00 0,02 2,00
60 65 0,02 2,00 0,00 0,00
TOTAL 1,00 100,0 1,00 100,0
A partir de la tabla anterior, se concluye
que las comidas cuestan ms en los
restaurantes de la ciudad que en los de
fuera de ella; el 16 % de las comidas en
los restaurantes de la ciudad cuestan
entre 50 y 55$, en comparacin con el 4 %
de los restaurantes de las afuera de la
ciudad; mientras que solo el 6 % de las
comidas en los restaurantes de la ciudad
cuestan entre 25 y 30$ en comparacin
con el 26 % de los restaurantes fuera de
la ciudad.-
DISTRIBUCION DE
FRECUENCIA
ABSOLUTAS
ACUMULADAS Y
DE FRECUENCIAS
ABSOLUTAS
ACUMULADAS
PORCENTUALES
Costo por Ciudad Fuera de la ciudad
comida Frecuencia Porcentaje Frecuencia Porcentaje
en $ Abs. Acum. Abs. Acum.

10 15 1 2,0 0 0,0
15 20 1 2,0 0 0,0
20 25 3 6,0 4 8,0
25 30 6 12,0 17 34,0
30 35 13 26,0 30 60,0
35 40 27 54,0 42 84,0
40 45 35 70,0 46 92,0
45 50 40 80,0 47 94,0
50 55 48 96,0 49 98,0
55 60 49 98,0 50 100,0
60 65 50 100,0 50 100,0
TOTAL
La distribucin de porcentaje acumulado constituye
una manera de presentar la informacin del porcentaje
de los valores que estn por debajo de cierto valor.-
Por ejemplo, tal vez se desea conocer que porcentaje
de las comidas de los restaurantes de la ciudad
cuestan menos de 20$, menos que 30$ , y as
sucesivamente, etc.-
La distribucin acumulativa muestra claramente que
los costos de la comida son inferiores en los
restaurantes de afuera de la ciudad que los de la
ciudad propiamente dicha; en el 34% de los
restaurantes de afuera cuesta menos de 30$, en
comparacin con solo el 12% de los restaurantes de la
ciudad; en el 60% de los restaurantes de las afuera
cuesta menos de 35$ en comparacin solo el 26% de
los restaurantes de la ciudad, etc, etc.-
ANALISIS
EXPLORATORIO
DE DATOS.-
Las tcnicas del anlisis exploratorio de datos consisten
en operaciones aritmticas sencillas y grficas fciles de
trazar, que pueden emplearse para resumir con rapidez los
datos.-
Una tcnica de explorar los datos que son objeto de
nuestro estudio y que hoy trae casi todos los paquetes
estadsticos de computacin es el llamado DIAGRAMA
DE TALLO Y HOJA .- La importancia de este diagrama
es que no perdemos el dato original, cosa que nos sucede
con las distribucin de frecuencia con intervalos.-
El diagrama es una herramienta valiosa y verstil para
organizar un conjunto de datos y entender la distribucin y
agrupacin de los valores dentro del intervalo de
observaciones en el conjunto.- Generalmente el primer
dgito forma el tallo y el resto las hojas.- Veamos un
ejemplo sencillo.-
Suponga que las calificaciones en un parcial de ESTADSTICA de
40 alumnos fueron las siguientes:

42 46 87 34 81
2 1 9
64 87 69 75 73
3 4 7
91 70 86 67 49 4 2 6 7 9
55 74 81 75 37 5 5 7 9
21 69 29 59 69 6 9 4 0 9 5 7 9 8 6 8
60 81 77 47 68 7 5 7 3 4 0 4 5
74 65 87 97 57 8 7 1 7 1 2 6 7 1
68 66 90 82 94
9 7 1 0 4
MEDIDAS
DESCRIPTIVAS
QUE RESUMEN
A LOS DATOS
Hasta este punto, hemos analizado la
presentacin de datos categricos y
numricos en forma tabular y grfica.-
Aunque la presentacin de datos es una
componente esencial de la estadstica
descriptiva, la tarea no termina ah.- Dentro
del manejo de la informacin numrica, un
buen anlisis de los datos no se limita a la
presentacin de datos y la observacin de
lo que estos tratan de transmitir, tambin
abarca los clculos y el resumen de las
caractersticas importante y el anlisis de
lo que contienen.-
LAS MEDIDAS DESCRIPTIVAS ESTADISTICAS QUE
CARACTERIZAN A UNA MUESTRA O A UNA POBLACION
SON:

MEDIDAS
DE MEDIDAS DE
TENDENCI ORDEN
A
CENTRAL
MEDIDAS DE
MEDIDAS DE FORMA
DISPERSION O
DE
VARIABILIDAD
MEDIDAS DE TENDENCIA CENTRAL.-

MEDIA ARITMETICA X

MEDIANA Me
MEDIA PONDERADA
XP

MODO MO
MEDIA GEOMETRICA
XG

MEDIA ARMONICA XA
MEDIDAS DE ORDEN

PERCENTILE
PERCENTILE
CUARTILES
CUARTILES SS
Q
QRR PPRR %
%

RANGO
RANGO DELDEL
PERCENTIL
PERCENTIL
R
RPP (xi)
(xi)
MEDIDAS DE DISPERSION O DE VARIABILIDAD

RANGO
RANGO OO
RECORRIDO
RECORRIDO VARIANCIA
VARIANCIA
R
RXX SSXX

RANGO
RANGO
INTERCUARTILIC
INTERCUARTILIC
OO

COEFICIENTE
COEFICIENTE
DESVIO
DESVIO DE
DE
ESTANDAR
ESTANDAR VARIACION
VARIACION
SSXX CV
CVXX
MEDIDAS DE FORMA

ASIMETRIA
ASIMETRIA
A
ASS
CURTOSIS
CURTOSIS
CCRR
MEDIA ARITMETICA , tambin llamada Media:
Es el promedio y es la medida de tendencia central
que se utiliza con mayor frecuencia.- Se calcula con la
suma de todas las observaciones en un conjunto de
datos, dividida entre el nmero de elementos
involucrados.- Si estamos trabajando con una muestra
aleatoria de la poblacin en estudio estamos calculando
un ESTADISTICO, que ser:

xi

x =
n

Si estamos trabajando con la poblacin y nos piden la


media, calculamos un PARAMETRO, por ejemplo:
Si tenemos un Comercio con seis empleados, cuyos sueldos
mensuales son 1800, 1760, 1780, 2100, 1980, 2350 y queremos
observar el sueldo promedio ser:

xi 1800 + 1760 + 1780 + 2100 + 1980 + 2350


= = = 1961,7 $
N 6

El sueldo mensual promedio de los empleados es de 1962 $.-

a) Media aritmtica para datos sin agrupar.


Cuando es muy pequeo el nmero de elementos de la serie u
observaciones recogidas, puede hacerse innecesario la
agrupacin de los datos por frecuencia e intervalos.
Por ejemplo: Se tienen los montos de ventas de un comercio
durante 14 meses seleccionados al azar- Los datos resultantes
fueron: (por 100 $)

87- 99- 160- 180- 135- 145- 105- 138- 153- 129- 119- 99- 165- 172
Observamos que, la media aritmtica ser:

xi 1886
x = ---------- = ----------- = 134,71 135 $.-
n 14

Significa que el promedio de ventas en los 14 meses fue de 135


pesos.-

b) Media aritmtica para datos agrupados sin


y con intervalos.-

La frmula es la misma.- La diferencia va estar dada en el valor de la


variable xi.- En la distribucin sin intervalos esta ser los valores
originales de la variable, en cambio en datos agrupados con
intervalos, los valores de la variable sern los puntos medios de los
intervalos.-
xi * fi
x =
n
Veamos un ejemplo.-
Supongamos que tenemos los tiempos en minutos que demora un
Contador Bancario en auditar una muestra de 50 crditos
solicitados- Presentamos los datos ordenados en una distribucin de
frecuencia,
Li Ls fi xi xi * fi
XI * fi
20 22 3 21 63
X= =
22 24 5 23 115
n
24 26 12 25 300
1324
26 28 17 27 459
= = 26,48
28 30 8 29 232
50
30 32 5 31 155
26 minutos
TOTAL 50 - 1324

El promedio que demora el Contador en auditar un Crdito es de 26


minutos.-
MEDIANA.-
Se la simboliza con Me .-
La mediana me divide mis observaciones en dos partes iguales.-
La mediana es aquel valor de la variable que un 50% de los datos
es igual a ella o menor.-

N IMPAR DE DATOS
a) PARA DATOS
SIN AGRUPAR
N PAR DE DATOS

Lo primero que debemos hacer


es ordenar los datos en forma
crecientes.-
a 1) N IMPAR DE DATOS.-
Supongamos tener los tiempos que un empleado durante 15 das
tiene que esperar el mnibus para llegar al trabajo.- Estos son:
8 8 9 9 9 10 10 10 11 12 13 15 17 18 20

M = (n + 1) / 2 = 16 / 2 = 8 posicin
Me = 10 minutos
a 2) N PAR DE DATOS.-
En el ejemplo anterior supongamos tener datos durante 14 das.-
8 9 9 10 10 11 12 13 13 15 17 18 18 20

M = (n + 1) / 2 = 15 / 2 = 7,5 posicin
12 + 13
Me = = 12,5 minutos
2
b 1) MEDIANA PARA DATOS AGRUPADOS SIN
INTERVALOS.-
Supongamos tener la cantidad de accidentes automovilsticos por
mes en cierta localidad.- Se registraron datos correspondientes a 60
meses.-
Buscamos la menor Fi % que
xi fi F i Fi%
me contiene al 50 %.-
0 10 10 16,7
Observamos ahora que valor
1 12 22 36,7
de variable le corresponde:
2 16 38 63,3
3 8 46 76,7
Me = 2 accidentes
4 7 53 88,3
5 5 58 96,7
6 2 60 100,0
Total 60 ----- -----
b2) MEDIANA PARA DATOS AGRUPADOS EN
INTERVALOS.-
Supongamos tener las notas de un parcial del Estadstica de una
muestra de 50 alumnos.- Los datos agrupados en una tabla de
frecuencia con intervalo fueron:
n

Li Ls fi Fi Fi % Fi -1
2 * ci
Me Li
36 44 2 2 4,0 f i

44 52 12 14 28,0

52 60 15 29 58,0 25 - 14
Me = 52 + ---------------- * 8 =
60 68 18 47 94,0
15
68 76 3 50 100,0 Me = 57,87 58 puntos.-
Total 50 ----- ------
MODO
Se lo simboliza con Mo.- Es el valor de la variable que ms veces
se repite.-
Es la nica medida descriptiva que podemos calcular en una
variable cuya medicin esta en escala nominal.-

MODO PARA DATOS SIN AGRUPAR


Por ejemplo si tenemos los montos de ingresos quincenales de
un grupo de empleados de una empresa,

850 875 856 882 875 880 896 810 875 942 - 975
Observamos el valor de variable que ms veces se da:
M o = 875 $
MODO PARA DATOS AGRUPADOS SIN INTERVALOS.-
Supongamos que en el relevamiento de 50 empleados de una
empresa, se les pregunto la cantidad de nios en edad escolar
que tienen.- Resulto la siguiente tabla:

xi fi

2 5 Observamos la mayor frecuencia


absoluta.- El valor de variable que le
3 12 corresponde es el modo.-

4 18

5 9 Mo = 4 nios en edad escolar

6 6

TOTAL 50
MODO PARA DATOS AGRUPADOS CON INTERVALOS.-
Supongamos que tenemos una muestra de 72 notas de un parcial
de Estadstica que se les tomo a un curso integrado por 200
alumnos.- Estas fueron las siguientes:

Li Ls fi d
*c
Mo Li

1

d1 d
36 46 4 i
2
46 56 9
d1 = fi - fi-1 = 23 - 18 = 5
56 66 18
d2 = fi - fi+1 = 23 - 11 = 12
66 76 23
5
76 86 11
Mo = 66 + ---------------- * 10 =
86 96 7
5 + 12
TOTAL 72 = 68,94 69 puntos.-
USO DE LAS
DISTINTAS MEDIDAS
DE TENDENCIA CENTRAL
Cuando se tiene datos de escalas intervalares o proporcionales, en
general se utiliza la media porque, es una medida que atiende en
forma exhaustiva toda la informacin disponible: los valores, las
distancias y proporcionalidad entre ellos y la frecuencia de cada
uno.

Hemos visto que el modo solo atiende a las frecuencias y la


mediana solo utiliza el orden expresado por los valores
numricos y no atiende el valor de las observaciones extremas.

La media tiene importantes propiedades matemticas, lo que no la


mediana y el modo, y esto se ir observando a medida que
avancemos en el estudio de la estadstica.

El modo en escala intervalar, se utiliza para una primera


estimacin rpida de la tendencia central, puesto que se
determina fcilmente, sin necesidad de clculo alguno, con solo
observar la tabla de distribucin de frecuencia.
Cuando se tiene datos de escalas intervalares o proporcionales, en
general se utiliza la media porque, es una medida que atiende en
forma exhaustiva toda la informacin disponible: los valores, las
distancias y proporcionalidad entre ellos y la frecuencia de cada
uno.

Hemos visto que el modo solo atiende a las frecuencias y la


mediana solo utiliza el orden expresado por los valores
numricos y no atiende el valor de las observaciones extremas.

La media tiene importantes propiedades matemticas, lo que no la


mediana y el modo, y esto se ir observando a medida que
avancemos en el estudio de la estadstica.

El modo en escala intervalar, se utiliza para una primera


estimacin rpida de la tendencia central, puesto que se
determina fcilmente, sin necesidad de clculo alguno, con solo
observar la tabla de distribucin de frecuencia.
El modo interviene en l clculo de algunas medidas de asimetra.-

La mediana en escalas intervalares es recomendada cuando en un


conjunto de dato, existen uno o unos pocos datos extremos que
son incomparables con el resto de los datos.

La mediana no se ve afectada por los valores extremos, mientras


que la media es muy sensible a estos valores y por lo tanto en
estos casos la mediana es el valor que mejor me representa los
datos.-

Las medidas de tendencia central como ya hemos dicho, son


ndices que permiten resumir un conjunto de datos en una sola
expresin, de modo que se pueda apreciar mejor el significado de
los datos.

Las medidas de tendencia central como cualquier estadstica,


cobran sentido cuando las empleamos para hacer comparaciones
u otras operaciones.
Cuando se tiene una distribucin de frecuencias con intervalos
abiertos, no puede calcularse la media y en estos casos se elige
como mejor medida la mediana ya que en su clculo solo participa
el intervalo mediano.

Cuando la forma de la distribucin de frecuencia es asimtrica ya


sea a izquierda o derecha, la mejor medida de tendencia central es
la mediana ya que se encuentra entre las otras dos, media y modo.-

Si es simtrica, como las tres medidas son iguales, se puede elegir


cualquiera y en esos casos se prefiere la media, dependiendo esto
del tipo de investigacin que se haya planificado.-

Mucho se podra seguir profundizando sobre estas medidas y los


procedimientos para su clculo, pero se considera que hoy en da
no tiene mucho sentido.

Hoy hay sistemas de computacin estndar preparados para el


anlisis estadstico de datos y es muy importante que el alumno
vaya tratando de conocerlas y usarlas.-
EJERCICIOS PARA HACER EN CLASE
1.- Diez economistas recibieron el encargo de predecir el
crecimiento porcentual que experimentar el ndice de
precio al consumidor el prximo ao.- Sus predicciones
fueron:
3,6 3,1 3,9 3,7 3,5 3,7 3,4 3,0 3,7 3,4
Calcule y explique la media, mediana y modo.-
2.- Una consultora, elige al azar 10 grandes negocios de
ventas minoristas de una zona de cierta ciudad, para
analizar las ventas alcanzadas este ao en las navidades.-
Observo respecto al ao anterior los siguientes
incrementos porcentuales:
10,2 3,1 5,9 7,0 3,7 3,9 6,8 7,3 8,2 4,3
Calcule media, mediana, modo y comente sobre la forma
de la distribucin.-
3.- Un estudio de investigacin sobre las ventas diarias
de una muestra aleatorias de das del 2008 (en miles) de
un comercio fueron las siguientes:
7.1 7.2 7.2 7.6 7.6 7.9 8.1 8.1 8.1 8.3
8.3 8.4 8.4 8.9 9.0 9.0 9.1 9.1 9.1 9.1
9.4 9.6 9.9 10.1 10.1 10.1 10.2 10.3 10.5 10.7
11.0 11.1 11.2 11.2 11.2 12.0 13.6 14.7 14.9 15.5

a) Diga cual es la variable en estudio, tipo y nivel de


medicin.-
b) Agrupe los datos en una distribucin de frecuencia.-
c) Calcule la media, mediana y modo.-
d) Comente sobre la forma de la distribucin
comparando medidas.-
4.- Un estudio de investigacin sobre los sueldos anuales de
empleados de una empresa papelera, fueron los que mostramos en
Minitab, y del calculo surge:

Descriptive Statistics: Sueldos anuales

Variable Media Mnimo Mediana Mximo


Sueldos anuales 39467 28800 38650 100000

a) Comente que le dicen las medidas que calculo.-


b) Comparando medidas que le dicen sobre la forma de la
distribucin, y que le dice respecto a los sueldos.-
5.- Los porcentajes de la remuneracin total
correspondientes al pago de planes de una muestra
de 12 ejecutivos son los siguientes;

15,8 17,3 28,4 18,2 15,0 24,7


13,1 10,2 29,3 34,7 16,9 25,3

a) Calcule y explique la media muestral.-


b) Calcule y explique la mediana.-
c) Comente sobre estos datos.-
6.- En una muestra aleatoria de 8 semanas se observo que
una agencia de cruceros reciba el siguiente nmero de
programas semanales especiales de cruceros al caribe:
20 45 52 70 73 75 80 82
a) Calcule la media, mediana y modo.-
b) Qu medida de tendencia central describe mejor a loa
datos?.-

7.- Las edades de una muestra de 12 estudiantes


matriculados en un curso de Macroeconoma fueron las
siguientes:
21 22 27 36 18 19 22 23 22 28 36 33
a) Calcular la media, mediana y modo.-
b) Que forma tiene la distribucin?.- Comente.-
8.- Un fabricante de radios porttiles obtiene una muestra
de 55 radios de la produccin de una semana.- Las
radios se examinaron minuciosamente y el nmero de
defectos encontrados fue el siguiente:
N defectos: 0 1 2 3 4 5
N de radios: 12 15 17 6 3 2
a) Halle las medidas de tendencia central.- Comente.-
b) Cual sera la forma de la distribucin.- Explique.-

9.- En el anlisis del nmero de reclamaciones mensuales en una casa


de ventas de artefactos elctricos arrojo los siguientes resultados
para 13 semanas;
13 15 8 16 8 10 12 20 18 8 14 9 11
a) Calcules las medidas de tendencia central.-
b) Comente sobre la distribucin.-
10.- Se tiene informacin de las tasaciones (en porcentaje)
que se hicieron en el 2005 de una muestra aleatoria de
40 solares de una zona comercial.- Los valores arrojaron
los siguientes resultados:
Media = 28,275 Min = 21 Max = 36
Mediana = 28,50 Modo = 28
a) Que le estn diciendo cada medida en el ejercicio.-
b) Describa la asimetra o no de los datos.-

11.- Una muestra de 33 alumnos de contabilidad anot el nmero de


horas dedicadas a estudiar la materia de la asignatura durante la
semana anterior al examen final.- Los datos arrojaron las siguientes
medidas:
Media = 8,545 Mn = 2 Mx = 21 Me = 9,0 Modo = 9,0
Asimetr = 1,06 a) Describa los datos.- b) Comente el sesgo
MEDIA ARITMETICA PONDERADA

Cuando calculamos la Media, se asume que cada observacin era


de igual importancia.- Sin embargo, en ciertos casos, puede
querer darse mayor peso a algunas observaciones.- Se la calcula
haciendo:

xi Wi
Xp =

Wi

Donde Xp es la media ponderada.-


xi es la observacin individual
Wi es el peso o ponderacin asignada a cada observacin
Ejemplo de media ponderada.-
Supongamos que el Supermercado Alfa vende cinco tipos de
detergentes.- En la tabla siguiente se muestra cada tipo junto
con la utilidad por pote y el nmero de potes vendidos.-

Detergente Utilidad por Volumen de


pote (X) en ventas en Xi * Wi
$ potes (W)
A 2,00 3 6,00
B 3,50 7 24,50
C 5,00 15 75,00
D 7,50 12 90,00
E 6,00 15 90,00
TOTAL 24,00 52 285,50
Se puede calcular la media simple de la utilidad del Supermercado
como 24,00/ 5 = 4,80 $ por pote.-
Sin embargo, probablemente este no sea un buen estimado de la
utilidad promedio del Supermercado respecto a detergentes, debido
a que vende ms de algunos tipos de detergentes que de otros.- Para
obtener un estado financiero ms representativo del desempeo real
de su negocio, el Gerente del Supermercado debe dar ms peso a
los tipos ms populares de detergentes.- Por lo tanto el calculo ms
apropiado sea el de la media ponderada:

xi Wi 285,50
Xp = ---------------- = -------------- = $ 5,49
Wi 52

La media ponderada es mayor que la media simple porque el


Supermercado vende ms detergentes de los tipos que tienen un
margen de utilidad mayor.-
EJERCICIO PARA HACER EN CLASE

1.- La tabla siguiente, contiene el tamao de la poblacin


y la renta personal per capita de una muestra aleatoria
de cinco ciudades importantes de una provincia de
cierto pas.- Calcule la renta personal per capita media
del 2008.-

Ciudad Poblacin Renta personal per


capita
A 125867 32989
B 122674 29758
C 120745 33322
D 127342 26852
E 128456 29764
TOTAL 625084 152685
2.- Un empresario Lus Varesi SA es dueo de tres
fabricas que estn localizadas en La Rioja, Crdoba y
San Juan.- En La Rioja tiene 270 empleados cuya edad
promedio es 42 aos, 320 empleados con edad promedio
47 aos y 200 empleados con edad promedio 38 aos,
respectivamente.- Se pregunta cual es la edad promedio
de los empleados que ocupa el empresario Varesi.-

Empresa Edad promedio Cantidad de


empleados
A.- La Rioja 42 270
B.- Crdoba 47 320
C.- San Juan 38 200
TOTAL 127 790
MEDIA GEOMETRICA

Otra medida de la tendencia central que es importante en las


empresas y en economa, pero que a menudo se pasa por alto es la
media geomtrica.-
Los analistas de empresas y los economistas que tienen inters en
saber cual es el crecimiento en una serie de periodos de tiempo
utilizan la media geomtrica.- Entre las aplicaciones de la media
geomtrica en las finanzas, se encuentran el inters compuesto a lo
largo de varios aos, el crecimiento de las ventas totales y el
crecimiento de la poblacin.- Una importante cuestin es el
crecimiento anual medio que provoca un cierto crecimiento total en
varios aos.-

La media geomtrica, Xg , es la n- raiz del producto de n


elementos: n
1/n
Xg = x1 . x2 ..xn = (x1 .x2..xn)
La media geomtrica se utiliza para hallar el crecimiento
medio de varios productos, dado el crecimiento
compuesto de cada producto.- Por ejemplo, la media
geomtrica de:
1,05 1,02 1,10 1,06 es

1/4
Xg = ( 1,05 . 1,02 . 1,10 . 1,06) = 1,0571

Veamos un ejercicio:
Hallar la tasa de crecimiento suponiendo que las
ventas han crecido un 25 por ciento en 5 aos.-
Solucin
La tentacin intuitiva, pero ingenua, es dividir simplemente el
crecimiento total, 25 por ciento, por el numero de periodos, 5 y
concluir que la tasa media de crecimiento es del 5 %.- Este resultado
es incorrecto porque no tiene en cuenta el efecto compuesto del
crecimiento.-
Suponiendo que la tasa anual de crecimiento es realmente del 5 por
ciento, en ese caso, el crecimiento total de 5 aos ser:
(1,05 . 1,05 . 1,05 . 1,05 . 1,05 ) = 1,2763 o sea un 27,63 %.-
Sin embargo, la tasa anual de crecimiento r, que dara un 25 % en
cinco ao, debe satisfacer esta ecuacin:
5
( 1 + r) = 1,25
Primero hallamos la media geomtrica:

1/5
Xg = 1 + r = (1,25) = 1,046
La tasa de crecimiento es r = 1,046, o sea 4,6 por ciento.-
Veamos otro ejemplo:

Suponga que recibe un aumento de sueldo de 5% este


ao y recibir uno de 15% el ao prximo.- El aumento
porcentual promedio es de 9,886 % y no 10,0.- Por
qu?.- Comience calculando la media geomtrica.-
Recuerde por ejemplo, que un aumento de 5% en el
sueldo es 105 o bien 1,05.- Usaremos 1,05.-
Xg = 1,05 . 1,15 = 1,09886

Lo anterior se puede verificar suponiendo que su ingreso


mensual inicial era de 3000$ y que recibi dos aumentos
de 5 % y 15 %.-
Aumento 1 = 3000,0 (0,05) = 150,0$
Aumento 2 = 3150,0 ( 0,15) = 472,50 $
Donde 150,0 + 472,50 = 622,50 $
El aumento total en el sueldo es de 662,50 $.- Esto
equivales a:
3000,00 . (0,09886) = 296,58 $
3296,58 . (0,09886) = 325,90 $
Donde 296,58 + 325,90 = 622,48 $

Veamos otro ejemplo:

Las ganancias obtenidas por la constructora


Alfa SRL en cuatro proyectos recientes fueron
de 3%, 2%, 4% y 6%.- Cul es la media
geomtrica de la ganancia?.-
Solucin
La media geomtrica es de 3,46%, que se obtiene de
hacer:
4 4

Xg = 3 . 2 . 4 . 6 = 144

La media aritmtica de las utilidades es de 3,75% que se


obtiene de sumar los cuatro valores y dividir por 4.-
Aunque la ganancia del 6% no es extremadamente
grande hace que la media aritmtica se eleve.- La media
geomtrica de 3,46, da una cifra mas conservadora, ya
que no esta siendo afectada por el valor grande.- De
hecho, siempre ser menor que o igual a la media
aritmtica.-
Un segundo uso de la media geomtrica es
encontrar aumentos porcentuales promedios
en un intervalo de tiempo.-

Por ejemplo, si se ganaron 30000 dlares al ao, en 1990,


y 50000 dlares en el ao 2000, Cul es la tasa de
aumento en el periodo?.- La tasa de aumento se
determina mediante la siguiente formula:

n
Valor al final del periodo
Xg = - 1
Valor al inicio del periodo

En la formula el n es el numero de periodos.-


Un ejemplo ficticio, mostrara los detalles para encontrar
el aumento porcentual promedio anual.-

Supngase que la poblacin de un puesto es de 2


habitante en 1991 y en 2001 era de 22 habitantes.-
Cul fue la tasa de crecimiento anual promedio para
ese periodo?.-

10
22
Xg = - 1
2

= 1,2710 - 1 = 0,2710
El valor final es 0,2710.- De modo que la tasa de aumento
anual es de 27,1 %.- Es decir que el puesto tuvo una
tasa de crecimiento de la poblacin de 27,1% al ao.-
Cuartiles
Se lo simboliza con Qr., donde con r indicamos el orden del
cuartil que queremos calcular. Los cuartiles dividen mi distribucin
de datos u observaciones en cuatro partes iguales o sea que
tenemos tres cuartiles el cuartil de orden 1, de orden 2 y el de
orden 3, y en cada uno se encuentra el 25 % del total de casos
observados.

El cuartil de orden 1 es aquel que me deja un 25 % de datos a


izquierda y un 75 % a derecha, de su valor.

El cuartil de orden 2 es aquel que me deja un 50 % de datos a


izquierda y un 50 % a la derecha, de su valor. Coincide con la
mediana.

El cuartil de orden 3 es aquel que me deja un 75 % de datos a


izquierda y un 25 % a derecha, de su valor.
CUARTILES PARA DATOS SIN AGRUPAR.-
Lo primero que debemos hacer es agrupar los datos en forma
creciente.- Realizado esto, calculamos el orden del valor de variable
que ser el Cuartil buscado.- Puede darse:

Si me da un valor entero, el cuartil


buscado ser el valor de variable
que ocupe ese lugar.-

Si me da un valor decimal en 5, el
cuartil buscado ser el promedio
(n + 1) r
entre el dato posicin del entero y
Qr = = el siguiente.-

4 Si me da un valor ni entero, ni
decimal en 5, el cuartil buscado
ser el dato que ocupe la
posicin siguiente al valor
entero.-
Veamos un ejemplo.-
Supongamos tener las edades de una muestra de empleados de
cierta empresa textil.- Estos resultaron ser:
22-58-24-50-29-52-57-31-30-41-44-40-46-29-31-37-32-44-49-29
Ordenamos en forma creciente los datos:
22-24-29-29-29-30-31-31-32-37-40-41-44-44-46-49-50-52-57-58

Q1 = 5,25 posicin Q1 = 30 aos

El 25 % de los empleados tienen 30 aos o menos.-

Q3 = 15,75 posicin Q3 = 49 aos

El 75 % de los empleados tienen 49 aos o menos.-


CUARTILES PARA DATOS AGRUPADOS SIN
INTERVALOS.-

Supongamos que a una muestra de empleados de cierta empresa


se les pregunto la cantidad de hijos que tienen.- Resulto la
siguiente distribucin:

xi fi Fi Fi%
El cuartil 3 nos implica el
0 4 4 6,7 75%, por lo tanto buscamos
el menor porcentaje que lo
I 9 13 21,7 cubre, y observamos el
valor de variable que le
2 12 25 41,7
corresponde, entonces:
3 18 43 71,7
Q3 = 4 hijos.-
4 10 53 88,3
El 75% de los empleados
5 7 60 100,0 tienen 4 hijos o menos.-

Total 60 ------ ------


CUARTILES PARA DATOS AGRUPADOS EN
INTERVALOS.-
Supongamos tener los tiempos en minutos que demoran los
empleados de una empresa en realizar una tarea.- Los valores
fueron:


n * r Fi - 1

Li Ls fi Fi Fi%
Q r Li 4 *
ci
fi
12 16 3 3 5,8

16 20 7 10 19,2
13 - 10
20 24 12 22 42,3
Q1 = 20 + ----------------- 4 =
24 28 15 37 71,2
12
28 32 10 47 90,4

32 36 5 52 100,0
= 21 minutos
TOTAL 52 ------ ----- El 25% de los empleados
demoran 21 o menos
minutos en realizar la tarea.-
PERCENTILES .- Se simbolizan P r

Los percentiles me dividen las observaciones en cien partes


iguales.-
Para los tres casos que vimos cuartiles, los percentiles se aplica
el mismo criterio solo que recordemos que dividen las
observaciones en 100 partes iguales.- Es decir que en todos los
casos que usamos 4 debemos usar 100.- Vamos a ver esto
mediante ejemplos.-
PERCENTILES PARA DATOS SIN AGRUPAR.-
Supongamos tener una muestra de 15 alumnos a los cuales se
les pregunto la cantidad de materias aprobadas.- Los datos
fueron ya ordenados:
3 5 5 5 6 7 7 7 7 8 8 8 10 13 15

P62% = 9,92 P62% = 8 materias


El 62% de los alumnos tienen 8 materias aprobadas o menos.-
PERCENTILES PARA DATOS AGRUPADOS SIN
INTERVALOS.-

Supongamos que a una muestra de empleados de cierta empresa


se les pregunto la cantidad de hijos que tienen.- Resulto la
siguiente distribucin:

xi fi Fi Fi%
El PERCENTIL 82%, nos
0 4 4 6,7 implica el 82%, por lo tanto
buscamos el menor
I 9 13 21,7 porcentaje que lo cubre, y
2 12 25 41,7 observamos el valor de
variable que le corresponde,
3 18 43 71,7 entonces:
4 10 53 88,3 P82% = 4 hijos.-
5 7 60 100,0 El 82% de los empleados
tienen 4 hijos o menos.-
Total 60 ------ ------
PERCENTILES PARA DATOS AGRUPADOS CON
INTERVALOS
Supongamos tener los tiempos en minutos que demoran los
empleados de una empresa en realizar una tarea.- Los valores
fueron:

n
* r Fi - 1

P 70% Li 100
Li Ls fi Fi Fi% *
ci
12 16 3 3 5,8 fi

16 20 7 10 19,2

20 24 12 22 42,3 36,4 - 22

24 28 15 37 71,2 P70% = 24 + ----------------- 4 =


28 32 10 47 90,4 15

32 36 5 52 100,0 = 27,84 28 minutos

TOTAL 52 ------ ----- El 70% de los empleados


demoran 28 minutos o menos
en realizar la tarea.-
RANGO DEL PERCENTIL.-
Nos encontramos con muchas situaciones en las que tenemos
una serie de datos ordenados en un tabla de frecuencia y nos
preguntan que porcentaje de datos estn por debajo de un
determinado valor de variable, y esto es lo que nos dice el Rango
del Percentil.- Veamos esto en el ejemplo anterior.-

Calculamos el Rango mediante la siguiente formula:


Fi-1 + ( xi - Li) fi/ci

Rp(xi) = -------------------------------------- x 100


n
Supongamos tener los tiempos en minutos que demoran los
empleados de una empresa en realizar una tarea.- Los valores
fueron:
Calculamos el Rango mediante la
Li Ls fi Fi F i% siguiente formula:
12 16 3 3 5,8 Fi -1 + ( xi - Li) fi /ci

16 20 7 10 19,2 Rp(22) = ------------------------------ 100


20 24 12 22 42,3 n
24 28 15 37 71,2

28 32 10 47 90,4 10 + 6

32 36 5 52 100,0 = --------------- 100 = 30,77

TOTAL 52 ----- ----- 52


- 31 %
El 31% de los empleados demoran en realizar la tarea 22 minutos o
menos.-
Podemos preguntarnos Por qu estudiar la
dispersin?.- Un promedio como la media o la mediana
solamente localiza el centro de los datos y esto es
importante desde ese punto de vista, pero un promedio
no dice nada acerca de la diseminacin de los datos.-

Por ejemplo, usted es el Administrador o Contador de


un gran comercio y una sucursal.- Le solicitan analizar
las ventas del ultimo ao.- Saca una muestra de datos en
ambos, la describe y determina que el monto de venta
promedio en ambos comercio es el mismo.- usted se
conformara solo con ese dato? y le dira al Gerente que
ambos comercio andan bien.- Seguramente no, tratara
adems de buscar alguna medida que le pueda indicar
que paso con todas las ventas respecto a su promedio.-
Las medidas que le indicaran esto, son las llamadas
Medidas de Variabilidad o de Dispersin.-
Un valor pequeo para una medida de
dispersin indica que los datos se encuentran
acumulados cercanamente, por ejemplo
alrededor de la media.- Por lo tanto la media se
considera bastante representativa de los datos.-
Por lo contrario, , una medida de dispersin
grande indica que la media no es confiable, es
decir, que no es representativa de los datos.-
Una segunda razn para estudiar la dispersin
en un conjunto de datos es poder comparar
cun dispersa estn dos o ms distribuciones.-
Dos distribuciones pueden tener iguales
medidas de tendencia central y sin embargo
mostrar grados de dispersin diferentes.
fr e c u e n c i a r e l a ti v a

0,00
0,09
0,18
0,27
0,36
fr e c u e n c ia r e l a ti v a

0,00
0,09
0,18
0,27
0,36

Media
RANGO O RECORRIDO DE LA VARIABLE.-
Se simboliza Rx .- Se la calcula haciendo la diferencia entre el
mximo valor de la variable y el mnimo que toma.-
Como medida de dispersin se la toma poco en cuenta ya que nada
me dice de los valores intermedio de la variable.-
Un uso importante del Rango lo encontramos cuando vemos la
Estadstica Descriptiva en el Control de Calidad de Procesos.-

RANGO INTERCUARTLICO .-

Se simboliza con Rint.-


RIC = Q3 - Q1
Esta medida considera la dispersin de la mitad (parte
central) de los datos; por lo tanto, los valores extremos
no influyen en ella.- Es una buena medida de dispersin
cuando los datos estn mejor representados por la
mediana.-
VARIANCIA O VARIANZA.-
Aunque el rango es una medida de la dispersin total y el rango
intercuartlico es una medida de la dispersin media, ninguna de
estas medidas de variacin toman en cuenta como se distribuyen o
agrupan las observaciones.- Por lo tanto se pens en una medida
estadstica que me tuviera en cuenta todos los datos y esa medida
es la VARIANCIA.-
Simbolizamos a la variancia:

Sx si trabajamos con la muestra


si trabajamos con la poblacin
Como no conocemos la poblacin vamos a calcular la variancia de la
muestra.-

A igual que las otras medidas descriptivas las podemos


calcular para datos sin agrupar, par datos agrupados sin
y con intervalos.-
VARIANCIA DE LA MUESTRA.-
La variancia de la muestra es la suma de los cuadrados de las
diferencias con relacin a la media aritmtica dividida entre el
tamao de la muestra menos uno.-

( xi - x)
Sx =
n - 1
Si el denominador fuera n en lugar de (n 1), se obtendra el
promedio de los cuadrados de las diferencias con respecto a la
media.- Si embargo, se utiliza (n 1) debido a ciertas propiedades
matemticas deseadas que tiene el estadstico S, lo cual lo hacen
muy apropiadas para hacer inferencias estadsticas.- A medida
que se aumenta el tamao de la muestra, la diferencia entre n y (n
1) disminuye cada vez ms.-
La variancia como esta definida como un valor cuadrado nunca
puede ser negativa.-
No tiene explicacin por estar definida como un valor cuadrado y
nos da un resultado con unidad de medida al cuadrado.- Por ejemplo,
si estamos trabajando datos en $, la variancia nos va dar un
resultado en $, si trabajamos empleados nos dar empleados al
cuadrado, etc.-
Ser igual a cero cuando no exista diferencia entre los datos, es
decir, todas las observaciones en la muestra deberan ser
exactamente iguales.-
En este improbable caso, el rango y rango intercuartlico tambin
sera igual a cero.-
Los datos numricos por naturaleza, son variables no constantes.-
Cualquier fenmeno aleatorio de inters puede adquirir una amplia
variedad de valores.- Entonces, la importancia de estudiar, no solo
las medidas de tendencia central que resumen nuestros datos, sino
tambin las medidas de variacin que reflejan la dispersin de los
datos numricos, se debe a esa variacin intrnseca de los datos.-
Como su calculo es bastante complicado,
surge la llamada Formula de Calculo de la
Variancia, que abrevia mucho el calculo de
la misma.-

x - n x
S x = para datos sin agrupar

n - 1
x fi - n x
Sx = para datos agrupados
n - 1
Esta frmula ser para datos agrupados sin y con
intervalos.- La diferencia se da en el valor de las
observaciones xi, ya que en datos agrupados sin
intervalo sern los datos originales, y en datos
agrupados con intervalos sern los puntos
medios de los intervalos.-
Como dijimos, la variancia me da un resultado en
unidades de medida de la variable al cuadrado,
entonces aparece otra medida que llamamos
Desvo Estndar.-
DESVIACION ESTANDAR

La simbolizamos con sx en la muestra y con x en la poblacin.-


La desviacin estndar mide la dispersin promedio alrededor de
la media: como fluctan las observaciones mayores arriba de ella
y las observaciones menores debajo de ella.-
El desvo estndar es la verdadera medida de dispersin ya
que se expresa en las mismas unidades de medida que los datos
originales.-
Calculamos la desviacin estndar como:

sx = variancia

Observamos que la media y el desvo estndar ayudan a definir en


donde se agrupan la mayor parte de los datos.-
Veamos un ejemplo de calculo del Desvo Estndar.-
Supongamos que se ha tomado un Parcial de la ctedra de
Estadstica y se calific al mismo de 0 a 10.- Las notas de una
muestra aleatoria de alumnos fueron resumidas en una tabla de
frecuencia y son:

Notas fi xi Xi * fi x i Xi * fi

0 2 5 1 5 1 5

2 4 9 3 27 9 81

4 6 14 5 70 25 350

6 8 20 7 140 49 980

8 10 2 9 18 81 162

TOTAL 50 ------- 260 ----- 1578


XI * fi x fi - n x
Sx = ----------------------- =
X = ---------------- = n - 1
n
1578 - 1352
260 = ---------------------- =
49
= ----------- = 5,2
50 226
= -------- = 4,61 ptos
5 puntos
49

sx = variancia = 4,61 ptos. = 2,15 puntos

En promedio cada nota se diferencia de la media en 2 puntos.-


VARIANCIA DE LA POBLACION

La variancia de la POBLACION es la suma de los cuadrados de


las diferencias con relacin a la media aritmtica poblacional
dividida entre el tamao de la poblacin.-

( xi - )
x =
N

Esta variancia poblacional, nunca la calculamos porque


sostenemos que las poblaciones son muy grandes, es un
parmetro, y a estos aprenderemos a estimarlos en la Unidad de
Estimaciones.-
EJERCICIOS PARA HACER EN CLASE
1.- Diez economistas recibieron el encargo de predecir el
crecimiento porcentual que experimentar el ndice de
precio al consumidor el prximo ao.- Sus predicciones
fueron:
3,6 3,1 3,9 3,7 3,5 3,7 3,4 3,0 3,7 3,4
Calcule y explique la dispersin de los datos.-

2.- Una consultora, analiza las ventas alcanzadas en la


navidad de los 10 grandes negocios que posee una
ciudad chica.- Observ respecto al ao anterior, los
siguientes incrementos porcentuales:
10,7 3,1 5,9 7,0 3,7 3,9 6,8 7,3 8,2 4,3
Calcule la dispersin de los datos.-
USOS DEL
DESVIO
ESTANDAR.-
Un Desvo Estndar pequeo nos indica que los datos
estn o se encuentran localizados muy cerca de la media,
caso inverso significa que los datos estn muy lejos de
su media.- Por supuesto ms chico sea el Desvi
Estndar mejor sern nuestros datos.-

El matemtico ruso Chebycheff (1821 1894) desarrollo


un teorema que permite determinar la proporcin mnima
de valores que se encuentran dentro de un nmero
especfico de desviaciones estndar con respecto a su
media.-
Para este matemtico no importa la forma de la
distribucin es decir puede ser simtrica o asimtrica y
dice:
Para un conjunto cualquiera de
observaciones (muestra o poblacin)
la proporcin mnima de valores que
se encuentran dentro de k
observaciones estndares desde la
media es al menos (1 - 1/ k) %, donde
k es una constante mayor que uno.-
Por ejemplo si suponemos K = 3, ser:
1 - 1 / 3 = 1 - 1/ 9 = 8 /9 = 88,89 %
Esto me est diciendo que entre la media 3 desvo
estndar se encuentra el 89 % de los datos.-
Si estoy estudiando sueldos, y se que su X = 580$ y el
s = 24,10$, ser:
507,70$

X 3 * s = 580 3 * 24,10 = 580 72,3


652,30$

Podemos decir, que del total de empleados a los cuales


estudiamos el sueldo, el 89 % de ellos cobran entre 508$
REGLA EMPIRICA.-

Esta regla se aplica solo a distribuciones que son simtricas, es


decir aquellas que las medidas de tendencia central son iguales, o
sea, la media, la mediana y el modo.-
Esta regla sostiene:

Que el 68,0% de los datos se encuentran entre la


media ms menos un desvo estndar.-
Que el 95,0% de los datos se encuentran entre la
media ms menos dos desvo estndar.-
Que el 99,0% de los datos se encuentran entre la
media ms menos 3 desvo estndar.-

En una clase prctica veremos aplicacin del uso del Desvo


Estndar.-
EJERCICIO PARA HACER EN CLASE

1.- Un grupo de 13 estudiantes de Administracin se van


de viaje de estudio a Turqua durante cinco semanas.-
Como parte de su estudio de la economa local, cada
uno compra una alfombra oriental y han hecho las
gestiones oportunas para que se la enviara a la
Argentina.- El tiempo que tardaba en llegar cada
alfombra era, en das:
31 31 42 39 42 43 34 30 28 36 37 35
40
Estime el porcentaje de das que se encuentra dentro de
dos desviaciones estndar de la media.- es probable
que se tarde 2 meses en enviar la alfombra?.-
Vea si aplica el Teorema o la Regla emprica o ambas.-
Explique.-
COEFICIENTE DE VARIACIN.-
A diferencia de las medidas que hemos estudiado hasta ahora, el
Coeficiente de Variacin es una indicacin relativa de la variacin.-
Siempre se expresa como porcentaje, y lo simbolizamos con CV x.-
El hecho de no tener unidad de medida hace que pueda usarse para
comparar distribuciones en diferentes unidades de medidas, y
poder decir de ellas cual es ms homognea en sus datos respecto
a la media.-
Se calcula como:
El coeficiente de variacin es igual a la desviacin estndar
dividida entre la media, multiplicada por 100 por ciento.-

S
CVx = -------- * 100
x
Cuando comparamos dos distribuciones
de datos en diferentes unidades de
medida, y queremos saber cual es ms
homognea en sus datos referentes a su
media, no tenemos ms opcin que
comparar los CV, a menor CV ms
homogneos son los datos.- Por ejemplo,
si tenemos una distribucin donde
estudiamos sueldos de la empresa y en la
otra la antigedad en la empresa de esos
mismos empleados, y nos preguntamos en
que son ms homogneos esos
empleados, en sueldos o en antigedad.-
Cuando comparamos dos distribuciones de
datos en igual unidad de medida podemos
preguntarnos en cual distribucin son ms
homogneos los datos respecto a su media.- En
este caso podemos comparar los desvos
estndar solo si las medias son iguales, y el
menor desvo estndar ms homogneos son
los datos.-

Cuando las medias son diferentes no es objetivo


comparar las desviaciones, y en esos casos
recurrimos a comparar los Coeficientes de
Variacin.- A menor CV ms homogneos son
los datos respecto a su media.-
EJERCICIO PARA HACER EN CLASE

1.- Los siguientes datos representa los montos de ventas diarias,


de una muestra aleatoria de 15 das de dos comercios de
artculos del hogar, durante el ao 2008.- (en miles de pesos).-

Comercio A Comercio B
10.5 8.9 9.6 7.9 10.6 8.4
10.1 9.3 9.1 8.2 10.1 9.2
10.0 9.7 11.2 9.1 8.5 10.7
11.0 10.4 10.5 9.3 7.5 9.8
9.8 10.0 9.9 8.8 9.3 9.5

Para cada serie de datos calcule:

Indique que Comercio tiene ventas ms homogneas.-


MEDIDAS DE FORMA.-
Las medidas de forma hacen referencia a la forma de la
distribucin de datos.- Ya hemos comentado que pueden ser
simtricas, o asimtrica o segadas.-
Para describir la forma, solamente se deben comparar
la media y la mediana.- Si ambas medidas son iguales,
por lo general se considera que los datos son
simtricos o con sesgo cero.- Por el contrario, si la
media excede a la mediana, los datos se describen
como sesgados a derecha o con sesgo positivo.- Si la
mediana excede a la media, los datos suelen llamarse
sesgados a izquierda o con sesgo negativo.-

Media > Mediana : sesgo positivo a la derecha


Media = Mediana; simetra o sesgo cero
Media < Mediana: sesgo negativo o a la izquierda.-
El sesgo positivo surge cuando la media aumenta debido a algunos
valores grandes y poco usuales; el sesgo negativo ocurre cuando la
media se reduce debido a algunos valores muy pequeos.- Los datos
son simtricos cuando en realidad no hay valores extremos en
ninguna direccin, de tal manera que los valores grandes y pequeos
se equilibra.-

Asimtrica a izquierda o negativa

Simtrica Asimetra a derecha o positiva


COMO
COMO MEDIR
MEDIR
LA
LA
ASIMETRIA
ASIMETRIA
Como sealramos oportunamente la silueta de la forma
de la distribucin (polgono de frecuencias) nos da una
idea acerca de la simetra del conjunto de datos.- As
tenamos que, en la situacin de simetra, cada mitad de
la curva es una imagen espejada de la otra mitad y la
recta que hace de espejo (eje de simetra) es la que pasa
por las medidas de tendencia central media, mediana y
modo, que coinciden en el mismo valor.-

Eje de simetra

Variable

X = Me = Mo
A medida que la distribucin se hace ms asimtrica
hacia uno u otro lado (derecha e izquierda), las medidas
de tendencia central tienden a alejarse una de otra,
siendo la media por estar afectada por los valores
extremos la que ms se desplaza hacia la cola de la
distribucin.-

X Me Mo Mo Me X

X < Me < Mo X > Me > Mo


Vemos en los Grficos que, en el caso de una asimetra a
la izquierda, la media es menor que la mediana y esta a
su vez menor que el modo.- Inversamente en la asimetra
hacia la derecha, la media es mayor que la mediana y a
su vez esta mayor que el modo.-
Se puede ver adems que la mediana toma un valor
intermedio entre las otras dos medidas, ubicndose ms
prxima a la media.-
A medida que la asimetra crece en una u otra direccin,
tambin las distancias entre la media, mediana y modo
crecen.- En consecuencia, podemos usar estas
diferencias ( X Mo) o ( X - Me) como medidas absoluta
de la asimetra de una distribucin.- Adems, se puede
ver que si la asimetra es a la izquierda, ( X Mo) dar un
valor negativo, en tanto que si la asimetra es a la
derecha dar un valor positivo.-
EN SINTESIS:
x - MO = 0 SIMTRICA

X - MO < 0 ASIMETRIA NEGATIVA


X - MO > 0 ASIMETRIA POSITIVA

Adems, cuanto mayor sea el valor absoluto de la


diferencia, mayor ser el grado de asimetra de la
distribucin:

a mayor | X - Mo| mayor asimetra


Para poder comparar asimetra de distribuciones de
variables medidas en distintas escalas o para valores
de distintas magnitudes, la solucin es construir
medidas relativas de asimetra.-

COEFICIENTE DE ASIMETRIA DE PEARSON.- (CAP)

Una de las medidas de asimetra ms difundida es este


Coeficiente, que se calcula esa diferencia en trminos
del desvo estndar.-

X - Mo 3( X - Me)
CAP = o CAP =
s s
Comentarios
La magnitud absoluta del coeficiente indica la
cantidad de desvo estndar a los que se encuentra
la media del modo.-
Se lo puede expresar en porcentaje, multiplicando
por cien el resultado de la expresin anterior.-
Si el coeficiente es igual a cero, estamos en una
situacin de simetra perfecta.-
En situaciones de asimetra el coeficiente puede
tomar una asimetra a derecha o a izquierda.-
Recordemos que una es positiva y la otra negativa.-
En trminos tericos, este Coeficiente puede tomar
valores que varan entre - 3 y +3.-
ANALISIS
EXPLORATORIO DE
DATOS

RESUMEN DE CINCO
NUMEROS
Cuando hemos desarrollado el Anlisis Exploratorio de Datos, se
dijo que ordenbamos los datos mediante un diagrama de tallo y
hoja.- Es importante identificar y describir las caractersticas
principales de los datos en forma resumida.- Un enfoque a este
resumen
Anlisis Exploratorio de datos es desarrollar un
de cinco nmeros y construir un
diagrama de caja y bigotes.-

En un resumen de cinco nmeros se emplean los siguientes


datos
1.- Valor mnimo.-
2.- Primer cuartil.-
3.- Mediana.-
4.- Tercer cuartil.-
5.- Valor mximo.-
La forma ms fcil de elaborar un resumen de cinco nmeros es
poner los datos en orden ascendente, as es fcil identificar los
cincos datos.- Veamos un ejemplo:
Supongamos tener los salarios de 12 gerentes de empresas
medianas, ordenados son:
2710 2755 2850 2880 2880 2890 2920 2940 2950
3050 3130 3325 3051
La mediana es Me = 2905 y los cuartiles Q1 = 2880 y Q3 = 3050 los
otros dos datos es fcil verlos.-

DIAGRAMA DE CAJA Y BIGOTES.- (Boxplot)

Un diagrama de caja es un resumen grfico de los datos


basado en un resumen de cinco datos y nos da una idea
de forma de la distribucin de los datos, adems de
poder determinar si tenemos valores atpicos.-
Los pasos para trazar un diagrama de caja y bigote son:
1.- Se traza un rectngulo con los extremos en el primer cuartil y
tercer cuartil.- Este rectngulo contiene el 50% de los datos.-
2.- En la caja se traza una recta vertical en el lugar de la mediana, as,
la lnea de la mediana divide los datos en dos partes iguales.-
3.- Se ubican los lmites mediante el rango intercuartil RIC = Q 3 Q1 .
Los lmites en el diagrama estarn dados segn la Regla de Tukey
en Q1 - 1,5 * RIC y Q3 + 1,5 * RIC.-
Todos los valores que nos queden fuera de esos lmites son
considerados valores atpicos.-
4.- Las lneas punteadas a los costados de la caja se llaman bigotes
de la caja y se trazan de Tukey al cuartil 1 y del cuartil 3 al valor
Tukey.-
5.- Por ltimo se marca con asterisco si hay algn valor atpico.-
----------- ---------- *

2400 2600 2800 3000 3200 3400


Boxplot of Sueldo
3400

3300

3200

3100
Sueldo

3000

2900

2800

2700
1obs 2obs 3obs
41 70 22
78 53 68
84 34 48
60 36 25
46 47 29
64 16 56 Suponga que tiene las tres
43 53 64
37 43 30
observaciones correspondientes a tres
50 29 57 meses diferentes de su empresa.-
57 83 32
24 42 39 Decide comparar la situacin de su
78 48 39
51 57 50 empresa en los tres meses mediante
41 29 35 diagramas de caja y bigote.- Resulta el
56 64 36
46 41 16
diagrama siguiente:
99 86 98
71 54 39
41 2 53
41 39 36
22 40 46
62 70 46
64 52 57
44 38 60
41 63 62
Boxplot of 1obs; 2obs; 3obs

100

80

60
Data

40

20

0
1obs 2obs 3obs
VEAMOS OTRO EJEMPLO.-

La tabla siguiente muestra las puntuaciones obtenidas


en el examen final de Estadstica para quince
estudiantes de Economa, quince de Administracin y
quince de Contador.-

ECONOMIA ADMINISTRACION CONTADOR


47 72 56 76 43 80
52 72 59 80 48 80
52 78 59 83 50 83
57 81 61 83 55 85
63 81 67 84 61 89
64 86 69 90 67 91
69 91 73 94 72 97
71 76 78
Boxplot of 1; 2; 3
100

90

80
Data

70

60

50

40
1 2 3
La figura anterior contiene los diagramas de caja
de las puntuaciones de cada uno de estos tres
grupos.- En este ejemplo concreto, puede
apreciarse que no hay observaciones
excesivamente atpicas en ninguno de los tres
grupos.- Por eso, los bigotes de las cajas
corresponden a la menor y mayor puntuacin de
cada grupo.- En el diagrama se observa que los
estudiantes de Contador consiguieron la mejor
mediana, pero sus puntuaciones tienen una
variabilidad considerablemente mayor que la de
los otros grupos.- Otro hecho que llama la
atencin es la gran cantidad de puntuaciones
bajas obtenidas por los estudiantes de
Economa.-
EJERCICIO DE
MEDIDAS DESCRIPTIVA
Y
DIAGRAMA DE CAJA
CON INFOSTAT
Supongamos tener el Rendimiento anual, de una muestra de 50
fondos mutuos que se tomaron de 6858 fondos mutuos que se
publicaron en una Revista Econmico Financiera en febrero del
2006.- Para cada fondo el rendimiento anual se da como porcentaje,
los valores fueron:

0,5 1,1 2,0 3,6 1,9 2,6 1,3 3,2 2,4 1,5

1,8 1,6 3,8 2,4 2,3 3,1 3,0 2,4 2,8 0,7

4,0 2,3 3,0 0,8 1,2 2,5 2,7 2,5 2,7 3,7

1,0 3,5 2,3 3,4 1,9 1,7 1,2 1,9 4,5 1,8

2,0 2,2 1,8 1,4 2,3 5,0 1,5 3,1 2,1 1,7
C:\ Archivos de programa\ InfoStat\datos\Rendimientos fondos
(pier).IDB: 22/03/2006 - 6:41:08

Estadstica descriptiva
Resumen Columna1
n 50,00
Media 2,31
D.E. 0,98
Var(n-1) 0,95
CV 42,22
Mn 0,50
Mx 5,00
Mediana 2,30
Q1 1,70
Q3 3,00
Asimetra 0,53
Kurtosis 0,21
P(90) 3,60
5,2

4,0
Rendimiento anual en %

2,8

1,5

0,3

Boxplot con InfoStat


Boxplot of Rendimiento anual en %

4
Rendimiento anual en %

0
EJEMPLOS PARA RESOLVER EN CLASE

1.- Pedro Cuello, trabaja como corredor para E. F.


Hutton.- Sus registros muestran que las tasas de
rendimiento (en porcentaje) sobre dos valores para 10
meses seleccionados al azar fueron:
Valor 1: 5,6 7,2 6,3 6,3 7,1
8,2 7,8 5,3 6,2 6,2
Valor 2: 7,5 7,3 6,2 8,3 8,2
8,0 8,1 7,3 5,9 5,3
a) Cul valor puede ser mejor para los clientes que
estn interesados en un rendimiento ms alto?.-
b) Cul valor debera aconsejar Pedro a sus clientes
que prefieren menos riesgo?.-
2.- Aqu se muestran las relaciones precio ganancia para
30 acciones diferentes transadas en la Bolsa de Valores
de Nueva York.-

4,8 5,2 7,6 5,7 6,2 6,6 7,5 8,0 9,0 7,7
3,7 7,3 6,7 7,7 8,2 9,2 8,3 7,3 8,2 6,5
5,4 9,3 10,0 7,3 8,2 9,7 8,4 4,7 7,4 8,3

a) Calcule y explique la media y desviacin estndar.-


b) De acuerdo con el Teorema de Chebycheff, por lo menos
Cuntas relaciones precios ganancias estn dentro de dos
desviaciones estndar de la media?.-
c) Cuntas estn realmente a dos desviaciones estndar de la
media?.-
Resp. a) 7,3367 1,5464 b) 22,5 c) 29
3.- Un profesor ensea a dos grupos de introduccin al
marketing y selecciona aleatoriamente una muestra de
calificaciones de los exmenes realizados por los dos
grupos.- Halle el rango y la desviacin estndar de cada
muestra.- Compare y de conclusiones.-
Grupo 1: 50 60 70 80 90
Grupo 2: 72 68 70 74 66

4.- Las hermanas Tolosa son dueas de una casa de


fotografa, estn considerando la posibilidad de invertir
en el Activo A o el B.- No saben cual de los dos es mejor
y le piden consejo a Carlos que entiendo sobre
planificacin financiera.-
Carlos obtiene las tasas de rendimiento de cada activo de
los cinco ltimos aos, que son:
Tasa de rendimiento en %
ACTIVO A ACTIVO B

HACE 5 AOS 11.3 9.4


HACE 4 AOS 12.5 17.1
HACE 3 AOS 13.0 13.3
HACE 2 AOS 12.0 10.0
HACE 1 AO 12.2 11.2
TOTAL 61.0 61.0
a) Calcule la media y desviacin estndar.- Conclusiones.-

5.- En el ejercicio anterior hemos examinado dos


inversiones que tenan la misma tasa media de
rendimiento.- Ahora los propietarios estn considerando
la posibilidad de comprar acciones de la empresa A o de
la empresa B que cotizan de bolsa.-
Basndose en los precios de cierre de las acciones de las
dos empresas de los ltimos meses, se observ que las
desviaciones tpicas eran muy diferentes: SA = 2,00 $ y
SB = 8,00 $.- Deben comprarse las acciones de la
empresa A, dado que la desviacin tpica de las
acciones de la B es mayor?.-

6.- Los registros de los minutos consumidos por una


muestra de 110 abonados al plan ms barato de una
compaa de telefona mvil (250 como mximo en
horas) se encuentran en el fichero.-
El anlisis estadstico arrojo los siguientes resultados:
Minutos consumidos Valores
Media 17.51
Mediana 263.0
Modo 252.0
Variancia 306.68
Desviacin estndar 17.51
Cuartil 1 251.75
Cuarti 3 271.25
RIC 19.50
Coeficiente de variacin 6.71%
Valor mximo 299.0
Valor mnimo 222.0
Sesgo 0.001613

Explique cada medida calculada.- Prepare un informe.-


7.- El tiempo en segundos que tardo una muestra aleatoria
de empleados en realizar una tarea es:

23 35 14 37 45 28
12 40 27 13 25 26
37 20 29 49 13 40
27 16 40 20 66 13

a) Calcular y explicar la media y el desvo estndar.-


b) Realice un resumen de cinco datos.- Explique.-
c) Calcule y explique el Coeficiente de variacin.-
8.- Los rendimientos porcentuales anuales de las acciones
fueron los siguientes en un perodo de 7 aos: (en %)
4.0 14.3 19.0 - 14.7 - 26.5 37.2 23.8
Durante ese mismo perodo, los rendimientos
porcentuales anuales de las Letras del Tesoro fueron los
siguientes:
6.5 4.4 3.8 6.9 8.0 5.8 5.1
Compare las medias de estas dos distribuciones
poblacionales.-
Compare las desviaciones estndar de estas dos
distribuciones poblacionales.-
Comente y haga un informe.-
9.- Los beneficios por accin de una muestra de ocho
empresas americanas experimentaron las siguientes
variaciones porcentuales este ao en comparacin con
el ao anterior:
13.6 25.5 44.6 - 19.8 12.0 36.3 14.3 - 13.8
Halle la variacin porcentual media muestral de los
beneficios por accin.-

10.- El director de operaciones de una planta


embotelladora de agua mineral quiere estar seguro de
que el proceso de embotellado de botellas de 1 galn
esta funcionando correctamente.- (1 galn = 4.543 litros)
Se selecciona una muestra aleatoria de 75 botellas y se
mide el contenido.- El volumen de cada botella se
encuentra en el fichero (Water).-
MEDIDAS CALCULADAS VALORES
MEDIA 3.8079

VARIANCIA 0.0105

DESVIO ESTANDAR 0.1024

COEFICIENTE DE VARIACION 2.6900

VALOR MNIMO 3.5700

VALOR MAXIMO 4.1100

CUARTIL 1 3.7400

QUARTIL 3 3.8700

MEDIANA 3.7900

MODO 3.7700

RIC 0.1300

RANGO 0.5400

SESGO 0.4500

Prepare un informe para el director.-


11.- Se ha pedido a una muestra de 20 analistas
financieros que hagan un anlisis estadstico de los
beneficios por accin que obtendr una empresa el
prximo ao.- La tabla adjunta resume los resultados:

$ por accin Nmero de analista


9.95 10.45 2
10.45 10.95 8
10.95 11.45 6
11.45 11.95 3
11.95 12.45 1

Realice un anlisis estadstico completo.- Prepare un


informe para su cliente.-
12.- Un editor recibe de una imprenta un ejemplar de un
libro de texto de 500 pginas.- Las pruebas se leen
minuciosamente, se anota el nmero de erratas que hay
en cada pgina y se obtienen los datos de la tabla
siguiente:

Nmero de erratas Nmero de pginas


0 102
1 138
2 140
3 79
4 33
5 8

Prepare un informe para el editor, realizando un anlisis


estadstico.-
MEDIDAS DE LAS
RELACIONES
ENTRE
VARIABLES
Cuando hemos hablados de los distintos grficos para
mostrar los datos, hemos hecho referencia al diagrama
de dispersin como grafico para mostrar las relaciones
entre variables.- Ahora introduciremos la covariancia y
la correlacin, que permiten describir numricamente
una relacin lineal y que despus en la Unidad de
Regresin lineal simple y Correlacin nos dedicaremos
en detalle.-

La covariancia es una media del sentido de


una relacin lineal entre dos variables .- Un
valor positivo indica una relacin lineal directa o
creciente y un valor negativo indica una relacin lineal
decreciente.- Una covariancia poblacional ser:
(xi x) (yi - y)
Cov (x; y) = x,y =
N
Donde X e Y son los valores observados, x y y son
las medias poblacionales y N es el tamao de la
poblacin.-

Una covariancia muestral es:

(xi x) (yi - y)
Cov (X;Y) = Sxy = n-1

El coeficiente de correlacin muestral nos da una medida


estandarizada de la relacin lineal entre dos variables.-
Generalmente es una medida mas til, ya que indica
tanto el sentido como el grado de la relacin.- La
covariancia y el coeficiente de correlacin
correspondiente tienen el mismo signo (ambos son
negativos o ambos son positivo).-
El coeficiente de correlacin se calcula dividiendo la
covariancia por el producto de las desviaciones
estndares de las dos variables.-
El Coeficiente de Correlacin poblacional ser:
Cov (x; y)
=
x y

Donde x y son las desviaciones estndar poblacionales


de las dos variables.-
El coeficiente de correlacin muestral ser:
Cov (x; y)
r =
sx sy
Donde Sx y Sy son las desviaciones estndar
mustrales de las dos variables.-
Una regla til y practica que se suele usar es que existe
una relacin entre las variables numricas si:

r = 2

El coeficiente de correlacin seala la relacin o


asociacin lineal entre dos variables numricas.-
Cuando el coeficiente de correlacin se acerca a +1 o a
-1, es mas fuerte la relacin o asociacin entre las dos
variables.- Cuando el coeficiente de correlacin se
acerca a cero, existe poca o ninguna relacin lineal
entre las dos variables numricas
El signo del coeficiente de correlacin lineal nos indica
de que tipo es la asociacin.- Si el diagrama de
dispersin nos muestra una nube de puntos creciente,
es decir que a medida que crece una variable crece la
otra el coeficiente de correlacin lineal ser positivo,
caso inverso ser negativo.- Ser cero cuando no se
evidencia ningn tipo de relacin entre ambas
variables.-

Veamos un ejemplo de
diagrama
de dispersin y su Coeficiente
de correlacin.
EJERCICIO PARA DISCUTIR EN CLASE

Royal Manufacturas SRL, desea estudiar la relacin entre


el numero de trabajadores, X y el numero de mesas, Y,
producidas en su planta de Crdoba.- Ha tomado una
muestra aleatoria de 10 horas de produccin.- Se han
obtenido los siguientes pares de datos:

(12;20) (30:60) (15;27) (24;50) (14;21)


(18;30) (28;61) (26;54) (19;32) (27;57)

Calcule la covarianza y el coeficiente de correlacin.-


Analizar brevemente la relacin entre el numero de
trabajadores y el numero de mesas producidas por
hora.-

SOLUCION
Scatterplot of n de mesas vs n de trabajadores

60

50
n de mesas

40

30

20

10 15 20 25 30
n de trabajadores
La planilla de calculo para calcula la Covarianza y el
Coeficiente de correlacin ser:

x y Xi - x (xi - x) (yi - y) (yi - y) (xi - X) (yi- Y)


12 20 - 9,3 86,49 - 21,2 449,44 197,16
30 60 8,7 75,69 18,8 353,44 163,56
15 27 - 6,3 39,69 - 14,2 201,64 89,46
24 50 2,7 7,29 8,8 77,44 23,76
14 21 - 7,3 53,29 - 20,2 408,04 147,46
18 30 - 3,3 10,89 - 11,2 125,44 36,96
28 61 6,7 44,89 19,8 392,04 132,66
26 54 4,7 22,09 12,8 163,84 60,16
19 32 - 2,3 5,29 - 9,2 84,64 21,16
27 57 5,7 32,49 15,8 249,64 90,06
213 412 -------- 378,1 -------- 2505,6 962,4
Aplicando la ecuacin de la covarianza tenemos:
(xi x) (yi - y)
Cov (x,y) = Sxy = =
n-1

962,4
= 9
= 106,93

Luego tenemos
Cov (x;que
y) el Coeficiente
106,93 de correlacin es:

r = Sx Sy = 108,14758 = 0,989

Luego aplicando la relacin 0,989 0,64

Llegamos a la conclusin de que existe una estrecha


relacin positiva entre el nmero de trabajadores y el
nmero de mesas producidas por hora.-
OBTENCION
DE
RELACIONES
LINEALES
Hemos visto como puede describirse la relacin entre dos
variables utilizando datos muestrales.- Los diagramas de
dispersin representan la relacin y los coeficientes de
correlacin son una medida numrica.-
En muchos problemas econmicos y empresariales se
desea una relacin especfica.- Por ejemplo:
Si se emplean 250 trabajadores, Cuntas unidades
cabe esperar?.-
Qu nivel medio de ventas cabe esperar si el precio se
fija en 10$ por unidad?.-
Si un pas en va de desarrollo aumenta su produccin
de fertilizantes en un milln de toneladas, Cunto cabe
esperar que aumente la produccin de cereal?.-
Si aumento el gasto de publicidad, en cuanto espero
que se incremente las ventas del comercio?.........etc.-
Los modelos econmicos utilizan relaciones funcionales
especficas para indicar el efecto que producen en una
variable dependiente Y, algunas variaciones de la variable
independiente X.-
En muchos casos, podemos calcular aproximadamente las
relaciones funcionales deseadas mediante una ecuacin
lineal;
Y = 0 + 1 X + i
Donde Y es la variable dependiente; X es la variable
independiente, 0 es la ordenada en el origen y 1 es la
pendiente de la recta, o sea, la variacin que experimenta
Y por cada variacin unitaria de X.-
En nuestras aplicaciones, partimos de supuesto nominal
de que podemos fijar X en diferentes valores y a cada uno
le corresponder un valor medio de Y debido a la relacin
lineal subyacente en el proceso estudiado.-
El modelo de la ecuacin lineal calcula la media de Y para
cada valor de X.- Esta idea es la base para obtener muchas
relaciones econmicas y empresariales, entre las que se
encuentran las funciones de demanda, las funciones de
produccin, las funciones de consumo y las predicciones
sobre las ventas.-
Utilizamos regresiones para averiguar cual es la mejor
relacin entre X e Y para una aplicacin especfica.- Para
esto es necesario hallar los mejores valores de los
coeficientes 0 y 1.- Generalmente utilizamos los datos de
una muestra para calcular estimaciones de estos dos
coeficientes, generalmente se calculan utilizando el
mtodo de ajustamiento de mnimos cuadrados, tcnica
que se aplica mucho en paquetes estadsticos como Excel
y Minitab.-
El mtodo de mnimo cuadrado selecciona la recta que
mejor se ajusta, dado un conjunto de pares de puntos.-
Veamos por ejemplo:

Grfica de dispersin de y vs. x

20

18

16

14
y

12

10
}
8

6
5,0 7,5 10,0 12,5 15,0 17,5
x

i = b 0 + b1 X
Consideremos el ejemplo de la placa anterior, donde
tenemos pares de puntos de un proceso que tiene una
relacin lineal.-
La ecuacin lineal representada por la recta es la ecuacin
lineal que mejor se ajusta.- Vemos que los puntos de datos
individuales se encuentran por encima y por debajo de la
recta y que esta tiene puntos con desviaciones positiva
como negativas.- Se han usado tambin otros mtodos
para determinar la recta pero se llego a la conclusin que
el mtodo de mnimos cuadrado es la mejor que ajusta los
puntos a la recta, haciendo mnima las distancias de los
puntos a la recta.-
Ms adelante veremos que los coeficientes desarrollados
utilizando este mtodo tienen propiedades estadsticas
muy importantes.-
Una importante cautela que se debe tener es que el caso
de mtodo de mnimo cuadrado, es que los puntos
atpicos extremos pueden tener tal influencia en la recta de
regresin que toda la recta se dirija hacia esos puntos.-
Por lo tanto, siempre debemos examinar los diagrama de
dispersin para asegurarnos de que la relacin de
regresin no se basa solamente en unos cuantos puntos
extremos.-
En la Unidad de regresin y correlacin, desarrollaremos
con mayor precisin este tema.-
La regresin por mnimos cuadrados elige los valores de
b0 y b1 con los que se minimiza la suma de los cuadrados
de los residuos.-
Entonces:
= b0 + b1 X
b1 es la pendiente de la recta o sea la variacin de Y por
cada variacin unitaria de X y se calcula mediante la
siguiente formula:
Cov. (x;y)
b1 =
S x

Donde b0 es la ordenada en el origen cuando X = 0 y se


calcula mediante la siguiente formula:
b0 = x - b 1 y

Veamos un ejemplo
Supongamos que tenemos el numero de trabajadores X y
el numero de mesas producidas por hora Y, para una
muestra de 10 trabajadores.- Si la direccin decide
emplear 25 trabajadores, estime el nmero de mesas que
es probable que se produzcan.- (los datos estn en el
fichero como Rising Hills).-

En un ejemplo anterior hemos calculado la covarianza y el


coeficiente de correlacin, y nos daba;
Cov (x; y) = 106,93 r = 0,989

La covarianza muestra que el sentido de la relacin es


positiva, la elevada correlacin de 0,989 tambin indica
que los pares de datos muestrales estn muy cerca de una
recta ascendente, y los podemos ver en el diagrama de
dispersin siguiente:
Grfica de dispersin de y vs. x
70

60

50

y
40

30

20

10 15 20 25 30
x

Calculamos los coeficientes de regresin muestrales:

Cov. (x;y) 106.93


b1 = = = 2.545
Sx 42.01
b0 = x - b1 y = 41.21 - 2.545 * (21.3) = - 13.02

Entonces ahora podemos decir que la recta de regresin


muestral es:
= b0 + b1 X = - 13.02 + 2.545 X

Con 25 trabajadores es de esperar que se produzcan,

= - 13.02 + 2,545 * (25) = 50.62 = 51 mesas


O sea que se espera que se produzcan alrededor de 51
mesas.-
En esta parte de la Unidad, solo se pretende
aprender a describir dos datos numricamente y
no hacer un anlisis exhaustivo de regresin, ya
que esto lo veremos en una Unidad ms
adelante.-
Por ahora considero que esto es suficiente.-
EJERCICIO PARA HACER EN CLASE
1.- A continuacin se presenta una muestra aleatoria
del precio por tabla de contrachapado, X y la cantidad
vendida, Y en miles.-
Precio por trozo X Miles de trozos vendidos Y
6.5 80
7 60
8 70
9 40
10 0

a) Calcule y explique la covarianza.-


b) Calcule y explique el coeficiente de correlacin.-
c) Calcule y explique b0 y b1.-
d) Que cantidad de tabla es de esperar que vendamos si el precio es
de 7,5 por tabla?.-
2.- Un hospital tiene inters en averiguar la eficacia de
un nuevo medicamento para reducir el tiempo necesario
para recuperarse totalmente de una operacin de
rodilla.- La recuperacin total se mide por medio de una
serie de test de fuerza que comparan la rodilla operada
de la no operada.- El medicamento se administr en
dosis diferentes a 18 pacientes durante un perodo de
seis meses.- Los datos (X;Y) siguientes indican el
nmero de unidades de medicamento X y los das
necesarios para la recuperacin total Y de cada
pacientes:
(5; 53) (21; 65) (14; 48) (11; 66) (9; 46) (4; 56)
(7; 53) (21; 57) (17; 49) (14; 66) (9; 54) (7; 56)
(9; 53) (21; 52) (13; 49) (14; 56) (4; 56) (9; 59)
a) Calcular la covarianza.-
b) Calcule el coeficiente de correlacin.-
c) Analice brevemente la relacin entre el nmero de
unidades de medicamento y el tiempo de recuperacin.-
Qu dosis deberamos recomendar basndonos en
este anlisis inicial?.-
3.- Solano SRL, ofrece tarifas distintas de envo de
paquetes de menos de 5 libras de (recuerde 1 libra es
igual a 453.59 kilogramos) de Crdoba a Capital Federal;
ordinarios 3$, urgente 5$ y superurgentes 10$.- Para
comprobar la calidad de estos servicios, un importante
minorista de ventas por correo envi 15 paquetes de
Crdoba a Capital Federal, en momentos elegidos
aleatoriamente.- Los paquetes fueron enviados en grupos
de tres por los tres servicios al mismo tiempo para reducir
las diferencias resultantes del da de envo.-
Los datos siguientes muestran el costo de envio X y el
nmero de das Y, en pares (x; y):
(3; 7) (5; 5) (10; 2) (3; 9) (5; 6) (10; 5) (3; 6)
(5; 6) (10; 1) (3; 10) (5; 7) (10; 4) (3; 5) (5; 6) (10; 4)
a) Describa los datos numricamente, (covarianza;
coeficiente de correlacin).-
b) Analice el valor de los servicios de precio ms alto
desde el punto de vista del envo ms rpido.-

4.- Una muestra aleatoria de 7 das de operaciones


produjo los siguientes valores de los datos (precio,
cantidad)
Precio por litro de pintura X Cantidad vendida Y
10 100
8 120
4 200
10 90
7 110
6 150
5 200

a) Describa numricamente los datos, calcule la


covarianza y la correlacin.-
b) Calcule e interprete b0 y b1.-
c) Cuntos litros de pintura es de esperar que vendamos
si el precio es de 7$ el litro?.-
EJEMPLOS QUE ESTAN CARGADOS EN INFOSTAD
EJEMPLO 1.- (Pier 1).- La tabla representa la resistencia a la
tensin, en libras por pulgadas cuadrada (psi) de 80 muestras de
una aleacin de aluminio y litio que esta siendo evaluada como
posible material para la fabricacin de elementos estructurales de
aeronaves.-
EJEMPLO 2.- (Pier 2).- El Director de produccin de cierta fbrica de
alfombras es responsable de 500 telares.- Para no tener que medir la
produccin diaria (en metros) de cada telar, toma una muestra diaria
de 30 telares, con lo que llega a una conclusin sobre la produccin
promedio de alfombras de los 500 telares.-
EJEMPLO 3.- (Pier 3).- Cuando se disea un puente, los Ingenieros
se preocupan por la tensin que un dado concreto, deber soportar.-
En lugar de probar cada pulgada cbica de concreto para
determinar su capacidad de resistencia, los ingenieros toman una
muestra del concreto, la prueban y llegan a la conclusin sobre que
tanta tensin, en promedio, puede resistir ese tipo de concreto.- Se
presentan los datos de una muestra de 40 bloques de concretos que
se utilizarn para construir un puente.-
Ejemplo 4.- (Pier 5).- Los costos de ejecucin de programa de
computadora con el proceso de tiempo compartido varan de una
sesin a otra.- Las observaciones siguientes se obtuvieron
respecto de la variable X, el costo por sesin para el usuario.-

Ejemplo 5.- (Pier 6).- Se obtuvieron los siguientes datos sobre la


variable X: tiempo de CPU en segundos necesarios para ejecutar un
programa con un software estadstico.-

Ejemplo 6.- (Pier 7).- En un intento por estudiar el problema de fallas


en equipos de computo instalados, se recopilan datos en 50
recorridos de campo efectuados para reparar equipos.- La variable
estudiada es X: tiempo en horas necesarios para identificar y corregir
el problema.-

Ejemplo7.-(Pier 8).-El acabado superficial de proteccin anticorrosiva


suele ser el ltimo proceso de manufactura que tiene lugar antes de
la venta o ensamblaje de partes metlicas usadas en producto como
los artefactos domsticos.- Una tcnica para la aplicacin de
plateado de zinc brillante al acero es sometida a prueba.- La variable
en estudio es el grosor del recubrimiento obtenido en micras en 25
franjas de pruebas.-
Ejemplo 8.- (Pier 9).- Un proveedor de artculos de escritorio realiza
la tercera de sus negocios surtiendo a las escuelas y a los
gobiernos locales.- Las ventas se llevan a cabo a travs de
licitaciones pblicas.- Cada venta potencial requiere que un
empleado llene el formulario en que se hace la oferta.- Como la
empresa no tena una idea real del esfuerzo que requiere preparar
una licitacin, pidi al empleado que las hace que registrase las
horas de inicio y terminacin correspondientes a una muestra de 65
ofertas.- Los datos se guardaron en dos formas: minutos gastados
en cada oferta y nmero de ofertas por hora.-

Ejemplo 9.- (Pier 10).- En el estudio de una variable aleatoria X, la


vida til es horas de bateras de litio para un modelo especfico de
calculadora de bolsillo, se obtiene una muestra aleatoria de 50
bateras y se determina la vida til de cada una.- Los datos
resultantes fueron:

You might also like