You are on page 1of 42

MATEMTICASI

1Bachillerato
Captulo9:Estadstica



LibrosMareaVerde.tk
www.apuntesmareaverde.org.es








Autor:IgnasiClausell
Revisora:RaquelCaro
Ilustraciones:BancodeImgenesdeINTEF

397
Estadstica
ndice
1.ESTADSTICADESCRIPTIVAUNIDIMENSIONAL
1.1.INTRODUCCIN
1.2.MTODOESTADSTICO
1.3.CONCEPTOSBSICOS
1.4.TIPOSDEVARIABLES
1.5.DISTRIBUCIONESDEFRECUENCIAS
1.6.TABLAODISTRIBUCINDEFRECUENCIASDEUNAVARIABLE
1.7.DISTRIBUCIONESDEFRECUENCIASAGRUPADAS
1.8.GRFICOS
1.9.PARMETROSESTADSTICOSDEPOSICIN
1.10.PARMETROSESTADSTICOSDEDISPERSIN

2.ESTADSTICADESCRIPTIVABIDIMENSIONAL
2.1.INTRODUCCIN
2.2.DISTRIBUCINDEFRECUENCIASCONJUNTAS
2.3.DISTRIBUCINDEFRECUENCIASMARGINALES
2.4.DISTRIBUCINDEFRECUENCIASCONDICIONADAS
2.5.INDEPENDENCIAESTADSTICA
2.6.DIAGRAMADEDISPERSIN.NUBEDEPUNTOS

3.COVARIANZA
3.1.IDEACORRELACIN.COVARIANZA
3.2.COEFICIENTECORRELACINLINEAL
3.3.RECTAREGRESINLINEAL
3.4.PREDICCINYCAUSALIDAD
Resumen
En esta unidad vamos a repasar todos los conceptos de estadstica unidimensional aprendidos en
cursosanteriores,revisandolastablasdefrecuencias,calculandolasmedidasdecentralizacin,media,
medianaymodaylasmedidasdedispersin,varianzaydesviacintpica.
Elestudiounidimensionalloampliaremosalanlisisconjuntodedosvariables,estudiobidimensional,
utilizandolastablasdedobleentradaparaestudiarlarelacinentreellasyanalizandocadaunadelas
variables por separado desde las tablas, obteniendo as las distribuciones que ahora llamaremos
marginales.
Hay parejas de variables que, aunque no puedan relacionarse por medio de una frmula, s que hay
entreellasunadeterminadarelacinestadstica.Lavisualizacinpormediodelasnubesdepuntosnos
permitirhacernosunaidearazonablesobreestacorrelacinentrelasvariables.
Unabuenaformademarcarlastendenciasdelasnubesdepuntoseshaciendousodeunasrectasque
llamaremosrectasderegresin.
Cuandolacorrelacinesfuerte,lospuntosestnmuyprximosalarecta.Enestoscasoslarectade
regresin resultar muy til para hacer previsiones, conociendo un valor de una variable podremos
calculareldelaotraconrazonableseguridad.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
398
Estadstica
1.ESTADSTICADESCRIPTIVAUNIDIMENSIONAL
Yaconocesde3y4deESOmuchosobreEstadstica,recuentodedatos,tablasygrficas,parmetros
comomedia,mediana,moda.Vamosarevisarestosconocimientos.

1.1.Introduccin
LaEstadsticaeslaCienciaqueseencargadelarecopilacin,representacinyelusodelosdatossobre
unaovariascaractersticasdeinterspara,apartirdeellos,tomardecisionesoextraerconclusiones
generales.
Ejemplo1:
Elgobiernodeseaaveriguarsielnmerodehijosporfamiliahadescendidorespectoaladcada
anterior. Para ello ha entrevistado a 50 familias y les ha preguntado por el nmero de hijos
obteniendolossiguientesdatos:
24231242302223262322323343345203203212322314232433221.

Ejemplo2:
Un nuevo hotel va a abrir sus puertas en nuestra ciudad. Antes de decidir el precio de sus
habitaciones, el gerente investiga los precios por habitacin de los 40 hoteles de la misma
categoraquehaycercadenuestraciudad.Losdatosobtenidosson:
394737564349506151455339435060475142445833394350604751424458334341
5844386143534540543947334547424548.

1.2.Mtodoestadstico
LaEstadsticadescriptivaeslapartedelaestadsticaqueseencargadeorganizar,resumirydaruna
primeradescripcin(sinconclusionesgenerales)delosdatos.
En Estadstica se sigue un mtodo estadstico que est formado por distintas fases segn se trata la
informacinrecibida.
0. Planteamientodelproblemaentrminosprecisos:mbitodeaplicacin(poblacin)y
caractersticasaestudio(variables).
1. Recogidadedatosdelapoblacindeinters:Muestreo.
2. Organizacin, presentacin y resumen de los datos (o de la muestra): Estadstica
descriptiva.
3. Modelosmatemticos:Teoraprobabilidad.
4. Obtenerconclusionesgeneralesoverificarhiptesis.

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
399
Estadstica
1.3.Conceptosbsicos
Poblacin.Eselconjuntodeindividuosoentessujetosaestudio.
Ejemplo1:
Conjuntodetodaslasfamiliasespaolas
Ejemplo2:
Todosloshotelesdeestacategoradelascercanas.
Algunas poblaciones son finitas y pueden conocerse en su totalidad, otras en cambio pueden ser
infinitasyabstractas.

Muestra:Eselnmerodedatosquetomamosdelapoblacinpararealizarnuestroestudio.
Ejemplo1:
Las50familiasalasquesehapreguntadoporelnmerodehijos
Ejemplo2:
Los40hoteles.

Tamaomuestral:Nmerodeobservacionesenlamuestra.
Habitualmentesedenotarporn.
Ejemplo1:
n=50.
Ejemplo2:
n=40.
Dato:Cadavalorobservadodelavariable.
Ejemplo1:
24231242302223262322323343345203203212322314232433221.
Ejemplo2:
39473756434950615145533943506047514244583339435060475142445833
43415844386143534540543947334547424548.
Variable:Caractersticaqueestamosmidiendo.
Ejemplo1:
Nmerodehijos.
Ejemplo2:
Preciodelahabitacin.
LasvariablessuelendenotarseporlasletrasmaysculasX,Y..

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
400
Estadstica
1.4.Tiposdevariables
Cualitativas o categricas: Aquellas que no son medibles, es decir aquellas cuyas observaciones no
tienencarcternumrico.Expresancualidadesocategoras.
Ejemplos:
Sexo,profesin,estadocivil
Cuantitativas:Aquellasquesonmedibles,esdecir,susobservacionestienencarcternumrico.Estas
sedividenen:
Discretas:Tomanvaloresnumricosfijos.
Ejemplos:
Nmero de habitaciones, nmero de hijos de una familia, nmero de trabajadores de una
fbrica
Continuas:Tomanvaloresenintervalosdenmeros
Ejemplos:
Peso,estatura,cuandoseorganizanlosdatosenintervalos.

1.5.Distribucionesdefrecuencias
Observando los datos del ejemplo es fcil adivinar cul ser el primer paso en la organizacin de los
datos,consistirenagruparlosdatosqueserepitenvariasveces.
Tenemoslassiguientesdefiniciones:
Frecuenciaabsoluta(ni):Eselnmerodevecesqueserepiteenlamuestraundeterminadovalor(xi)
delavariable.
Ejemplo:
Paraeldatox1=0,n1=2;paraeldatox4=3,n4=15.
Propiedad:
Lasumadetodaslasfrecuenciasabsolutasesigualaltamaomuestral.
ni n

Frecuencias relativas (fi): Es igual a la frecuencia absoluta dividida por el nmero total de datos, es
decirporeltamaomuestral.
ni
fi
n
Ejemplo:
2 15
f1 0'04 f 4 0'3
50 50
Propiedad:
Lasumadetodaslasfrecuenciasrelativasesiguala1.

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
401
Estadstica
Frecuencias acumuladas (Ni): Nos dice el nmero de datos que hay igual o inferiores a uno
determinado.
Secalculasumandoelnmerodefrecuenciasabsolutasquehayanterioresallegaralaquequeremos
calcular.
Ejemplo:
N1=2N4=42.
Propiedad:
Laltimafrecuenciaacumuladaesigualaltamaomuestral,alnmerototaldedatos.
Frecuenciarelativaacumulada(Fi):Eselresultadodedividircadafrecuenciaacumuladaporelnmero
totaldedatos.
Ni
Fi
n
Ejemplo:
42
F1 0'04 F4 0'84
50
Propiedad:
Laltimafrecuenciarelativaacumuladaessiempre1.

1.6.Tablaodistribucindefrecuenciasdeunavariable
Llamamosasaunatablaconteniendoelconjuntodediferentesvaloresquehatomadouna variable
(losdatossinrepetir)ordenadosdemenoramayorconsuscorrespondientesfrecuencias.

Actividadesresueltas
Latabladevaloresdelejemplo1delnmerodehijos

xi ni fi Ni Fi
0 2 004 2 004
1 4 008 6 012
2 21 042 27 054
3 15 03 42 084
4 6 012 48 096
5 1 002 49 098
6 1 002 50 1

Culeselnmerodefamiliasquetienecomomximodoshijos?
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
402
Estadstica
Miramoslacolumnasegundani:2+4+21=27omiramoslacolumnacuarta,tercerafila:Ni:nosda27
Cuntasfamiliastienenmsdeunhijoperocomomximo3?
Miramos la columna segunda: 21 + 15 = 36 o miramos la columna cuarta y restamos las filas cuarta
menossegunda426=36.
Quporcentajedefamiliastienemsde3hijos?
Miramosenlacolumnatercera:012+002+002=01616%oenlacolumnasquintarestandoala
ltimafilalacuartafila,esdecir,1084=01616%.

1.7.Distribucionesdefrecuenciasagrupadas
Ahoravamosatrabajarconunadistribucindefrecuenciasagrupadasconelejemplodelpreciodeuna
habitacindehotel.
Ejemplo2:
xi ni fi Ni Fi
36 2 005 2 005
37 1 0025 3 0075
38 1 0025 4 01
39 3 0075 7 0175
40 1 0025 8 02
41 1 0025 9 0175
42 2 005 11 02
43 4 01 15 0225
44 2 005 17 0275
45 4 01 21 0375
47 4 01 25 0425
48 1 0025 26 0525
49 1 0025 27 0625
50 2 005 29 0650
51 2 005 31 0675
53 2 . . 0725
54 1 .. . 0775
56 1 .. .. ..
58 2 .. .. .
60 1 .. . ..
61 2 .. .. ..
Estatablaesdemasiadograndeymuypocooperativa.

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
403
Estadstica
Cuandolavariabletomamuchosvalores,latablaqueseobtieneesdemasiadograndeyportantopoco
clarificadora,estonosvaaocurrirfrecuentementeenelcasoenquelavariableaestudiarseacontinua.
La solucin a este problema est en agrupar los diferentes valores de la variable en intervalos o
intervalos de clase. Teniendo en cuenta que lo que ganamos en manejabilidad lo perdemos en
informacin,esdecirlosresultadossernaproximados.

Agrupar en intervalos de clase consiste en agrupar los datos en nmeros relativamente pequeo de
intervalosquecumplan:
Nosesuperponganentres,deformaquenoexistaambigedadconrespectoalaclaseaque
perteneceunaobservacinparticular.
Cubrantodoelrangodevaloresquetenemosenlamuestra.

Llamaremos:
A las fronteras del intervalo, lmites inferior y superior de clase y los denotaremos por li, Li
respectivamente.
Marcadeclase(ci)alpuntomediodelintervalo,esdecir,alpromedioaritmticoentreellmite
L l
inferioryelsuperior: ci i i .Eselvalorquetomaremoscomorepresentativodelintervalo
2
oclase.
Amplitud(ai)esladiferenciaentreelextremosuperioreinferior:ai = Li li.
Alnmerodeobservacionesdeunaclaseselellamafrecuenciadeclase(ni)sidividimosesta
frecuenciaporelnmerototaldeobservaciones,seobtienelafrecuenciarelativadeclase(fi),y
delmismomodoquelohacamosparadatossinagrupardefiniramos(Ni)y(Fi).

Cmoconstruirunadistribucindefrecuenciasagrupadaenintervalos
1. Empezamosdeterminandoelrecorridodelavariable(Re)orangodevaloresquetenemosenla
muestra.Sedefinecomoladiferenciaentreelmayoryelmenorvalordelavariable.
2. Nmerodeclases.Dependedeltamaodelamuestra.ParamuestrasdetamaomoderadoN
menor que 50, se suele elegir un nmero de clases o intervalos igual a n . Para muestras
log( n )
mayoresseutilizalafrmuladeSturges 1 ,engeneralelnmerodeintervalosnodebe
log( 2 )
sobrepasarde15o20,encasosdemuestrasmuygrandes.
3. Determinamoslaamplituddelosintervalos.Esmscmodoquelaamplituddetodaslasclases
sealamisma(siemprequeseaposibleyexceptoelprimeroyelltimo),siesasai=a= Re/n
intervalos.
4. Tomaremoscomoreglageneral,anoserqueseindiquelocontrario,hacerqueelintervaloest
cerradoporlaizquierdayabiertoporladerecha(exceptoelltimointervalo).

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
404
Estadstica
Ejemplo:
Representaladistribucindefrecuenciasagrupadasparalosdatosdelejemplodelpreciodelas
habitacionesdeunhotel.

Recorrido:Elmenorvalores33yelmayores61,ladiferenciaes28yportantoelrecorridoes:Re=28.

Nmero de clases: N=40,hacemosquelatablatenga6clases,pues 40 6 .


Amplitud:a=28/6=467
Comolaamplitudnossaleunnmerocondecimaleslosintervalosnosvanaquedarrarosportanto
hacemoselarreglosiguiente:
Paraquelosintervalosnosquedenconamplitud5tomamoscomoprimervalorel325enlugardel33y
comoltimoel625enlugardel61.
Amplitud:a=5.
Aspueslatablaqueda:
[li, Li[ c i ni fi Ni Fi
[325,375[ 35 3 0075 3 0075
[375,425[ 40 8 02 11 0275
[425,475[ 45 14 035 25 0625
[475,525[ 50 6 015 31 0775
[525,575[ 55 4 01 35 0875
[575,625[ 60 5 0125 40 1
Cuntoshotelestienenunprecioentre325y375euros?
3
Cuntoshotelestienenunpreciosuperiora475?
15
Quporcentajedehotelescuestancomomucho425?
275%.

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
405
Estadstica
Actividadespropuestas
1. Completalosdatosquefaltanenlatabla.
xi ni fi Ni Fi
10 2 005 2 005
13 4 01 6 015
16 16 04
19 15
22 6 015 37 0925
25
2. Completalosdatosquefaltanenlatabla.
[li, Li[ ni fi Ni
[0,10[ 60 60
[10,20[ 04
[20,30[ 30 170
[30,40[ 01
[40,50] 200

1.8.Grficos
Laformadeladistribucindefrecuenciassepercibemsrpidamenteyquizsseretienedurantems
tiempoenlamemoriasilarepresentamosgrficamente.

Diagramadebarras
Es la representacin grfica usual para las variables cuantitativas sin agrupar o para variables
cualitativas. En el eje de abscisas representamos los diferentes valores de la variable xi. Sobre cada
valorlevantamosunabarradealturaigualalafrecuencia(absolutaorelativa).

Nmerodehijos
25

20

15

10

0
0 1 2 3 4 5 6


MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
406
Estadstica
Diagramadesectoresopastel
Eselmsusualenvariablescualitativas.Serepresentanmediantecrculos.Acadavalordelavariable
seleasociaelsectorcircularproporcionalasufrecuencia.
Parahallarelngulousamosunaregladetres:
n360o1360
ninguloifinguloi
Ejemplo3:
Enunasvotacionesdeunacomunidaddevecinosparadecidirsicambialaantenadetelevisin
delacomunidad,de50vecinos25votanafavor,15encontray10seabstienen.Representalos
datosmedianteundiagramadesectores.

xi fi

Afavor 05

Encontra 03

Abstencin 01

votaciones

afavor
encontra
abstencin

Histogramas
Es la representacin grfica equivalente al diagrama de barras para datos agrupados. En el eje de
ordenadasrepresentamoslasclasesylevantamossobrecadaclaserectngulosunidosentresdealtura
n
igualalafrecuenciadelaclase(absolutasorelativas)sitodaslasclasestienenlamismaamplitudy i
ai
fi
o sitienendistintasamplitudes.
ai
En cualquier caso, observa que, en un histograma el rea de los rectngulos es proporcional a la
frecuenciarepresentada.

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
407
Estadstica
Preciodehabitacindehotel
16

14

12

10

0
]32.5,37.5] ]37.5,42.5] ]42.5,47.5] ]47.5,52.5] ]52.5,57.5] ]57.5,62.5]

El histograma o diagrama de barras proporcionan mucha informacin respecto a la estructura de los
datos (y si la muestra es representativa de la poblacin, respecto a la estructura de la poblacin): el
valorcentraldeladistribucin,sudispersinylaformadeladistribucin.

Polgonodefrecuencias
Es la representacin habitual para datos cuantitativos agrupados de las frecuencias (absolutas o
relativas,acumuladasabsolutasorelativas),mediantepuntosserepresentanlasfrecuenciaseneleje
deordenadasylamarcadeclaseeneldeabscisas.Despusseunenestospuntosporsegmentosde
rectas.

Preciodehabitacindehotel
16

14

12

10

0
35 40 45 50 55 60

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
408
Estadstica
1.9.Parmetrosestadsticosdeposicin
Paradatoscualitativos,ladistribucindefrecuenciasproporcionaunresumenconcisoycompletodela
muestra, pero para variables cuantitativas puede complementarse este resumen utilizando medidas
descriptivasnumricasextradasdelosdatos.Estasmedidassonvaloresnumricoscalculadosapartir
delamuestrayquenosresumenlainformacincontenidaenella.

Mediaaritmtica
Eselpromedioaritmticodelasobservaciones,esdecir,elcocienteentrelasumadetodoslosdatosy
el nmero de ellos. (Teniendo en cuenta que si un valor se repite hay que considerar estas
repeticiones).
i xi ni k
x xi f i
n i 1

Silosdatosestnagrupadosenintervalosutilizaremoslasmarcasdeclase,ci,envezdexi.
Eslamedidadecentralizacinmsimportante.
Ejemplo1.
Nmeromediodehijos.
0 2 1 4 2 21 3 15 4 6 5 1 6 1 126
x 2'52 hijos.
50 50
Utilizandolosdatosdelasfrecuenciasrelativas.
x 0 0'04 1 0'08 2 0'42 3 0'043 4 0'12 5 0'02 6 0'02 2'52 hijos.
Ejemplo2.
Preciomedio.
Comotenemoslosdatosagrupadosenintervalosutilizamoslasmarcasdeclase:
35'3 40'8 45'14 50'6 55'4 60'5 1875
x 46'875
40 40
Oequivalentemente:
x 35 0'075 40 0'2 45 0'35 50 0'15 55 0'1 60 0'125 4'6875.
Propiedades.
1. Siatodoslosvaloresdeunavariablelessumamosunaconstante,lamediaaritmtica
quedaaumentadaenesaconstante.
2. Siatodoslosvaloresdeunavariablelosmultiplicamosporunaconstante,lamedia
aritmticaquedamultiplicadaporlamismaconstante.
3. Siconsideramosyi = a + bxisiendoaybdosconstantescualesquiera,lanuevamedia
aritmticaquedara y a bx

4. Lasumadetodoslosvaloresdelavariablerestndoleslamediaescero.

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
409
Estadstica
Mediana
Esaquelvalorque,alordenarlasobservacionesdemenoramayor,ocupaellugarcentral,dividiendoal
conjuntodeobservacionesendospartesiguales.Esdecir,quedejaasuderechayasuizquierdael50
porcientodelasobservaciones.
Si el tamao de la muestra, n, es impar, necesariamente existe un dato que ocupa el lugar central,
concretamenteeldatoquealordenarlosestenlaposicin(n+1)/2;perosinespar,sondoslosdatos
queencontramosenellugarcentral,losqueocupanloslugaresn/2y(n/2)+1,calculandoentoncesla
medianacomoelpuntomedioentreambosdatos.

Ejemplo4:
Si tenemos los datos de 30 valores sobre el peso de los estudiantes de 1 de bachillerato
ordenadosdemenoramayor.
261428604541489552355244560056745729577958345944651065856826
683468476924714874827837814381728184836286628782919392789697
Comon=30espar,lamedianaserelvalormediodelosvaloresqueocupanlasposiciones15y16en
latabla:68266834
Mediana=Me=(6826+6834)/2=683kg.

Ejemplo5:
Las 13 primeras observaciones correspondientes al nmero de chocolatinas consumidas en un
daporlosestudiantesdeunaclaseson:
0122222223333.
Eldatoqueocupaelvalorcentral,eselqueocupaellugarsptimoyaquehay13valores,esedatoesla
medianaportantolamedianaes2.
Me=2.

Moda
Esaquelvalorquetienemayorfrecuencia.
Enelcasodelasfrecuenciasagrupadasenintervalossetomaelintervaloquemsvecesserepitecomo
lamoda

Ejemplo5:
Paralavariableconsumodechocolatinasdelejemplo5lamodaesMo=2
Ejemplo2:
Paralosdatosdelejemplo2eselintervalo[425,475).

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
410
Estadstica
Percentiles
Elpercentilpsimoesaquelvalorqueverificalacondicindequeelp%delosdatossonmenoreso
igualesal.
As,elpercentil70suponequeel70%delosdatossonmenoresoigualesal.
Ejemplo:
Queremoscalcularelpercentil30delosdatosdelejemplo5,tendremosencuentaqueel30%
de 30 datos que hay es 9, as buscamos el dato que ocupa esa posicin en la ordenacin del
ejemplo5,quees5729.
Siqueremoscalcularelpercentil15,tenemosencuentaqueel15%de30es45,perocomoeste
datonoperteneceaningunaposicintomamoslaaproximacinporexceso,oseatomamosel
dato que ocupa la posicin 5 por tanto el percentil 15 seria el dato 5235. Tambin es posible
aproximarlomejormedianteunainterpolacinlineal.
Nota:
Lospercentiles25,50y75recibenelnombredeprimercuartil,segundocuartilytercercuartil.
Ademselsegundocuartilqueeselpercentil50coincideconlamediana.
Si los datos estn ordenados en intervalos tomamos el intervalo correspondiente al porcentaje del
percentilcomovalordelpercentilcorrespondiente.

1.10.Parmetrosestadsticosdedispersin
Lasmedidasdeposicinestudiadasenelapartadoanterior,nosdanunainformacinincompleta,por
parcial,acercadelosdatos.
Veamosunejemplo:
SupongamoslasnotasdematemticasdelosestudiantespertenecientesadosclasesdistintasclaseAy
claseB,con10estudiantescadauna.
ClaseA4,3,5,6,4,5,5,7,5,6
ClaseB1,4,3,5,6,8,2,7,5,9

ClaseA ClaseB
5 2,5
4 2
3 1,5
2 1
1 0,5
0 0
3 4 5 6 7 1 2 3 4 5 6 7 8 9

En los dos casos la media, como podemos calcular es 5, pero sus diagramas de frecuencias son muy
distintos.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
411
Estadstica
Los diagramas de frecuencias anteriores nos muestran que los valores se distribuyen simtricamente
respectoalanota5,peroenlaclaseAexisteunamenordispersinqueenlaclaseB.Cmomedirla
distinta manera en que los valores se agrupan alrededor de la media? Las distintas medidas de
dispersinproporcionanestainformacin.Aligualqueocurreparalaposicin,existendiversasformas
para medir la dispersin, de entre ellas estudiaremos: rango, desviacin tpica, varianza y rango
intercuartlico.

Rango
Esladiferenciaentreeldatomayoryeldatomenor.
Asporejemplo
ElrangodelasnotasdelaclaseAvale73=4yelrangoenlaclaseBvale91=8,denotando
mayordispersindelavariableenlaclaseB.

Lavarianzayladesviacintpica
Puesto que se trata de medir cmo se agrupan los datos alrededor de la media, podramos utilizar
comocriteriolasdesviacionesdedichosdatosrespectosaquella,esdecir,lasdiferenciasentrelamedia
y los datos y ms concretamente la media de esas diferencias. Aunque a primera vista la sugerencia
puedaserbuena,vamosaaplicarlaalosvaloresdelasnotasdeclaseparaevidenciarelinconveniente
insalvablequeunamedidadeestetipotiene.
Enloscuadrosaparecenlasnotasdecadaclaseyencolumnassucesivassusdesviacionesrespectoala
mediayelcuadradodeestasdesviaciones,alquealudiremosmstarde.
Altratardeobtenerlamediadelasdiferencias,querecordemoseslasumadetodasellasdivididaspor
su nmero, nos encontramos que dicha media es 0 en ambos casos, porque existiendo desviaciones
positivasynegativas,unasanulanlosefectosdelasotras.
Enrealidadesonosocurrirconcualquierotroconjuntodedatos,porquepuededemostrarsequeesa
esunapropiedadquetienenlasdesviacionesrespectodelamedia.
ClaseA ClaseB
xi x xi x
2
Nota di Nota di2
4 1 1 1 4 16
3 2 4 4 1 1
5 0 0 3 2 4
6 1 1 5 0 0
4 1 1 6 1 1
5 0 0 8 3 9
5 0 0 2 3 9
7 2 4 7 2 4
5 0 0 5 0 0
6 1 1 9 4 16
Suma 0 12 Suma 0 60

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
412
Estadstica
Enlastablasaparecenlasdesviacionesrespectodelamediaysuscuadradosparalasnotasdelasdos
clases.
Puesto que el uso de las desviaciones respecto de la media parece razonable, cmo resolver el
problemaquelassumasden0?Unasencillamaneradehacerloesutilizar,nolasdesviaciones,sinosus
cuadrados. Al ser stos cantidades positivas, su suma nunca podr ser cero. De acuerdo con esto la
varianzasedefineporlafrmula.

xi x ni xi ni
n 2 n 2
suma del cuadrado de las desviaciones i 1 i 1
Varianza = s 2 x2
n n n
Ladesviacintpicasedefinecomolarazcuadradadelavarianzayladesignaremospors.
s= Varianza
Ejemplo:
Paraelejemplodelasnotasdelasclases.
12
ClaseA s2 1'33 s 1'33 1'15
9
60
ClaseB s2 6'66 s 6'66 2'58
9
Queponendemanifiestoladiferentedistribucindelosvaloresenuncasoyenelotro.

Propiedaddeladesviacintpica
1. Aproximadamenteel68%delosdatosdistancomomuchounadesviacintpicadelamedia.
2. Aproximadamenteel95%delosdatosdistancomomuchodosdesviacionestpicasdelamedia.
3. Aproximadamentemsdel99%delosdatosdistancomomuchotresdesviacionestpicasdela
media.

Rangointercuartlico.
Sedefinecomoladiferenciaentreelterceryelprimercuartil.Elintervalointercuartlicoeselintervalo
definidoporloscuartilesprimeroytercero,cuyalongitudes,elrangointercuartlico.Esteintervaloas
definidocontieneel50%delosdatos.

Coeficientevariacin
Siqueremoscomparardossecuenciasdedatos,ydecirencualhaymayordispersin,sobretodoenel
caso en que sean datos expresados en diferentes unidades, con los parmetros definidos, desviacin
tpica,intervalointercuartlico,lotenemoscomplicado,poresosehacenecesariodefinirelcoeficiente
devariacincomo,
s
CV 100
x

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
413
Estadstica
Ejemplo:
En el ejemplo de las calificaciones de dos clases nos permite comparar las dos secuencias de
datos.
ClaseA CV=(115/5)100=23%.
ClaseB CV =(258/5)100=516%.
LlegandoalamismaconclusinquepercibamosenloshistogramasyaquelaclaseBtieneunamayor
dispersindelasnotas.

Actividadespropuestas
3. Clasificalassiguientesvariablescomocualitativasocuantitativas,yestasltimascomocontinuaso
discretas.
a) Intencindevotodeunpartido
b) Nmerodecorreoselectrnicosquerecibesenunmes.
c) Nmerodecalzados.
d) Nmerodekilmetrosrecorridosenfindesemana.
e) Marcasdecerveza
f) Nmerodeempleadosdeunaempresa
g) Altura
h) Temperaturadeunenfermo.
4. Muchas personas que invierten en bolsa lo hacen para conseguir beneficios rpidos, por ello el
tiempo que mantienen las acciones es relativamente breve. Preguntada una muestra de 40
inversores habituales sobre el tiempo en meses que han mantenido sus ltimas inversiones se
recogieronlossiguientesdatos:
105112991501141271651011271141166279831098138105117
8412511291104911341235911488748613614711511510998
12999
Construyeunatabladefrecuenciasquerecojaestainformacinyhazalgunarepresentacingrfica.
5. Investigadoslospreciosporhabitacinde50hotelesdeunaprovinciasehanobtenidolossiguientes
resultados.
703050405070407580505075307010015050751208040503050100
3040507050304070407050407010075708075707580707012080.
Determinar:
a) Distribucin de frecuencia de los precios, sin agrupar y agrupando en 5 intervalos de la misma
amplitud.
b) Porcentajedehotelesconpreciosuperiora75.
c) Cuntoshotelestienenunpreciomayoroigualque50peromenoroiguala100?
d) Representagrficamentelasdistribucionesdelapartadoa).
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
414
Estadstica
6. Elgobiernodeseasabersielnmeromediodehijosporfamiliahadescendidorespectoaladcada
anterior.Paraellosehaencuestadoa50familiasrespectoalnmerodehijosysehaobtenidolos
datossiguientes.
24231242302223262322323343345203212322314
232433221.
a) Construyelatabladefrecuenciasconestosdatos.
b) Cuntasfamiliastienenexactamente3hijos?
c) Quporcentajedefamiliastienenexactamente3hijos?
d) Quporcentajedefamiliasdelamuestratienemsdedoshijos?Ymenosdetres?
e) Construyeelgrficoqueconsideresmsadecuadoconlasfrecuenciasnoacumuladas.
f) Construyeelgrficoqueconsideresmsadecuadoconlasfrecuenciasacumuladas.

7. Enunhospitalsedeseahacerunestudiosobrelospesosdelosrecinnacidos.Paraelloserecogen
losdatosdelos40bebesysetiene:
3237424637302931304541383936323530252728304045
3535362932424341464245433237293135
a)Construyelatabladefrecuencias.
b) Si sabemos que los bebes que pesan menos de 3 kilos lo hacen prematuramente Qu
porcentajedeniosprematuroshannacidoentreestos40?
c)Normalmentelosniosquenacenprematurosquepesanmsde3kilosymediononecesitan
estarenincubadora.Puedesdecirqueporcentajedeniosestnenestasituacin?
d)Representagrficamentelainformacinrecibida.

8. EnunafincadevecinosdeBenicasim,serenenlacomunidaddevecinosparaversicontratanauna
personaparaquelesllevelacontabilidad.Elresultadodelavotacineselsiguiente:25vecinosa
favordelacontratacin,15vecinosencontray5vecinosseabstienen.Representalainformacin
medianteundiagramadesectores

9. Se toman ocho mediciones del dimetro interno de los anillos para los pistones del motor de un
automvil.Losdatosenmmson:
7400174003740157400074005740027400574004
Calculalamediaylamedianadeestosdatos. Calculatambinlavarianza,ladesviacintpicayel
rangodelamuestra.

10. Dadaladistribucindedatos38432384343384363843838440confrecuencias4,8,4,3,8,
hallalamediadeladistribucin.

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
415
Estadstica

11. Ladistribucindelossalariosenlaindustriatursticaespaolaeslaquefiguraenlatabla.Calcula:
a) Elsalariomedioportrabajador(marcasdeclasedelltimointervalo20000
b) Elsalariomsfrecuente.
c) Elsalariotalquelamitaddelosrestantesseainferioral.
[li, Li[ ni
[0,1500[ 2145
[1500,2000[ 1520
[2000,2500[ 840
[2500,3000[ 955
[3000,3500[ 1110
[3500,4000[ 2342
[4000,5000[ 610
[5000,10000[ 328
10000 150

12. Calculalamediana,lamoda,primerytercercuartilynonagsimopercentildeladistribucin:
xi ni
5 3
10 7
15 5
20 3
25 2

13. Sehandiseadodosunidadesgemelasdeplantaspilotosyhansidopuestasenfuncionamientoen
undeterminadoproceso.Losresultadosdelosdiezprimerosbalancesencadaunadelasunidades
hansidolossiguientes:
UnidadA97898910129881020990991100810091005
UnidadB9721005982983975999979968974972
a) Hazunarepresentacingrficadeestasmuestras.
b) Determinalasmediasylasvarianzas.

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
416
Estadstica
14. En cierto barrio se ha encontrado que las familias residentes se han distribuido, segn su
composicindelaformasiguiente:
Composicin Ndefamilias
02 110
24 200
46 90

68 75
810 25

a) Culeselnmeromediodepersonasporfamilia?
b) Culeseltamaodelafamiliamsfrecuente?
c) Sisolohubieraplazasdeaparcamientoparael75%delasfamiliasyestasseatendieran
porfamiliasdemayortamaoamenor,qucomponentestendraquetenerunafamilia
paraentrarenelcupo?
d) Nmerodemiembrosquetienencomomximoel85%delasfamilias.
15. Allanzar200vecesundadoseobtuvolasiguientedistribucindefrecuencias.
xi 1 2 3 4 5 6
ni a 32 35 33 b 35
Hallalamedianaylamodadeladistribucin,sabiendoquelamediaaritmticaes36.
16. Lossiguientesdatossonmedidasdelacapacidadcranealdeungrupodehomnidos:
84,49,61,40,83,67,45,66,70,69,80,58,68,60,67,72,73,70,57,63,70,78,52,67,53,67,
75,61,70,81,76,79,75,76,58,31.
a) Calculalamediaylamedianamuestrales.
b) Hallaloscuartilesprimeroytercero.
c) Hallalospercentilescincuentaynoventa.
d) Calculaelrangomuestral.
e) Calculalavarianzamuestralyladesviacinestndarmuestral.
17. Lossiguientesdatosprocedendeunestudiodecontaminacindelaire.
6521444753264730498650494034564727242722525347
684153762421464330416142
a)Construyeunhistograma.
b)Determinaloscuartiles.
c)Calculalamediayladesviacintpica.

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
417
Estadstica
2.ESTADSTICABIDIMENSIONAL
2.1.Introduccin
Ejemplo1:
Con el fin de hacer un estudio de aceptacin sobre dos modelos de impresoras 3D de reciente
fabricacin,seconsideraronelnmerodeventasefectuadoporundeterminadodistribuidordurante
25das.
ModeloA: 0222133334423333232422333
ModeloB: 2122311120111112211122221
En muchos procesos de la vida se hace necesario estudiar simultneamente dos caractersticas, dos
variables.Suestudioconjuntopermitedeterminarlasrelacionesentreellas.Supondremosinicialmente
que estamos observando dos variables aunque el tratamiento que se presenta se generaliza sin
dificultadacualquiernmerodevariables.
Notacin.
Continuandoconelejemplovamosallamar:
XnmerodeimpresorasdelmodeloAvendidasenunda.
YnmerodeimpresorasdelmodeloBvendidasenunda.
nnumerodeparesdeobservaciones.
xiCadadatodiferenteobservadoenlamuestradeX.
KnmerodevaloresdistintosdeX.
yjCadadatodiferenteobservadoenlamuestradeY.
hnmerodevaloresdistintosdeY.

2.2.Distribucindefrecuenciasconjuntas
Cuando queremos describir conjuntamente dos variables, el primer paso al igual que en el caso
univariante,serlarepresentacindelosdatosenunatabladefrecuencias.

Frecuenciaabsolutaconjunta(ni j)
NmerodevecesquesepresentaenlamuestraelvalorxidelavariableXconelvaloryjdelavariable
Y.
Ejemplo1:
Paraelpardevalores x1 =0,y3=2,n13 = 1
Propiedad:
Lasumadelasfrecuenciasabsolutasesigualan.

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
418
Estadstica
Frecuenciarelativaconjunta
nij
f ij
n
Ejemplo1:
1
f13 0'04
25
Propiedad
Lasumadelasfrecuenciasrelativasesigualalaunidad.

Tabladefrecuenciasconjunta
Llamamosasaunatabladedobleentradadondeserepresentanenlaprimeracolumnalosdiferentes
valoresobservadosparalavariableXordenadosdemenoramayoryenlaprimerafilalosdiferentes
valores observados para la variable Y, y en el centro de la tabla sus correspondientes frecuencias
conjuntas,tantoabsolutascomorelativas.

Ejemplo1:
xi/yj 0 1 2 3 ni f i
0 0/0 0/0 1/004 0/0 1 004
1 0/0 0/0 0/0 1/004 1 004
2 0/0 3/012 5/020 0/0 8 032
3 0/0 8/032 4/016 0/0 12 048
4 1/004 2/008 0/0 0/0 3 012
ni 1 13 10 1 25
f i 004 052 004 004 1

QuporcentajededasvenderemosunaimpresoradelmodeloAy3delmodeloB?
4%
QuporcentajededasvenderemosmsimpresorasdelmodeloBquedelmodeloA?
8%;004+004

NOTA:
En el caso en que las variables sean cualitativas la tabla de distribucin conjunta tambin recibe el
nombredetabladecontingencia.

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
419
Estadstica
Ejemplosdetablasdecontingencia.
1.Sequiereestudiarelefectodetresfrmacoseneltratamientodeunaenfermedadinfecciosa.Para
ello se dispone de un grupo de pacientes infectados, distribuyndose al azar en tres grupos de
tratamiento.
TratamientoA TratamientoB TratamientoC Total
Simejora 23 33 35 91
Nomejora 12 7 12 31
Total 35 40 47 122
2. En un estudio se ha aplicado durante un ao una terapia basada en la ejercitacin mental para
frenar el deterioro cognitivo observado en 3 enfermedades degenerativas, en la tercera edad. Para
evaluarelgradoenquelaterapiaesefectiva,sehanregistradolosresultadosobservadosalcabodeun
aodetratamientoencadatipodeenfermedad,teniendoencuentaquelaevolucinnaturalalcabo
deunao,deestasenfermedades,eselempeoramiento.
Empeora Estable Mejora Total
Parkinsonsenil 34 25 17 76
Alzheimer 47 18 6 71
Demenciavascular 50 23 2 75
Total 131 66 25 222

2.3.Distribucindefrecuenciasmarginales
Para distinguir las frecuencias de cada variable al estudiarlas aisladamente llamaremos frecuencias
marginales a las de cada variable por separado. De esta forma tendramos dos distribuciones
unidimensionalesapartirdelasconjuntas.
Frecuenciaabsolutamarginal
ParalaX (xi)seraelnmerodevecesqueserepiteelvalorxisintenerencuentalosvaloresdeY,la
representamosporni.
ParalaY(yj)seraelnmerodevecesqueserepiteelvaloryjsintenerencuentalosvaloresdelaX,la
representamospornj.
Nota:
1.Con las definiciones de media, desviacin tpica y varianza del apartado de distribuciones
unidimensionales,utilizandoparalaXlosvaloresxiyelnmerodevecesqueserepiteniyNelnmero
totaldeparesobservados,yparalaYlosvaloresyjyelnmerodevecesqueserepitenjyNelnmero
total de pares observados, calcularemos las medias marginales, desviaciones tpicas marginales y
varianzasmarginales.
2. Sinosfijamosbienpodemosrelacionarelnombredefrecuenciasmarginalesconelhechodeque
tantolosvaloresdelasvariables,xieyjcomolasvecesqueaparececadaunodeestosdatos,niynjlos
encontramosenlosmrgenesdelatabladedistribucinconjunta.

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
420
Estadstica
Frecuenciasrelativasmarginales
Apartirdelasanteriores,ydelmismomodo,seconstruirnestasfrecuenciasfiyfj.
La distribucin de frecuencias marginales puede colocarse en una tabla separadamente. Pero si
deseamostenertodalainformacinenunamismatablaloquesesuelehacerescolocar:
En la ltima columna de la tabla conjunta, las frecuencias marginales de X es decir, ni,
aadiendotantascolumnascomootrostiposdefrecuenciasmarginalessedeseeaadir.
En la ltima fila de la tabla conjunta, las frecuencias marginales de Y, es decir, nj aadiendo
tantasfilascomootrostiposdefrecuenciasmarginalessedeseeaadir.

2.4.Distribucindefrecuenciascondicionadas
A partir de la distribucin de frecuencias conjuntas podemos definir otro tipo de distribuciones
unidimensionales,tantoparaXcomoparaY.Estasdistribucionesseobtendrnalfijarelvalordelaotra
variableyrecibenelnombrededistribucionescondicionadas.
Frecuencia absoluta condicionadaparaX(xi)dadoqueY(yj)eselnmerodevecesqueserepiteel
valor xiteniendoencuentasoloaquellosvaloresenqueY(yj);asesni(j) = nijparatodoi =1,2,,k.
Frecuencia absoluta condicionada para Y (yj) dado que X (xi) es el nmero de veces que se repite el
valoryjteniendoencuentasoloaquellosvaloresenqueX (xi);asesn(i)j = nijparatodoj=1,2,,h.
Enlasdistribucionescondicionadasnosesuelenutilizarlasdistribucionesabsolutas,puestoquecomo
sabemos, estas dependen del nmero de datos y el nmero de datos ser diferente para cada
distribucin,puesdependerdelafrecuenciadelvalorquefijamosdelaotravariable.Sonmuchoms
tileslasfrecuenciascondicionadasquesedefinen:
FrecuenciarelativacondicionadaparaXdadoqueY =yj es
nij
fi( j )
nj

FrecuenciarelativacondicionadaparaYdadoqueX =xies
nij
f (i ) j
ni
Ejemplo:
DistribucindefrecuenciasdeXcondicionadaaY =1
xi ni(2) fi(2)
0 0 0
1 0 0
2 3 023
3 8 061
4 2 015

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
421
Estadstica
Nota:
Si la tabla resulta muy grande deberemos agrupar una o las dos variables en intervalos de clase del
mismo modo que lo hacamos en el apartado de una variable. En este caso todas las definiciones se
aplicantalcomolashemosvistoendichoapartado.

2.5.Independenciaestadstica
Definicin1:
Dos variables X e Y se dice que son independientes estadsticamente cuando la frecuencia relativa
conjuntaesigualalproductodelasfrecuenciasrelativasmarginales,esdecir,paratodoi,j:
nij ni n j
f ij fi f j
n n n
Definicin2:
Dos variables X e Y se dicen que son independientes estadsticamente cuando todas las frecuencias
relativascondicionadassonigualesasuscorrespondientesfrecuenciasmarginales,esdecir:
fi(j)=fiparatodojyf(i)j = fjparatodoi.

2.6.Diagramadedispersin.Nubedepuntos
Se obtiene representando cada par observado (xi, yj), como un punto del plano cartesiano. Se utiliza
conlosdatossinagruparysobretodoparavariablescontinuas.Silosdatosestnagrupadossetoman
lasmarcasdeclase.Esmstilporquenospermitevervisualmentelarelacinentrelasdosvariables.
relacinlinealdirecta
norelacin relacinlinealinversa
3,5 3,5 2,5
3 3
2
2,5 2,5
2 1,5
2
1,5
1,5 1
1
1
0,5 0,5
0,5 0
0 1 2 3 4 0
0
0 1 2 3
0 2 4 6

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
422
Estadstica
3.COVARIANZA
3.1.Ideacorrelacin.Covarianza
Alanalizardosvariablescuantitativasdeformaconjunta,elobjetivoquesepretendees,porlogeneral,
determinar si existe o no algn tipo de variacin conjunta o covarianza entre ellas: si una variable
aumenta,laotratambinolocontrario.
LacantidadsedenominacovarianzaSxyytienelasiguienteexpresin:
i j ( xi x ) ( yi y ) nij i j xi yi nij
S xy xy
n n
Ayudaaanalizarlacovarianzaentredosvariablesdelaformasiguiente:
Cuandoelresultadoespositivo,hayunatendenciaaqueamayoresobservacionesdeX
correspondanmayoresobservacionesdeY.
Porejemplo
Amayorcantidaddeaguadelluviaenunao,suelecorresponderunamejorcosecha.
Cuando el resultado es negativo, la tendencia resulta contraria; es decir a mayores
valoresdelavariableXsolemosencontrarmenoresvaloresdelavariableY.
Porejemplo,
Amayorrentapercpitaenlospasessueleencontrarseunamenormortalidadinfantil.

3.2.Coeficientecorrelacinlineal
El valor de la covarianza depender de los valores de las variables, por tanto de sus unidades. Para
podereliminarlasunidadesytenerunamedidaadimensionalutilizamoselcoeficientedecorrelacin
rxy:
S xy
rxy
sx s y

Siendotambininvariantefrenteatrasformacioneslineales(cambiodeorigenyescala)delasvariables.
Citamoslassiguientespropiedades:
Esuncoeficienteadimensional.
Tomavaloresentre1y1.
Sihayrelacinlinealpositivaelvalorserpositivoyprximoa1.
Sihayrelacinlinealnegativaelvalorsernegativoyprximoa1.
Sinohayrelacinelvalorseaproximaacero.
SiXeYsonindependienteelvalordelcoeficienteescero.Peronoalcontrario.Puedeocurrir
queelcoeficientedecorrelacinvalgaceroylasvariablesseandependientes.

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
423
Estadstica
3.3.Rectaregresinlineal
EldiagramadedispersinonubedepuntosnospermitavisualizarlarelacinentredosvariablesXeY.
Alrepresentareldiagramadedispersinpodemosencontrarlassiguientessituaciones:
Distribuciones estadsticas para las que la nube de puntos se dispone de tal forma que existe
unafuncinmatemticacuyospuntossonunapartedesurepresentacingrfica.
Sincoincidirsuspuntosconlosdeunagrficadeunafuncinmatemtica,seaproximanaella
conmayoromenorintensidad.
Lanubedepuntospresentaunaspectotalquenoexisteconcentracindepuntoshacianinguna
graficamatemtica,distribuyndosedeunaformauniformeenunaregindelplano.

EnelprimercasosedicequeexisteunadependenciafuncionaloexactaentrelasvariablesXeY,es
decir existe una funcin matemtica tal que y = f(x). En el segundo caso se dice que existe una
dependencia estadstica o aproximada entre las dos variables, Y aproxima f(x). Y en el ltimo caso
decimosquelasvariablessonindependientes.
Eselsegundocasodelqueseocupalateoraderegresin.

Lastcnicasderegresintienenporobjetomodelar,esdecir,encontrarunafuncinqueaproximelo
mximoposiblelarelacindedependenciaestadsticaentrevariablesypredecirlosvaloresdeunade
ellas: Y (variable dependiente o explicada) a partir de los valores de la otra (u otras): X (variable
independienteoexplicativa).
LlamamosregresinYsobreXalafuncinqueexplicalavariableY(dependiente)paracadavalordela
X(independiente).
LlamamosregresindeXsobreYalafuncinqueexplicalavariableX(dependiente)paracadavalorde
laY(independiente).

Larectaderegresinqueestudiamosesunafuncinlinealporqueelmodelodefuncinderegresin
seleccionadoesunarecta.
S xy
RectaderegresinYsobreXesy = a + bxdonde a y bx yb = 2
.
sx

Sxy
RectaderegresindeXsobreYesx = a + bydonde a ' x b ' y yb= 2 .
sy

Losvaloresdebybsonloscorrespondientescoeficientesderegresinparacadaunadelasrectas.
Hayquetenerencuentaquelarectaderegresindexsobreynoseobtienedespejandoxdelarecta
deregresindeysobrex.

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
424
Estadstica
3.4.Prediccinycausalidad
Elobjetivoltimodelarectaderegresineslaprediccindeunavariableparaunvalordeterminado
delaotra.LaprediccindeYparaX = x0,sersimplementeelvalorobtenidoenlarectaderegresin
deYsobreXalsustituirelvalordexporx0.
Esclaroquelafiabilidaddeestaprediccinsertantomayorcuantomayorsealacorrelacinentrelas
variables,esdecirmayorseaelvalorderxy.

Actividadespropuestas
18. Losdatossiguientessonlascalificacionesobtenidasporlosestudiantesdeungrupode25de1de
bachilleratoenlasasignaturasdeMatemticasyLengua.
Matemticas 4 5 5 6 7 7 7 7 7 7 8 8
Lengua 3 5 6 7 7 7 7 8 8 8 7 7

Matemticas 8 8 8 8 9 9 9 9 9 10 9 8
Lengua 8 8 8 8 8 8 8 10 10 10 9 9
a) Escribelatabladefrecuenciasconjunta.
b) Proporcindeestudiantesqueobtienemsdeuncincoenambasasignaturas,proporcinde
estudiantesqueobtienemsdeuncincoenMatemticas,proporcinestudiantesqueobtiene
msdeuncincoenLengua.
c) SonindependienteslascalificacionesdeMatemticasyLengua?
d) Representagrficamente. e)Calculaelcoeficientecorrelacin.
19. Pararealizarunestudiosobrelautilizacindeunaimpresoraenundeterminadodepartamento,se
midienundalosminutostranscurridosentrelassucesivasutilizacionesXyelnmerodepginas
impresasY,obtenindoselossiguientesresultados.

X 9 9 4 6 8 9 7 6 9 9 9 9 9 10 9 15 10 12 12 10 10 12 10 10 12 12

Y 3 8 3 8 3 8 8 8 3 8 12 12 20 8 20 8 8 20 8 8 12 8 20 20 3 3

a) Escribeladistribucindefrecuenciasconjunta.Porcentajedevecesquetranscurrenmsde
nueveminutosdesdelaanteriorutilizacinyseimprimenmenosdedocepginas.Nmero
de veces que se imprimen menos de doce pginas y transcurren nueve minutos desde la
utilizacinanterior.
b) Frecuencias marginales. Veces que se imprimen como mucho doce pginas. Nmero de
pginasqueseimprimenenel80%delasocasiones.
c) Calculaladistribucindelnmerodepginasimpresascondicionadaaquehantranscurrido
nueveminutosentresucesivasutilizaciones.
d) Dibujaeldiagramadedispersin.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
425
Estadstica
20. Lasestaturasdelos30niosnacidosenunamaternidadduranteunasemanafueronlossiguientes:
Estatura 50 51 53 50 51 48 50 49 52 52 49 50 52 51 52
Peso 32 41 45 30 36 29 38 38 36 39 30 38 41 35 40

49 50 51 52 53 52 52 51 50 51 54 50 51 51 51
31 33 39 37 41 42 35 38 36 34 46 35 36 31 40
a) Construyeunatabladedobleentrada,agrupandolospesosenintervalosde05kg.
b) Eslaestaturaindependientedelpeso?
21. Enelexamendeunaasignaturaqueconstadepartetericayparteprctica,lascalificacionesde
nuevealumnosfueron:

Teora 5 7 6 9 3 1 2 4 6
Prctica 6 5 8 6 4 2 1 3 7

Calcula la covarianza y el coeficiente de correlacin lineal. Dibuja la nube de puntos.
Comentalosresultados.

22. Se desea investigar el ganado caprino y el ganado ovino de un pas. En la tabla de doble entrada
adjunta se presentan los resultados de un estudio de 100 explotaciones ganaderas, seleccionadas
aleatoriamente del censo agropecuario. Se proporcionan las frecuencias conjuntas del nmero de
cabezas(enmiles)decabrasXyovejasYqueposeenlasexplotaciones.
X / Y 0 1 2 3 4
0 4 6 9 4 1
1 5 10 7 4 2
2 7 8 5 3 1
3 5 5 3 2 1
4 2 3 2 1 0

a) Hallalasmedias,varianzasydesviacionestpicasmarginales.
b) Hallaelnmeromediodeovejascondicionadoaqueenlaexplotacinhay2000cabras.
c) Hallaelnmeromediodecabrasquetienenaquellasexplotacionesquesabemosqueno
tienenovejas.
d) Hallalacovarianzayelcoeficientedecorrelacinentreambasvariables.

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
426
Estadstica
23. Elvolumendeahorroylarentadelsectorfamiliasenmilloneseneurosconstantesde2005parael
periodo20052014fueron.

Aos 05 06 07 08 09 10 11 12 13 14
Ahorro 19 18 20 21 19 20 22 23 27 30
Renta 205 208 212 217 221 223 222 226 231 235

a) Rectaregresindelahorrosobrelarenta.
b) Rectaderegresindelarentasobreelahorro.
c) Paraelao2015sesuponequelarentaerade24.1millonesdeeuros.culserel
ahorroesperadoparaelao2015?
d) Estudiarlafiabilidaddelaprediccinanterior.
24. Semidieltiempoensegundosquetardaronengrabarselosmismos24ficherosenunlpizUSBX
yenundiscoduroexteriorY.
X 12 1 11 05 11 15 1 14 14 13 04 03
Y 13 11 12 04 12 14 11 16 16 15 04 03

X 03 15 14 11 12 12 04 05 13 15 12 02
Y 03 16 13 11 13 11 04 04 14 16 09 03

a) Construyelatabladefrecuenciasconjunta.Culeselporcentajedeficherosquetardan
menosde15segundosenelprimertipoymsde14enelsegundo?Cuntosficheros
tardan en grabarse entre 06 y 12 segundos en el primer tipo de memoria? Cunto
tiempotardancomomuchoengravarsealmenosel90%delosficherosenelsegundo
tipodememoria?
b) Hallalatabladefrecuenciascondicionadasdelostiemposdelsegundotipodememoria
de aquellos programas que tardaron 12 en el primer tipo de memoria. Cul es la
proporcin de estos programas que tardan en grabarse ms de 15 segundos en el
segundotipodememoria?
c) Representagrficamentelosdatosycomentaelresultadoobtenido.
d) Si un fichero tarda 08 segundos en grabarse en el primer tipo de memoria, cuantos
segundos tardara en grabarse en el segundo tipo? Dar una medida de fiabilidad.
Confirmaestamedidalocomentadoenelapartadoc)?

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
427
Estadstica
25. Deunmuellesecuelganpesosyobtenemoslosalargamientossiguientes.

PesogrX 0 10 30 60 90 120 150 200 250 350
AlargamientocmY 0 05 1 3 5 65 8 102 125 18

EncuentralarectaderegresindeYsobreXyestimaelalargamientoqueseconseguirconpesosde
100y500gr.Culdelasdosestimacionesesmsfiable?
26. La tabla siguiente muestra el nmero de grmenes patgenos por centmetro cubico de un
determinadocultivosegneltiempotranscurrido.
Nmerodehoras 0 1 2 3 4 5
Nmerodegrmenes 20 26 33 41 47 53

a) Calcula la recta de regresin para predecir el nmero de grmenes por centmetro
cubicoenfuncindeltiempo.
b) Qu cantidad de grmenes por centmetro cubico es previsible encontrar cuando
transcurran6horas?Esbuenaestaprediccin?
27. Enundepsitocilndrico,laalturadelaguaquecontienevaraamedidaquepasaeltiemposegn
losdatosrecogidosenlatabla:
Tiempo:h 8 22 27 33 50
Altura:m 17 14 12 11 6
a) Encuentraelcoeficientecorrelacinentreeltiempoylaaltura.Daunainterpretacindel.
b) Qualturasealcanzaracuandohayantranscurrido40horas?
c) Cuandolaalturaalcanza2msuenaunaalarma.Cuntotiempotienequepasarparaquesuene
laalarma?
28. LaevolucindelIPC(ndicedepreciosalconsumo)ylatasadeinflacinenlosmesesindicadosde
undeterminadoao,vaser:
Enero Febrero Marzo Abril Mayo Junio
IPC 07 11 17 2 19 19
Tasainflacin 6 6 63 62 58 49
a) Representalanubedepuntos.
b) CalculaelcoeficientedecorrelacinentreelIPCylatasadeinflacin.
c) SepuedeestimarlatasadeinflacinapartirdelIPC?

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
428
Estadstica
CURIOSIDADES.REVISTA

ELEFECTOPLACEBOYELEFECTONOCEBO
Antesdequeunmedicamentopuedacomercializarsedebesuperaruna
serie de estrictas pruebas que arrojen seguridad acerca de su eficacia
curativa.
Unadelaspruebasmscomunesconsisteenseleccionarunamuestra
deenfermosydividirlosaleatoriamenteendosgrupos;ungruporecibe
elmedicamento,yelotro,sinsaberlo,unasustanciaenaparienciaigual,
perosinningnpoderteraputico:unplacebo.
De esta forma, al final del ensayo pueden compararse los resultados
entrelosdosgruposydeterminarlaeficaciadelmedicamento.Paraello
seempleanherramientasestadsticascomolacorrelacin.
Sorprendentemente, hay un nmero significativo de pacientes que,
habiendo recibido el placebo, mejoran de forma ostensible. Por
ejemplo, esta contrastado que, en muchas enfermedadesrelacionadas
con el dolor, entre el 10 % y el 15 % de los pacientes experimenta un
alivio notable habiendo seguido un tratamiento exclusivamente de
placebo.

RELACIONFUNCIONAL CORRELACIN
Silanzamosunapiedrahaciaarriballegarmsaltocuandomsfuertesea
lanzada.Existeunafrmulaquenospermitecalcular,exactamentelaaltura
conseguidaenfuncindelavelocidadconqueeslanzada.Estamosanteuna
relacinfuncional.
Laspersonas,engeneral,pesanmscuandomsaltosson.Peronosepuede
darunafrmulaquenospermitadarelpesodeunapersonaconexactitud
conociendosualtura,slopodremosconseguirunafrmulaquenosdun
valoraproximadoyconocerlaeficaciadeesafrmula.Larelacinentrelas
variables pesoestatura es una relacin estadstica. Diremos que hay una
correlacinentreestasvariables.
Tambinvamosaencontrarcorrelacinentreladistanciaaqueunjugador
debaloncestosecolocadelacestayelnmerodecestasqueconsigue.Pero
enestecaso,alcontrariodelanterior,hayunacorrelacinnegativa,yaquea
msdistancia,menornmerodecestas.

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
429
Estadstica

CONTRALASUPERSTICIN,ESTADSTICA
Vivimosenunmundodominadoporlacienciaylatecnologa,a

pesardeellolassupersticionesylascreenciasseudocientficas
siguendominandoentrelapoblacingeneral,inclusomsque
en otras pocas. La Estadstica es un arma importante para
desenmascarar algunas afirmaciones que circulan
impunementeyquemuchagentecree,comolasderivadasde
la astrologa. Existen cientos de estudios que prueban que
aunque existan coincidencias entre el signo astrolgico de las
personas y sus formas de ser, gustos, comportamientos,
profesiones, etc. stas estn siempre en torno a la media
estadstica.
Unacreenciamuyhabitualesquelosnacimientosseproducen
con mayor frecuencia durante los das, y especialmente las
noches, de luna llena. Resultara sencillo coger los registros
civiles y comprobar si eso es verdad, pero los que afirman
semejantedatonuncasemolestanenhacerlo.Recientemente
sehapuestodemanifiestomedianteelanlisisdelosdatosde
un conjunto de estudios al respecto que las variaciones de
nacimientos entre fases lunares son de apenas un 1 %, sin
embargo tambin el mismo estudio ha puesto de manifiesto
que el 60 % de los nacimientos se producen entre las 6 de la
maana y las seis de la tarde, mostrando as una diferencia
mucho ms significativa que suele tener su explicacin en la
organizacindeloshospitales.

Estadstica
El nombre de Estadstica proviene del s. XIX, sin embargo ya se
utilizaban representaciones grficas y otras medidas en pieles,
rocas, palos de madera y paredes de cuevas para controlar el
nmero de personas, animales o ciertas mercancas desde la
Prehistoria. Los babilonios usaban ya envases de arcilla para
recopilar datos sobre la produccin agrcola. Los egipcios
analizabanlosdatosdelapoblacinylarentadelpasmuchoantes
de construir las pirmides. Los antiguos griegos realizaban censos
cuyainformacinseutilizabahacia600aC.

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
430
Estadstica
RESUMEN
Ejemplos
Histograma Representacingrficadelosdatosagrupadosenintervalos. 5

0 21 42 21315465161 126
Media i xi ni k x 2'52
x xi f i 50 50
aritmtica n i 1

Mediana Valortalqueenladistribucinhaytantosdatosmenores
quelcomomayoresquel.

Moda Datoconmayorfrecuencia,elquemsvecesserepite.

Varianza
xi x xi fi
n 2 n 2

s 2 i 1 i 1 x2
n n
Desviacintpica s= Varianza

Covarianza i j ( xi x ) ( yi y ) nij i j xi yi nij


S xy xy
n n
Coeficiente S xy
rxy 1r1
correlacin sx s y

Dependencia r =1dependenciafuncionallinealnegativa
lineal
1<r<0dependencianegativa
r=0noexistedependencialineal,nifuncional
0< r<1dependenciapositiva
r=1dependenciafuncionallinealpositiva
Rectaregresin S xy
YsobreX y y 2
(x x)
sx

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
431
Estadstica
EJERCICIOSYPROBLEMAS
Estadsticadescriptivaunidimensional
1. Seconoceelvolumensemanalderesiduosslidosrecogidosenm3durante10semanas,en
unmunicipiopequeo:
25'5,27'1,31'8,34'2,38'9,21'3,28'7,33'2,36'5,39'6
Calcula:
a) Lasmedidasdecentralizacin:lamedia,mediana,moda
b) Las medidas de dispersin: desviacin tpica, varianza, coeficiente de variacin, valor mnimo,
valormximo,recorrido,primercuartil,tercercuartileintervalointercuartlico.
c) Haz una representacin grfica en serie temporal, que permita observar tendencias, ciclos y
fluctuaciones. Recuerda que en una serie temporal, en el eje de abscisas est el tiempo de
observacinyenelejedeordenadaslamagnituddeobservacin.
2. Unacompaadesegurosdeseaestablecerunaplizadeaccidentes.Paraello,seleccionaal
azar a 100 propietarios y les pregunta cuntos euros han gastado en reparaciones del
automvil.Sehanagrupadoenintervaloslosvaloresdelavariableobtenidos:
Euros [0,100) [100,200) [200,400) [400,600) [600,800) [800,3000)

Nmerodepersonas 20 20 10 20 20 10
a) Calcula las marcas de clase y escribe en tu cuaderno una tabla de frecuencias absolutas,
frecuenciasrelativas,frecuenciasacumuladasabsolutasyfrecuenciasrelativasacumuladas.
b) Representalosdatosenundiagramadebarras,otrodelneasyunodesectores.
c) Representaunhistogramadefrecuenciasrelativas.Cuidado:Losintervalosnosontodosiguales.
d) Calculalamediayladesviacintpica.
e) Calculalamedianayloscuartiles.
3. Sehapreguntadoa40alumnosporelnmerodehermanosquetena,ysehaobtenido
Nmerodehermanos 0 1 2 3 4 5 6oms
Nmerodeveces 5 15 7 6 4 2 1
a) Representa un diagrama de barras de frecuencias absolutas y un diagrama de lneas de
frecuenciasrelativas.
b) Calculalamedia,lamedianaylamoda.
4. Sehapreguntadoa50estudiantesde1deBachilleratoporelnmerodehermanosquetena,yse
haobtenido:
Nmerodehermanos 0 1 2 3 4 5 6oms
Nmerodeveces 8 19 8 7 5 2 1
a) Representa los datos en un diagrama de barras de frecuencias absolutas, en un diagrama de
lneasdefrecuenciasrelativas,yenundiagramadesectores.
b) Hazunhistograma.
c) Calculalamedia,lamedianaylamoda.Calculaloscuartiles.
d) Calculalavarianza,ladesviacintpica,elrecorridoyelintervalointercuartlico.

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
432
Estadstica
Utilizaunahojadeclculoconelordenador
Seconoceelvolumensemanalderesiduosslidosrecogidosenm3durantelas52semanasdeunao,
enunmunicipiopequeo:
25'5,27'1,31'8,34'2,38'9,21'3,28'7,33'2,36'5,39'6,25'2,24'7,23'2,23'3,22'2,26'4,26'7,29'6,31'3,
30'5,28'3,29'1,26'7,25'2,24'5,23'7,25'4,27'2,31'7,34'5,38'4,21'2,28'1,33'7,36'8,39'9,31'7,34'4,
38'2,21'9,28'1,33'5,25'2,24'7,23'2,23'3,22'2,26'4,25'9,24'1,23'2,23'6,26'4.
Calcula,utilizandoExceluotrahojadeclculo:
5. Parmetrosestadsticos
a) Lasmedidasdecentralizacin:lamedia,mediana,moda
b) Lasmedidasdedispersin:desviacintpica,varianza,coeficientedevariacin,valormnimo,valor
mximo,recorrido,primercuartil,tercercuartileintervalointercuartlico.
c) Otroscoeficientes:coeficientedeasimetraycoeficientedecurtosisqueencuentres.Investigalas
posibilidadesdelordenadorparaobtenerparmetrosestadsticos.
d) Haz una representacin grfica en serie temporal, que permita observar tendencias, ciclos y
fluctuaciones. Recuerda que en una serie temporal, en el eje de abscisas est el tiempo de
observacinyenelejedeordenadaslamagnituddeobservacin.
Paraello,escribeenlacasillaA12,1,enA13,2,yarrastraparaescribirelordendelassemanas,hasta
queaparezcael52.EscribeenlacolumnaBelvolumenrecogidocadasemana.
EnlacasillaA11unttulo,porejemplo,Residuosslidos.
En la casilla C12 escribe Media, y en la casilla D12 calclala usando la funcin PROMEDIO. De igual
formacalculalosotrosparmetros.
Observauntrozodepantallaconalgunosresultados:


MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
433
Estadstica
6. Los datos de la prctica anterior se quieren representar en un histograma para mejor
determinarsudistribucin.Paraello:
a) Indicaelnmerototaldedatos,N,elmenorvalor:Xm,elmayorvalor,XM,yelrecorridoR.
b) Lacantidaddebarrasdelhistograma,k,sesueletomar,paramenosde50datos,entre5y7.ParaN
entre50y100,entre6y10.ParaNentre100y250,
entre7y12.YparaNmayorde250,entre10y20.En
estecasoNesiguala52,luegoelnmerodebarras
podra ser entre 6 y 10. Al dividir R entre 10 se
obtiene 1,87 que sera el intervalo de clase. Para
facilitar la divisin en clases fijamos el intervalo de
clase,h,en2,yelnmerodebarras,k,en10.Parano
tenervaloresenloslmitesdeclasetomamoselinicio
del primer intervalo en 20. As, los intervalos son: (20, 22), de valor central: 21; [22, 24), de valor
central23...Ahorayasepuedeconstruirlatabladefrecuenciasydibujarelhistograma.
c) Calculayrepresentaenelhistogramalospuntosm, m s, m 2s, m 3s,dondemyssonlamediay
ladesviacintpica,respectivamente
Vamosainvestigarquocurrealhaceruncambiodevariables.Dijimosquesiconsideramos
yi = a + bxi siendo a y b dos constantes cualesquiera, la nueva media aritmtica quedara
y a bx .
a) AbreExcel.Introducelosdatos:X=255,271,318,342,389,...enlacolumnaA,apartirdelafila11.
Qucambiodevariablesehahecho?Observa:x = X/10.
b) EnlacolumnaC,apartirdelafila11escribeloslmitesdeclase,enlacolumnaDelvalormedio,en
lacolumnaEvamosacontarlasfrecuenciasabsolutasyenlacolumnaFlasfrecuenciasacumuladas.
UtilizalafuncinCONTAR.SIparacontar.Porejemplo,escribeenE11,CONTAR.SI(A11:A63;<220).En
F11escribe=E11.EnE12escribeCONTAR.SI(A11:A63;<240)F11.Completalatabladefrecuencias.
Escribettulosenlafila10.
c) Calcula la media y la desviacin tpica. Para ello escribe en la fila 3 y 4, columna B, las funciones
=PROMEDIO(A11:A63)y=DESVEST(A11:A63).Escribelosresultadoscon2decimales.
d) Cmo obtienes ahora la media y la desviacin tpica de los datos reales? Cmo deshaces el
cambio?Sinolorecuerdas,onotienesseguridad,investgalo.Calculalamediayladesviacintpica,
antesydespusdelcambio.Escribeesteresultado,engeneral,parauncambiodevariableslinealy
= ax+b.
e) Dibujaelhistograma.Noolvidesnuncaindicarlasunidadesenambosejes,ytodalainformacinque
ayudeacomprenderelgrfico.Aadesiempreeltamao,N,ylosvaloresdelamediayladesviacin
tpica.
f) Discuteelresultado.Esgrandeladispersin?Ladistribucin,essimtrica?
Otrainvestigacin:Vamosainvestigarladistribucindelamedia.Paraellovamosatomar
muestrasdetamao5.UtilizalacolumnaG.EnG11escribe=PROMEDIO(B11:B15),enG12
lamediadeB16aB20,yashastaelfinal.Tenemoscalculadaslas10mediasdemuestrasde
tamao 5. Calcula la media y la desviacin tpica de estas medias. Compara con los
resultadosanteriores.Escribeentucuadernolasconclusiones.

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
434
Estadstica
Estadsticadescriptivabidimensional
7. Enunamuestrade10personasmiramossucolordeojosypeloyencontramosquehay5
morenosdeojosmarrones,1morenodeojosverdes,3rubiosdeojosazulesy1rubiode
ojosverdes.A)Representaenunatabladedobleentradaestasituacin.B)Escribelatabla
de frecuencias relativas. C) Escribe las frecuencias absolutas y relativas marginales. D)
Escribeladistribucindefrecuenciascondicionadas.
8. Lolahacalculadoloscoeficientesdecorrelacindelastresnubesdepuntosadjuntas,yha
obtenido:08,085y003,peroahoranorecuerdaculesdecadauna.Puedesayudara
decidirqucoeficientecorrespondeconcadanube?
A B C
10 10 14
12
8 8
10
6 6 8
4 4 6
4
2 2
2
0 0 0
0 1 2 3 4 5 6 7 8 9 10 2 3 4 5 6 7 8 9 10 2 3 4 5 6 7 8 9 10

9. Enunatiendaquierenestudiarlasventasdelpandemoldeenfuncindelprecio.Paraello
pruebancadasemanaconunpreciodistintoycalculanlasventasrealizadas.Hanobtenido
lossiguientesdatos:
Precio(euros) 05 07 1 12 13 15 17 18 2
Ventas(medias) 202 192 181 153 116 6 4 0 0
a) Representalosdatosenundiagramadedispersin(nubedepuntos)eindicaaquconclusiones
creesquesevaallegar.
b) Calculalacovarianza,elcoeficientedecorrelacinylarectaderegresin.
c) Decidenponerunpreciode14euros,culesopinasqueseranlasventasmediassemanales?

10. Preguntamosa10estudiantesde1deBachilleratoporsuscalificacionesenMatemticas,
porelnmerodeminutosdiariosquevenlatelevisin,porelnmerodehorassemanales
quededicanalestudio,yporsuestaturaencentmetros.Losdatosserecogenenlatabla
adjunta.
CalificacionesdeMatemticas 10 3 8 8 5 10 10 8 5 8
MinutosdiariosquevelaTV 0 90 30 20 70 10 0 20 60 30
Horassemanalesdeestudio 15 0 10 10 10 15 15 10 5 5
Estatura(encm) 175 166 155 161 161 177 182 177 167 172
Queremos estudiar la relacin entre las calificaciones de Matemticas y las otras tres variables. Para
ello dibuja los diagramas de dispersin, y calcula los coeficientes de correlacin y las rectas de
regresin.

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
435
Estadstica
11. UnacompaaarearealizaunestudiosobrelarelacinentrelasvariablesX,tiempodeun
vuelo,enhoras;eY,consumodecombustible(gasleo)paradichovuelo,enlitros,ysehan
obtenidolossiguientesdatos.
X(horas) 05 1 15 2 25 3
Y(litros) 2250 3950 5400 7300 8500 10300
a) Representalosdatosenundiagramadedispersin.
b) Calculalacovarianzayelcoeficientedecorrelacinentreambasvariables.Interpretalosresultados.
c) Calculalaecuacindelasrectasderegresin.
12. Haz un trabajo. Pasa una encuesta a tus compaeros y compaeras de clase. Elige una
muestra de 10 personas y hazles dos preguntas con datos numricos, como por ejemplo,
cuntomidesumano,qunmerodezapatocalza,elnmerodelibrosqueleeenunmes,
el nmero de horas que ve la televisin a la semana, dinero que gasta al mes en comprar
msica, la calificacin en Matemticas de su ltimo examen Representa los datos
obtenidos en una tabla de doble entrada. Haz un estudio completo. Puedes utilizar el
ordenador:
a) Escribe en tu cuaderno una tabla de doble entrada de frecuencias absolutas, frecuencias
relativas.Obtnlasdistribucionesmarginalesycondicionadas.
b) Conlasdistribucionesunidimensionales,dibujalosdiagramasdebarras,diagramasdelneasy
diagramas de sectores. Calcula las medias, medianas y modas. Calcula las varianzas y las
desviacionestpicas.Calculaloscuartilesylosintervalosintercuartlicos.
c) Con las distribuciones bidimensionales, dibuja un diagrama de dispersin, y calcula la
covarianza,elcoeficientedecorrelacinylarectaderegresin.
d) Reflexionasobrelosresultadosyescribeuninforme.
Utilizaunahojadeclculoconunordenador
13. Elobjetivodeestaprcticaesestudiarladispersinentredosvariables,medianteunanube
depuntosodiagramadedispersin,elcoeficientedecorrelacinylarectaderegresin.
En10pasesseanotanlosingresosmedios,eneuros,porhabitanteyao,yelporcentajemedioenlos
residuosslidosdecomida.
Seobtiene:
xi() 750 5000 7000 2000 5500 1000 500 6000 4000 3000
yi(%) 85 65 30 20 25 45 70 6 40 50
a) Abreunahojadeclculo.Copialosdatos.Calculalamediayladesviacintpicadelasx,ylamedia
yladesviacintpicadelasy.
b) Representa la nube de puntos. Selecciona los datos,
incluyendo a las medias. Aprieta el botn de asistente
de grficos y elige XY (Dispersin). En ttulos escribe
como Ttulo del grfico Correlacin, en Eje de valores
(X) describe la variable x sin olvidar decir las unidades,
escribe: Ingresos/habitante (), en Eje de valores (Y)
describe la variable y sin olvidar decir las unidades,
escribe: Porcentaje de residuos de comida en los RSU
(%).EnLeyendaeligenomostrarleyenda.
MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
436
Estadstica
c) Observaquesix x ey y tienenelmismosignoquedanenloscuadrantesIyIIIysilotienen
distintoenIIyIV.CuentalospuntosquequedanenloscuadrantesIyIII,cuentalosquequedanen
loscuadrantesIIyIV.Nospuededarunaideadelacorrelacin.Vaaserpositivaonegativa?Es
unacorrelacinfuerteodbil?Entrequevalorespuedevariarelcoeficientedecorrelacin?Estima
aojounvalorparaesacorrelacin.
d) OrganizaenExcelunahojadeclculoquetepermitacalcularlacorrelacin.Escribelosdatosenlas
filas 3 y 4. En L3 y L4 calcula las medias utilizando la funcin PROMEDIO. En M3 y M4 calcula la
desviacin tpica utilizando la funcin DESVEST. En N3 calcula el coeficiente de correlacin,
utilizandolafuncin:
COEF.DE.CORREL(B3:K3;B4:K4)
e) Ahoravamosamejorarnuestrogrfico.Observaquesicolocasalratnencimadeunpuntoindica
lascoordenadas.Trazalasrectasx= x ,y= y queindicanlasmedias.Utilizaparaellolapaletade
dibujo.Dibjalasencolorrojo.
f) Larectaderegresineslarectaquehacemnimaslasdistanciasdelanubedepuntos.Eslarecta:y
sy
= y + (x x ).CalculaenN4lapendientedelarecta.Escribelaecuacindelarecta.Observael
sx
grfico.Cmolahabrasestimadoaojo?Evalalapendienteylaordenadaenelorigen.
14. Serecogeenunatablalaaltura(enmetros)deunpadreydeladesuhijocon15aosde
edad.
Padre 17 2 16 17 165 19 19 181
Hijo 175 19 17 18 16 188 2 195
a)Utilizaelordenadorpara
representareldiagramade
dispersin. Copia los datos
en una hoja de clculo en
las columnas A y B. Seala
las dos series y elige
insertar grfico de
dispersin. Automticamente vers que aparece el
diagramadedispersin(nubedepuntos).Juegaconlas
opciones para modificar el ttulo, el formato, la escala
delosejes
b)Dibujalarectaderegresin.Pinchasobreunpuntodelanube, 2,5

yeligeAgregarlneadetendencia.Paraquedibujeelordenador
2
la recta de regresin la lnea de tendencia debe ser Lineal. En la
pantalla que aparece marcamos la casilla que dice: Presentar 1,5
ecuacinenelgrficoylacasillaquedicePresentarelvalordeR
cuadrado en el grfico. Al final, si lo has hecho bien, el dibujo 1

debesermsomenosalgosimilaraesto:
0,5

c) Utiliza la recta para determinar que altura del hijo


0
corresponderaaunaalturadelpadrede175m. 1,5 1,6 1,7 1,8 1,9 2

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF
437
Estadstica
AUTOEVALUACIN
Realizamosunapruebaa20aspirantesaunpuestodegrabadorconsistenteenundictadoconcierto
tiempo de duracin (en minutos) y luego contar el nmero de errores cometidos al transcribirlo a
ordenador.Losresultadosfueron.
Tiempo 7 6 5 4 5 8 7 8 9 6 5 8 6 8 7 8 7 6 6 9
Errores 8 7 6 6 7 10 9 9 10 8 6 10 8 9 8 8 7 8 6 8
1.Lamediadeerroreses
a)675 b)7 c)79 d)69
2.Lamediadetiemposes
a)675 b)7 c)79 d)69
3.Ladesviacintpicadeerroreses
a)1 b)141 c)133 d)12
4.Ladesviacintpicadetiemposes
a)1 b)141 c)133 d)12
5.Elprimercuartil,lamedianayeltercercuartildelostiemposvalenrespectivamente:
a)7,8y9 b)5,6y7 c)59,61y73 d)6,7y8
6.Elprimercuartil,lamedianayeltercercuartildeloserroresvalenrespectivamente:
a)7,8y9 b)5,6y7 c)65,75y85 d)6,7y8
7.Lacovarianzaes:
a)121 b)15 c)14 d)1425
8.Elcoeficientedecorrelacines:
a)08 b)08 c)07 d)07
9.Larectaderegresinlinealdeloserroressobreeltiempoes:
a)y=310'71x b)y=31+0'71x c)y=0'4+0'8x d)y=0'40'8x
10.Larectaderegresinlinealdeltiemposobreloserroreses:
a)y=310'71x b)y=31+0'7 c)y=0'4+0'8x d)y=0'40'8x

MatemticasI.BachilleratodeCiencias.Captulo9:Estadstica Autor:IgnasiClausell
LibrosMareaVerde.tk Revisora:RaquelCaro
www.apuntesmareaverde.org.es Ilustraciones:BancodeImgenesdeINTEF

You might also like