You are on page 1of 86

Distribuciones discretas de probabilidad

Variable aleatoria

Se llama variable aleatoria a toda función que asocia a cada elemento del espacio
muestral E un número real.

Se utilizan letras mayúsculas X, Y, ... para designar variables aleatorias, y las respectivas
minúsculas (x, y, ...) para designar valores concretos de las mismas.

Variable aleatoria discreta

Una variable discreta es aquella que solo puede tomar un número finito de valores entre dos
valores cualesquiera de una caraterística.

Ejemplos:

El número de hijos de una familia, la puntuación obtenida al lanzar un dado.

Variable aleatoria continua

Una variable continua es aquella que puede tomar un número infinito de valores entre dos
valores cualesquiera de una caraterística.

Ejemplos:

La altura de los alumnos de una clase, las horas de duración de una pila.

Función de probabilidad

Se llama función de probabilidad de una variable aleatoria discreta X a la aplicación que


asocia a cada valor de xi de la variable su probabilidad pi.

0 ≤ pi ≤ 1

p1 + p2 + p3 + · · · + pn = Σ pi = 1
Calcular la distribución de probabilidad de las puntuaciones obtenidas al lanzar un dado.

x pi

Representación

La representación de una distribución discreta de probabilidad es un diagrama de barras.


Función de distribución

Sea X una variable aleatoria discreta cuyos valores suponemos ordenados de menor a mayor.
Llamaremos función de distribución de la variable X, y escribiremos F(x) a la función:

F(x) = p(X ≤ x)

La función de distribución asocia a cada valor de la variable aleatoria la probabilidad


acumulada hasta ese valor.

Ejemplo:

Calcular la función de distribución de probabilidad de las puntuaciones obtenidas al lanzar un


dado.

x pi

x <1 0

1≤ x < 2

2≤ x < 3
3≤ x < 4

4≤ x < 5

5≤ x < 6

6≤ x 1

Representación

La representación de una función de distribución de probabilidad es una gráfica escalonada.

Media y varianza de una variable aleatoria discreta

Esperanza matemática o media

Varianza
Desviación típica

Ejemplo

Calcular la esperanza matemática, la varianza, y la desviación típica, de la distribución de


probabilidad de las puntuaciones obtenidas al lanzar un dado.

x pi x·pi x 2 · pi

6 1 6
Ejercicios de distribuciones discretas

1 S e l an za u n par de dado s. Se de f i ne l a vari abl e ale ato ri a X c om o la s um a de


l as pu n tu ac io n e s o bte n i das. H all ar l a func ió n de pro babi l i dad, l a es pe ranza
m atem áti c a y l a vari an za

x p i x · p i x 2· pi

2 1 /3 6 2 /3 6 4 /3 6

3 2 /3 6 6 /3 6 1 8 /3 6

4 3 /3 6 1 2 /3 6 4 8 /3 6

5 4 /3 6 2 0 /3 6 1 0 0 /3 6

6 5 /3 6 3 0 /3 6 1 8 0 /3 6

7 6 /3 6 4 2 /3 6 2 9 4 /3 6

8 5 /3 6 4 0 /3 6 3 2 0 /3 6

9 4 /3 6 3 6 /3 6 3 2 4 /3 6

10 3 /3 6 3 0 /3 6 3 0 0 /3 6

11 2 /3 6 2 2 /3 6 2 4 2 /3 6

12 1 /3 6 1 2 /3 6 1 4 4 /3 6

7 54.83
2 U n ju gado r lan za u n dado c o rri e nte . S i s ale 1 o núm e ro prim o , gana tanto s
c ie n to s de e u ro s c om o marc a e l dado , pe ro si no s al e núme ro prim o , pi e rde
tan to s c i e n to s de eu ro s co mo marc a el dado . De te rmi nar l a func ió n de
pro babi l i dad y l a es pe ran za m ate m áti c a de l jue go

x p i x · p i

+1 0 0 1 0 0 /6

+ 200 2 0 0 /6

+ 300 3 0 0 /6

- 400 -4 0 0 /6

+ 500 5 0 0 /6

-6 0 0 - 6 0 0 /6

1 0 0 /6

µ =1 6 . 6 6 7
3 S i u n a pe rs o n a co m pra u n a papel e ta e n una ri f a, e n l a que pue de ganar de
5. 000 € ó u n s e gu n do pre mi o de 2000 € co n pro babil i dade s de : 0. 001 y 0. 003.
¿C u ál se rí a el pre ci o ju s to a pagar po r l a pape l e ta?

μ = 5000 · 0. 001 + 2000 · 0. 003 = 11 €

4 Sea X una variable aleatoria discreta cuya función de probabilidad es:

x pi

0 0,1

1 0,2

2 0,1

3 0,4

4 0,1

5 0,1

1 C al c ul ar la f un c i ó n de di s tri bu c i ó n.
2 C al c ul ar las si gu i e n te s pro babi l i dade s :

p ( X < 4. 5)

p ( X ≥ 3)

p ( 3 ≤ X < 4. 5)

E je rc i ci o s de di s tri bu c io n e s di s c re tas I I

1 C al c u l ar l a f u n c ió n de di s tri bu c ió n.
E = {( c, c ) ; ( c, x) ; ( x, c ) ; ( x, x) }

p( + 1) = 2/ 4

p( + 2) = 1/ 4

p( − 5) = 1/ 4

μ = 1 · 2/ 4 + 2 · 1/ 4 - 5 · 1/ 4 = −1/4. Es de sfavo r abl e

1 La función de probabilidad y su representación

x p i

5
6

2 La función de distribución y su representación

x p i

x <1 0

1≤ x < 2

2≤ x < 3

3≤ x < 4

4≤ x < 5

5≤ x < 6

6≤ x 1
3 La esperanza matemática, la varianza y la desviación típica

x p i x· p i x 2
·p i

6 1 6
2 C al c u l ar l as s i gu ie n te s pro babil i dade s :

p ( X < 4. 5)

p ( X < 4. 5) = F ( 4. 5) = 0. 9

p ( X ≥ 3)

p ( X ≥ 3) = 1 - p( X < 3) = 1 - 0. 4 = 0. 6

p ( 3 ≤ X < 4. 5)

p ( 3 ≤ X < 4. 5) = p (X < 4. 5) - p( X < 3) = 0. 9 - 0. 4 = 0. 5

1 U n ju gado r l an za do s mo n e das. G ana 1 ó 2 € si apare c en una o do s c aras . Po r


o tra parte pi e rde 5 € s i no apare ce c ara. De te rm i nar la e s pe ranza mate m áti c a de l
jue go y si és te e s f avo rabl e

2 Dada l a f u n c ió n :

Y s abie n do qu e p(X ≤ 2) = 0. 7 y p( X ≥ 2) = 0. 75. Hal l ar:

1 La es pe ran za m atem áti c a


2 La vari an za
3 La de s vi ac ió n tí pi c a
x p i x · p i x 2· pi

0 0. 1 0 0

1 0. 1 5 0.15 0. 1 5

2 0. 4 5 0.9 1. 8

3 0. 1 0.3 0. 9

4 0. 2 0.8 3. 2

2. 1 5 6. 0 5

1 La es pe ran za m atem áti c a

μ =2 . 1 5

2 La vari an za

σ ² = 6. 05 - 2. 15² = 1. 4275

3 La de s vi ac ió n tí pi c a

σ = 1.19

E je rc i ci o s de l a e s pe ran za mate m áti c a


1 Dada la e xpe ri e n c i a al e ato ra de ano tar las puntuac i one s obte ni das al l anzar
u n dado, c al c ul ar:
1 La f u n ci ó n de pro babil i dad y s u re pre s e ntac i ó n
2 La f u n ci ó n de di s tri bu c i ó n y su re pre s e ntac ió n
3 La e s pe ran za mate m áti c a, la vari anza y l a de s vi ac ió n tí pi c a

2 Sea X una variable aleatoria discreta cuya función de probabilidad es:

x pi

0 0,1

1 0,2

2 0,1

3 0,4

4 0,1

5 0,1

1 C al c ul ar, re pre s e n tar gráf i c ame nte l a func ió n de di s tri buc i ón


2 C al c ul ar las si gu i e n te s pro babi l i dade s :

p ( X < 4. 5)

p ( X ≥ 3)

p ( 3 ≤ X < 4. 5)

1 C al c u l ar, re pre se n tar gráf i c am e nte la f unc i ó n de di s tri buc i ó n


2 >C al c u l ar las s i gui e n te s pro babi l i dade s:

p ( X < 4. 5)

p ( X < 4. 5) = F ( 4. 5) = 0. 9

p ( X ≥ 3)

p ( X ≥ 3) = 1 - p( X < 3) = 1 - 0. 4 = 0. 6

p ( 3 ≤ X < 4. 5)

p ( 3 ≤ X < 4. 5) = p (X < 4. 5) - p( X < 3) = 0. 9 - 0. 4 = 0. 5

3 S abie n do qu e p(X ≤ 2) = 0. 7 y p( X ≥ 2) = 0. 75. H al l ar l a e s pe ranza


m atem áti c a, l a vari an za y l a de s vi aci ó n tí pic a
x p i x · p i x 2· pi

0 0. 1 0 0

1 0. 1 5 0.15 0. 1 5

2 0. 4 5 0.9 1. 8

3 0. 1 0.3 0. 9

4 0. 2 0.8 3. 2

2. 1 5 6. 0 5

μ =2 . 1 5

σ² = 6. 0 5 - 2 . 1 5² = 1. 4 2 7 5

σ = 1.19

4 U n ju gado r lan za do s m on e das . Gana 1 ó 2 € s i apare c e n una o do s c aras .


Po r o tra parte pie rde 5 € si no apare c e c ara. De te rm i nar l a es pe ranza
m atem áti c a de l ju e go y s i é s te es f avo rabl e

E = {( c, c ) ; ( c, x) ; ( x, c ) ; ( x, x) }

p( + 1) = 2/ 4

p( + 2) = 1/ 4

p( − 5) = 1/ 4

μ = 1 · 2/ 4 + 2 · 1/ 4 - 5 · 1/ 4 = −1/4. Es de sfavo r abl e


5 S e l an za u n par de dado s. Se de f i ne l a vari abl e ale ato ri a X c om o la s um a de
l as pu n tu ac i o ne s o bte n i das. Hal l ar l a f unci ó n de pro babi li dad, l a e s pe ranza
m atem áti c a y l a vari an za

x p i x · p i x 2· pi

2 1 /3 6 2 /3 6 4 /3 6

3 2 /3 6 6 /3 6 1 8 /3 6

4 3 /3 6 1 2 /3 6 4 8 /3 6

5 4 /3 6 2 0 /3 6 1 0 0 /3 6

6 5 /3 6 3 0 /3 6 1 8 0 /3 6

7 6 /3 6 4 2 /3 6 2 9 4 /3 6

8 5 /3 6 4 0 /3 6 3 2 0 /3 6

9 4 /3 6 3 6 /3 6 3 2 4 /3 6

10 3 /3 6 3 0 /3 6 3 0 0 /3 6

11 2 /3 6 2 2 /3 6 2 4 2 /3 6

12 1 /3 6 1 2 /3 6 1 4 4 /3 6

7 54.83
6 U n ju gado r lan za u n dado c o rri e nte . S i s ale 1 o núm e ro prim o , gana tanto s
c ie n to s de e u ro s c om o marc a e l dado , pe ro si no s al e núme ro prim o , pi e rde
tan to s c ie n to s de e u ros co mo m arc a el dado . De te rmi nar l a func ió n de
pro babi l i dad y l a es pe ran za m ate m áti c a de l jue go

x p i x · p i

+1 0 0 1 0 0 /6

+ 200 2 0 0 /6

+ 300 3 0 0 /6

- 400 -4 0 0 /6

+ 500 5 0 0 /6

-6 0 0 - 6 0 0 /6

1 0 0 /6

µ =1 6 . 6 6 7

7 S i u n a pe rs o n a co m pra u n a papel e ta e n una ri f a, e n l a que pue de ganar de


5. 000 € ó u n s e gu n do pre mi o de 2000 € co n pro babil i dade s de : 0. 001 y 0. 003.
¿C u ál se rí a el pre ci o ju s to a pagar po r l a pape l e ta?

μ = 5000 · 0. 001 + 2000 · 0. 003 = 11 €

Distribución binomial o de Bernoulli


Un experimento sigue el modelo de la distribución binomial o de Bernoulli si:

1. En cada prueba del experimento sólo son posibles dos resultados: el suceso A (éxito) y su
contrario .

2. La probabilidad del suceso A es constante, es decir, que no varía de una prueba a otra. Se
representa por p.

3. El resultado obtenido en cada prueba es independiente de los resultados obtenidos


anteriormente.

La distribución binomial se suele representar por B(n, p).

n es el número de pruebas de que consta el experimento.

p es la probabilidad de éxito.

La probabilidad de es 1− p, y la representamos por q.

Variable aleatoria binomial

La variable aleatoria binomial, X, expresa el número de éxitos obtenidos en cada prueba


del experimento.

La variable binomial es una variable aleatoria discreta, sólo puede tomar los valores 0, 1,
2, 3, 4, ..., n suponiendo que se han realizado n pruebas.

Ejemplo:

k = 6, al lanzar una moneda 10 veces y obtener 6 caras.

La función de probabilidad de la distribución binomial, también denominada función de la


distribución de Bernoulli, es:
n es el número de pruebas.

k es el número de éxitos.

p es la probabilidad de éxito.

q es la probabilidad de fracaso.

El número combinatorio

Ejemplos

La última novela de un autor ha tenido un gran éxito, hasta el punto de que el 80% de los
lectores ya la han leido. Un grupo de 4 amigos son aficionados a la lectura:

1 ¿Cuál es la probabilidad de que el grupo hayan leido la novela 2 personas?

n=4

p = 0.8

q = 0.2

B(4, 0.8)

2 ¿Y cómo máximo 2?
Media

Varianza

Desviación típica

Ejemplo

La probabilidad de que un artículo producido por una fabrica sea defectuoso es 0.02. Se envió
un cargamento de 10.000 artículos a unos almacenes. Hallar el número esperado de artículos
defectuosos, la varianza y la desviación típica.

Eje r c i ci o s d e di st r i b uc i ó n bi no mi al

1 Se lan za u n a mo ne da c u atro ve c e s. C alc ul ar l a pro babil i dad de que s al gan más


c aras que c ru c e s

B ( 4, 0. 5) p = 0. 5q = 0. 5
2 U n age n te de se gu ro s ve n de pól i zas a ci nc o pe rs o nas de l a m is m a edad y que
dis f ru tan de bu en a s al u d. S egú n l as tabl as ac tual e s , l a pro babil i dad de que una
pe rs o n a e n e s tas co n di c io n e s vi va 30 año s o más es 2/ 3. H ál l es e la pro babi li dad de
que , tran s c u rri do s 30 añ o s , vi van :

1 Las ci n c o pe rs o n as

B ( 5, 2/ 3) p = 2/ 3 q = 1/ 3

2 Al me no s tre s pe rso n as

3 E xac tam e n te do s pe rs o n as

3 Si de se i s a s i e te de la tarde s e adm i te que un núme ro de te l éf o no de c ada c i nco


es tá co mun i c an do, ¿c u ál e s la pro babi li dad de que , cuando se marque n 10 núme ro s
de te lé f o no el e gi do s al azar, s ó lo co m uni que n do s ?

B ( 10, 1/ 5) p = 1/ 5q = 4/ 5
4 La pro babil i dad de qu e u n ho m bre aci e rte e n e l bl anco e s 1/ 4. S i di s para 10
ve ce s ¿c u ál e s l a pro babil i dad de que ac i e rte e xac tame nte e n tre s o c asi o nes ? ¿C uál
es l a pro babi l i dad de qu e ac ie rte po r l o m eno s e n una o c asi ó n?

B ( 10, 1/ 4) p = 1/ 4q = 3/ 4

5 E n u n a u rn a h ay 30 bol as , 10 ro jas y e l re s to bl anc as. S e el i ge una bo l a al azar y


se an o ta si e s ro ja; el pro ce s o s e re pi te , de vo l vi endo l a bo l a, 10 ve c es . C al c ul ar l a
me di a y l a de s vi ac ió n tí pi c a

B ( 10, 1/ 3) p = 1/ 3q = 2/ 3

Eje r c i ci o s d e l a d i st r i b uc ió n b i no mi al

1 E n u n as pru e bas de al co h ol em i a s e ha o bse rvado que el 5% de l os c o nduc to re s


co n tro l ado s dan po s i ti vo en la prue ba y que el 10% de lo s c onduc to re s co ntro l ado s
no l le van pue s to el c in tu ró n de se guri dad. Tam bi é n s e ha o bs e rvado que l as do s
in f rac c i o ne s so n in de pe n di e n te s . U n guardi a de tráf i c o para ci nc o co nduc to re s al
azar. Si te ne m os en c u e n ta qu e e l núme ro de c o nduc to re s es suf i ci e ntem e nte
im po rtan te c om o para es ti m ar qu e l a pro po rc ió n de i nf rac to re s no varí a al hac e r l a
se l ec c i ó n

1 De te rmi n ar l a pro babi li dad de que e xac tame nte tre s co nduc to re s hayan co me ti do
al gun a de las dos i nf rac c i o ne s
2 De te rmi n e la pro babi li dad de que al m eno s uno de lo s co nduc to re s co ntro l ado s
h aya co me ti do al gu n a de las do s i nf rac c i o nes

2 U n l abo rato ri o af i rm a que u n a dro ga c aus a ef e c to s s e c undario s e n una pro po rc ió n


de 3 de c ada 100 paci e n te s . Para co ntras ta r es ta af i rm ac ió n, o tro l abo rato ri o el i ge
al azar a 5 pac i e n te s a l os que apl i c a l a dro ga. ¿C uál es l a pro babi l i dad de lo s
si gu i e n te s s u c es o s ?

1 Ni n gú n pac i e n te te n ga e fe c to s se c undari o s

B ( 100, 0. 03) p = 0. 03 q = 0. 97

2 Al me no s do s te n gan ef e c to s s e c undari o s

3 ¿C u ál e s e l n úm e ro me dio de pac ie nte s que e s pe ra labo rato ri o que s uf ran ef e c to s


se c u n dari o s s i el i ge 100 pac i e n te s al azar?
Problemas y ejercicios de la distribución binomial

1 La úl ti m a no ve l a de u n au to r h a te ni do un gran é xi to , has ta el punto de que e l


80% de l os le c to re s ya l a h an le i do . U n grupo de 4 ami go s so n afi c io nado s a l a
le c tu ra:
1 ¿C u ál e s l a pro babil i dad de qu e e n el grupo hayan l ei do l a no ve l a 2 pe rs o nas ?

B ( 4, 0. 2) p = 0. 8 q = 0. 2

2 ¿Y có mo m áxim o 2?

2 U n age n te de se gu ro s ve n de pól i zas a ci nc o pe rs o nas de l a m is m a edad y que


dis f ru tan de bu en a s al u d. S egú n l as tabl as ac tual e s , l a pro babil i dad de que una
pe rs o n a e n e s tas co n di c io n e s vi va 30 año s o más es 2/ 3. H ál l es e la pro babi li dad de
que , tran s c u rri do s 30 añ o s , vi van :

1 Las ci n c o pe rs o n as

B ( 5, 2/ 3) p = 2/ 3 q = 1/ 3

2 Al me no s tre s pe rso n as
3 E xac tam e n te do s pe rs o n as

3 Se lan za u n a mo ne da c u atro ve c e s. C alc ul ar l a pro babil i dad de que s al gan más


c aras que c ru c e s

B ( 4, 0. 5) p = 0. 5q = 0. 5

4 Si de se i s a s i e te de la tarde s e adm i te que un núme ro de te l éf o no de c ada c i nco


es tá co mun i c an do, ¿c u ál e s la pro babi li dad de que , cuando se marque n 10 núme ro s
de te lé f o no el e gi do s al azar, s ó lo co m uni que n do s ?

B ( 10, 1/ 5) p = 1/ 5q = 4/ 5

5 La pro babil i dad de qu e u n ho m bre aci e rte e n e l bl anco e s 1/ 4. S i di s para 10


ve ce s ¿c u ál e s l a pro babil i dad de que ac i e rte e xac tame nte e n tre s o c asi o nes ? ¿C uál
es l a pro babi l i dad de qu e ac ie rte po r l o m eno s e n una o c asi ó n?

B ( 10, 1/ 4) p = 1/ 4q = 3/ 4
6 E n u n as pru e bas de al co h ol em i a s e ha o bse rvado que el 5% de l os c o nduc to re s
co n tro l ado s dan po s i ti vo en la prue ba y que el 10% de lo s c onduc to re s co ntro l ado s
no l le van pue s to el c in tu ró n de se guri dad. Tam bi é n s e ha o bs e rvado que l as do s
in f rac c i o ne s so n in de pe n di e n te s . U n guardi a de tráf i c o para ci nc o co nduc to re s al
azar. Si te ne m os en c u e n ta qu e e l núme ro de c o nduc to re s es suf i ci e ntem e nte
im po rtan te c om o para es ti m ar qu e l a pro po rc ió n de i nf rac to re s no varí a al hac e r l a
se l ec c i ó n

1 De te rmi n ar l a pro babi li dad de que e xac tame nte tre s co nduc to re s hayan co me ti do
al gun a de las dos i nf rac c i o ne s .

2 De te rmi n e la pro babi li dad de que al m eno s uno de lo s co nduc to re s co ntro l ado s
h aya co me ti do al gu n a de las do s i nf rac c i o nes .

7 La pro babi li dad de que u n artí c ul o pro duc i do po r una f abri c a s e a def e c tuo so es p
= 0. 02. S e en vi ó u n c argam e n to de 10. 000 artí c ul o s a uno s al m ace ne s. H al l ar e l
n úm e ro e s pe rado de artí c u lo s def e c tuo so s , la vari anza y l a des vi ac i ó n tí pi c a
8 E n u n a u rn a h ay 30 bol as , 10 ro jas y e l re s to bl anc as. S e el i ge una bo l a al azar y
se an o ta si e s ro ja; el pro ce s o s e re pi te , de vo l vi endo l a bo l a, 10 ve c es . C al c ul ar l a
me di a y l a de s vi ac ió n tí pi c a

B ( 10, 1/ 3) p = 1/ 3q = 2/ 3

9 U n l abo rato ri o af i rm a que u n a dro ga c aus a ef e c to s s e c undario s e n una pro po rc ió n


de 3 de c ada 100 paci e n te s . Para co ntras ta r es ta af i rm ac ió n, o tro l abo rato ri o el i ge
al azar a 5 pac i e n te s a l os que apl i c a l a dro ga. ¿C uál es l a pro babi l i dad de lo s
si gu i e n te s s u c es o s ?

1 Ni n gú n pac i e n te te n ga e fe c to s se c undari o s.

B ( 100, 0. 03) p = 0. 03 q = 0. 97

2 Al me no s do s te n gan ef e c to s s e c undari o s .

3 ¿C u ál e s e l n úm e ro me dio de pac ie nte s que e s pe ra labo rato ri o que s uf ran ef e c to s


se c u n dari o s s i el i ge 100 pac i e n te s al azar?
Distribución normal

Variable aleatoria de la distribución normal

Una variable aleatoria continua, X, sigue una distribución normal de media μ y desviación
típica σ, y se designa por N(μ, σ), si se cumplen las siguientes condiciones:

1. La variable puede tomar cualquier valor: (-∞, +∞)

2. La función de densidad, es la expresión en términos de ecuación matemática de la curva


de Gauss:

Curva de la distribución normal

El campo de existencia es cualquier valor real, es decir, (-∞, +∞).


Es simétrica respecto a la media µ.
Tiene un máximo en la media µ.
Crece hasta la media µ y decrece a partir de ella.
En los puntos µ − σ y µ + σ presenta puntos de inflexión.
El eje de abscisas es una asíntota de la curva.

El área del recinto determinado por la función y el eje de abscisas es igual a la unidad.

Al ser simétrica respecto al eje que pasa por x = µ, deja un área igual a 0.5 a la izquierda y
otra igual a 0.5 a la derecha.
La probabilidad equivale al área encerrada bajo la curva.

p(μ - σ < X ≤ μ + σ) = 0.6826 = 68.26 %

p(μ - 2σ < X ≤ μ + 2σ) = 0.954 = 95.4 %

p(μ - 3σ < X ≤ μ + 3σ) = 0.997 = 99.7 %

Distribución normal estándar

N(0, 1)

La distribución normal estándar, o tipificada o reducida, es aquella que tiene por media el
valor cero, μ = 0, y por desviación típica la unidad, σ =1.

Su función de densidad es:

Su gráfica es:

La probabilidad de la variable X dependerá del área del recinto sombreado en la figura.


Y para calcularla utilizaremos una tabla.

Tipificación de la variable

Para poder utilizar la tabla tenemos que transformar la variable X que sigue una
distribución N(μ, σ) en otra variable Z que siga una distribución N(0, 1).
Empleo de la tabla de la distribución normal

Tabla de la curva normal (0, 1)

La t ab l a n o s da l as p r o b abi l i d ad e s de P(z ≤ k) , s ie ndo z l a vari abl e ti pi fi c ada.

E s tas pro babi l i dade s n os dan l a funci ó n de di str i buci ó n Φ(k) .

Φ ( k) = P (z ≤ k)

Búsqueda en la tabla de valor de k

Uni d ad e s y d é c i mas en l a c o lum na de l a i zqui e rda.

Cé nt e si mas e n l a fi l a de arri ba.

P(Z ≤ a)

P( Z ≤ 1. 47) = 0. 9292

P(Z > a) = 1 - P(Z ≤ a)

P( Z > 1. 47) = 1 − P(Z ≤ 1. 47) = 1 − 0. 9292 = 0. 0708


P(Z ≤ −a) = 1 − P(Z ≤ a)

P( Z ≤ − 1. 47) = 1 − P( Z ≤ 1. 47) = 1 − 0. 9292 = 0. 0708

P(Z > −a) = P(Z ≤ a)

p( Z > − 1. 47) = p(Z ≤ 1. 47) = 0. 9292

P(a < Z ≤ b ) = P(Z ≤ b) − P(Z ≤ a)

P( 0. 45 < Z ≤ 1. 47) = P( Z ≤ 1. 47) − P( Z ≤ 0. 45) =

= 0. 9292 − 0. 6736 = 0. 2556

P(−b < Z ≤ −a ) = P(a < Z ≤ b )


P( − 1. 47 < Z ≤ − 0. 45) = P( 0. 45 < Z ≤ 1. 47) =

= P(Z ≤ 1. 47) − P(Z ≤ 0. 45) = 0. 9292 − 0. 6736 = 0. 2556

P(−a < Z ≤ b ) = P(Z ≤ b) − [ 1 − P(Z ≤ a)]

P( - 1. 47 < Z ≤ 0. 45) = P(Z ≤ 0. 45) − [ 1 − P(Z ≤ 1. 47) ] =

= 0. 6736 − ( 1 − 0. 9292) = 0. 6028

p = K

No s en c o n tram o s c o n e l c as o in ve rs o a l os ante ri o re s , c o no c em o s e l val o r de l a

pro babi l i dad y s e trata de h al l ar el valo r de la abs c i s a. A ho ra te nem o s que bus c ar

e n l a tabl a el val o r q ue más se apr o xi me a K .

p = 0. 75Z ≤ 0. 68

Para c al c u l ar l a vari able X n o s vam o s a l a fó r mul a de l a ti pi fi cació n.

( X - μ) / σ = 0. 68X = μ + 0. 68 σ

Distribución normal y binomial

Aproximación de la binomial por la normal

Teorema de Moivre

S i:

n · p ≥ 5 y n · q ≥ 5.
La di st r i b uc i ó n bi no mi al B( n, p) se pue de apro xim ar me di ante una di str i buci ó n

no r ma l :

Eje mp l o :

E n u n a ci u dad u n a de c ada tre s f am i li as po se e te l éf o no. Si se el i gen al azar 90

f am il i as , c al c u l ar l a pro babi l i dad de que e ntre el l as haya po r l o me nos 30 te ngan

te lé fo n o .

Ejercicios de la distribución normal

1 Si X es u n a vari abl e al e ato ri a de una di s tri buc i ó n N( µ , σ) , hal l ar: p( µ− 3σ ≤ X ≤


µ+ 3σ )
E s de c i r, que apro xi m adam e n te el 99. 74% de lo s val o re s de X e s tán a me no s de
tre s de s vi ac io n e s tí pi c as de l a m e di a.

2 E n u n a di s tri bu c ió n no rm al de m edi a 4 y de s vi ac ió n tí pi c a 2, c al c ul ar e l val o r de


a para que : P( 4− a ≤ x ≤ 4+ a) = 0. 5934

3 E n u n a ci u dad s e e s ti m a qu e la te m pe ratura m áxim a e n e l m es de junio s i gue


u n a di s tri bu c i ó n n o rm al, co n m edi a 23° y de s vi ac ió n tí pi c a 5° . C al c ul ar e l núm e ro
de dí as de l me s e n l o s qu e s e es pe ra al c anzar m áxim as entre 21° y 27°
4 La me di a de lo s pe s os de 500 es tudi ante s de un c ol e gio es 70 kg y l a de s vi ac ió n
tí pi c a 3 kg. S u po n ie n do que lo s pe s o s s e di s tri buye n no rm al me nte , hall ar c uánto s
es tu di an te s pe s an :

E n tre 60 kg y 75 kg

2 M ás de 90 kg

3 Me n o s de 64 kg

4 64 kg
5 64 kg o m en o s

5 Se su po n e qu e l o s re s u l tado s de un e xame n s i gue n una di s tri buc i ó n no rm al c o n


me di a 78 y de s vi ac ió n tí pi c a 36. S e pi de :
1 ¿C u ál e s l a pro babil i dad de qu e una pe rs o na que se pre se nta e l e xame n o bte nga
u n a c al if i c ac ió n s u pe ri o r a 72?

2 C al c u l ar l a pro po rc i ó n de es tu di ante s que ti e nen puntuac i o ne s que e xce de n po r l o


me no s en c i n co pu n to s de la pu n tuac i ó n que marc a l a f ro nte ra e ntre e l A pto y e l
No - Apto ( so n de c l arado s No - Apto s el 25% de l os es tudi ante s que obtuvi e ro n las
pu n tu ac io n e s m ás bajas )

p cl as s = "b">

3 Si se s abe qu e l a c al i fi c ac i ó n de un e s tudi ante e s mayo r que 72 ¿cuál es l a


pro babil i dad de qu e su c ali f i c aci ó n se a, de he c ho , s upe rio r a 84?
6 Tras u n te s t de c u l tu ra ge n e ral s e obs e rva que l as puntuac io ne s o bte ni das si gue n
u n a di s tri bu c i ó n u n a di s tri bu c ió n N( 65, 18) . Se de s e a c l as if i c ar a lo s e xam i nado s
en tre s gru po s ( de baja c ul tu ra gene ral , de c ul tura ge ne ral ac e ptabl e, de e xc el e nte
c ul tu ra gen e ral ) de m odo qu e h ay en el prim e ro un 20% l a po bl ac ió n, un 65% e l
se gu n do y u n 15% en e l te rc e ro . ¿C uál e s han de s e r las puntuac i o ne s que m arc an
el paso de u n gru po al o tro ?

B aja c ul tu ra h as ta 49 pu n to s .

C u l tu ra ac e ptabl e en tre 50 y 83.

E xc e le n te c ul tu ra a parti r de 84 punto s .
7 Vari o s te s t de i n tel i ge n ci a die ro n una puntuac i ó n que s i gue una l e y no rm al c o n
me di a 100 y de s vi ac ió n tí pi c a 15
1 De te rmi n ar e l po rc e n taje de po bl ac i ó n que obte ndrí a un co ef i c ie nte entre 95 y
110

2 ¿Q ué in te rval o c e n trado en 100 co nti e ne al 50% de la po bl ac i ó n?

3 E n u n a po bl ac i ón de 2500 i n di vi duo s ¿cuánto s i ndi vi duo s se es pe ran que te ngan


u n c oe f i ci e n te su pe ri o r a 125?

8 E n u n a ci u dad u n a de c ada tre s f am i li as po se e te l éf o no. Si se el i gen al azar 90


f am il i as , c al c u l ar l a pro babi l i dad de que e ntre el l as haya po r l o me nos 30 te ngan
te lé fo n o
9 E n u n e xam e n ti po te s t de 200 pre guntas de e le c c ió n múl ti ple , c ada pre gunta
ti en e u n a re s pu e s ta c o rre c ta y u na inc o rre c ta. S e aprue ba s i se co nte s ta a m ás de
110 re s pu e s tas co rre c tas . Su po ni e ndo que s e c o nte s ta al azar, c al c ul ar l a
pro babil i dad de apro bar el e xam e n

1 0 U n es tu di o h a m os trado qu e, en un c ie rto barri o , e l 60% de l os ho gare s ti e ne n


al m en o s do s tel e vi so re s Se el i ge al azar una m ue s tra de 50 ho gare s en el ci tado
barri o . S e pi de:
1 ¿C u ál e s l a pro babil i dad de qu e al me no s 20 de lo s c i tado s ho gare s te ngan
c u an do me n os do s te l e vi so re s ?
2 ¿C u ál e s l a pro babil i dad de qu e e ntre 35 y 40 ho gare s te ngan c uando me no s do s
te le vi s o res ?

Distribuciones bidimensionales

Relación funcional

Dos variables x e y están relacionadas funcionalmente cuando conocida la primera se puede


saber con exactitud el valor de la segunda.

Ejemplos

Si se deja caer una piedra, existe una fórmula que nos permite calcular exactamente, la altura a
la que se encuentra en función del tiempo transcurrido.

h = ½ g t².

Relación estadística

Dos variables x e y están relacionadas estadísticamente cuando conocida la primera se puede


estimar aproximadamente el valor de la segunda.

Ejemplo:

Ingresos y gastos de una familia.


Producción y ventas de una fábrica.

Gastos en publicidad y beneficios de una empresa.

Variable estadística bidimensional

Una variable bidimensional es una variable en la que cada individuo está definido por un par
de caracteres, (X, Y).

Estos dos caracteres son a su vez variables estadísticas en las que sí existe relación entre
ellas, una de las dos variables es la variable independiente y la otra variable dependiente.

Distribuciones bidimensionales

Son aquellas en las que a cada individuo le corresponden los valores de dos variables, las
representamos por el par (xi, yi).

Si representamos cada par de valores como las coordenadas de un punto, el conjunto de todos
ellos se llama nube de puntos o diagrama de dispersión.

Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo mejor posible,
llamada recta de regresión.

Ejemplo:

Las notas de 12 alumnos de una clase en Matemáticas y Física son las siguientes:

Matemáticas Física

2 1

3 3

4 2
4 4

5 4

6 4

6 6

7 4

7 6

8 7

10 9

10 10

Covarianza
La covarianza de una variable bidimensional es la media aritmética de los productos de las
desviaciones de cada una de las variables respecto a sus medias respectivas.

La covarianza se representa por sxy o σxy.

La covarianza indica el sentido de la correlación entre las variables

Si σxy > 0 la correlación es directa.

Si σxy < 0 la correlación es inversa.

La covarianza presenta como inconveniente, el hecho de que su valor depende de la escala


elegida para los ejes.

Es decir, la covarianza variará si expresamos la altura en metros o en centímetros. También


variará si el dinero lo expresamos en euros o en dólares.

Ejemplos

Las notas de 12 alumnos de una clase en Matemáticas y Física son las siguientes:

Matemáticas Física

2 1

3 3

4 2

4 4
5 4

6 4

6 6

7 4

7 6

8 7

10 9

10 10

Hallar la covarianza de la distribución.

xi yi xi · yi

2 1 2

3 3 9

4 2 8

4 4 16

5 4 20
6 4 24

6 6 36

7 4 28

7 6 42

8 7 56

10 9 90

10 10 100

72 60 431

Después de tabular los datos hallamos las medias aritméticas:

Los valores de dos variables X e Y se distribuyen según la tabla siguiente:

Y/X 0 2 4

1 2 1 3
2 1 4 2

3 2 5 0

Hallar la covarianza de la distribución.

En primer lugar convertimos la tabla de doble entrada en tabla simple y calculamos las medias
aritméticas.

xi yi fi xi · fi yi · fi xi · yi · fi

0 1 2 0 2 0

0 2 1 0 2 0

0 3 2 0 6 0

2 1 1 2 1 2

2 2 4 8 8 16

2 3 5 10 15 30

4 1 3 12 3 12

4 2 2 8 4 16

20 40 41 76
Correlación

La correlación trata de establecer la relación o dependencia que existe entre las dos variables
que intervienen en una distribución bidimensional.

Es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra.
En caso de que suceda, diremos que las variables están correlacionadas o que
hay correlación entre ellas.

Tipos de correlación

1º Correlación directa

La correlación directa se da cuando al aumentar una de las variables la otra aumenta.

La recta correspondiente a la nube de puntos de la distribución es una recta creciente.

2º Correlación inversa

La correlación inversa se da cuando al aumentar una de las variables la otra disminuye.

La recta correspondiente a la nube de puntos de la distribución es una recta decreciente.


3º Correlación nula

La correlación nula se da cuando no hay dependencia de ningún tipo entre las variables.

En este caso se dice que las variables son incorreladas y la nube de puntos tiene una forma
redondeada.

Grado de correlación

El grado de correlación indica la proximidad que hay entre los puntos de la nube de puntos.
Se pueden dar tres tipos:

1. Correlación fuerte

La correlación será fuerte cuanto más cerca estén los puntos de la recta.
2. Correlación débil

La correlación será débil cuanto más separados estén los puntos de la recta.

3. Correlación nula

Coeficiente de correlación lineal

El coeficiente de correlación lineal es el cociente entre la covarianza y el producto de


las desviaciones típicas de ambas variables.

El coeficiente de correlación lineal se expresa mediante la letra r.


Propiedades

1. El coeficiente de correlación no varía al hacerlo la escala de medición.

Es decir, si expresamos la altura en metros o en centímetros el coeficiente de correlación no


varía.

2. El signo del coeficiente de correlación es el mismo que el de la covarianza.

Si la covarianza es positiva, la correlación es directa.

Si la covarianza es negativa, la correlación es inversa.

Si la covarianza es nula, no existe correlación.

3. El coeficiente de correlación lineal es un número real comprendido entre −1 y 1.

−1 ≤ r ≤ 1

4. Si el coeficiente de correlación lineal toma valores cercanos a −1 la correlación es fuerte


e inversa, y será tanto más fuerte cuanto más se aproxime r a −1.

5. Si el coeficiente de correlación lineal toma valores cercanos a 1 la correlación es fuerte y


directa, y será tanto más fuerte cuanto más se aproxime r a 1.

6. Si el coeficiente de correlación lineal toma valores cercanos a 0, la correlación es débil.

7. Si r = 1 ó −1, los puntos de la nube están sobre la recta creciente o decreciente. Entre ambas
variables hay dependencia funcional.

Ejemplos

Las notas de 12 alumnos de una clase en Matemáticas y Física son las siguientes:

Matemáticas Física

2 1
3 3

4 2

4 4

5 4

6 4

6 6

7 4

7 6

8 7

10 9

10 10

Hallar el coeficiente de correlación de la distribución e interpretarlo.

xi yi xi ·yi xi2 yi2

2 1 2 4 1

3 3 9 9 9
4 2 8 16 4

4 4 16 16 16

5 4 20 25 16

6 4 24 36 16

6 6 36 36 36

7 4 28 49 16

7 6 42 49 36

8 7 56 64 49

10 9 90 100 81

10 10 100 100 100

72 60 431 504 380

1º Hallamos las medias aritméticas.

2º Calculamos la covarianza.
3º Calculamos las desviaciones típicas.

4º Aplicamos la fórmula del coeficiente de correlación lineal.

Al ser el coeficiente de correlación positivo, la correlación es directa.

Como coeficiente de correlación está muy próximo a 1 la correlación es muy fuerte.

Los valores de dos variables X e Y se distribuyen según la tabla siguiente:

Y/X 0 2 4

1 2 1 3

2 1 4 2

3 2 5 0

Determinar el coeficiente de correlación.

Convertimos la tabla de doble entrada en tabla simple.

xi yi fi xi · fi xi2 · fi yi · fi yi2 · fi xi · yi · fi
0 1 2 0 0 2 2 0

0 2 1 0 0 2 4 0

0 3 2 0 0 6 18 0

2 1 1 2 4 1 1 2

2 2 4 8 16 8 16 16

2 3 5 10 20 15 45 30

4 1 3 12 48 3 3 12

4 2 2 8 32 4 8 16

20 40 120 41 97 76

Recta de regresión
La recta de regresión es la que mejor se ajusta a la nube de puntos.

La recta de regresión pasa por el punto llamado centro de gravedad.

Recta de regresión de Y sobre X

La recta de regresión de Y sobre X se utiliza para estimar los valores de la Y a partir de los de
la X.

La pendiente de la recta es el cociente entre la covarianza y la varianza de la variable X.

Recta de regresión de X sobre Y

La recta de regresión de X sobre Y se utiliza para estimar los valores de la X a partir de los de
la Y.

La pendiente de la recta es el cociente entre la covarianza y la varianza de la variable Y.

Si la correlación es nula, r = 0, las rectas de regresión son perpendiculares entre sí, y sus
ecuaciones son:

y=

x=

Ejemplos

Las notas de 12 alumnos de una clase en Matemáticas y Física son las siguientes:
Matemáticas Física

2 1

3 3

4 2

4 4

5 4

6 4

6 6

7 4

7 6

8 7

10 9

10 10

Hallar las rectas de regresión y representarlas.

xi yi xi ·yi xi2 yi2


2 1 2 4 1

3 3 9 9 9

4 2 8 16 4

4 4 16 16 16

5 4 20 25 16

6 4 24 36 16

6 6 36 36 36

7 4 28 49 16

7 6 42 49 36

8 7 56 64 49

10 9 90 100 81

10 10 100 100 100

72 60 431 504 380

1º Hallamos las medias ariméticas.


2º Calculamos la covarianza.

3º Calculamos las varianzas.

4ºRecta de regresión de Y sobre X.

4ºRecta de regresión de X sobre Y.

Ejercicios de regresión y correlación

1 C i n co ni ñ o s de 2, 3, 5, 7 y 8 año s de e dad pe s an, re s pe c ti vam e nte, 14, 20, 32, 42

y 44 ki l os .
1 H al l ar l a e c u ac ió n de l a re c ta de re gre s ió n de l a edad s o bre e l pe so .

2 ¿Cuál sería el peso aproximado de un niño de seis años?

xi yi xi2 yi2 xi · yi

2 14 4 196 28

3 20 9 400 60

5 32 25 1 024 160

7 42 49 1 764 294

8 44 64 1 936 352

25 152 151 5 320 894


2 Un centro comercial sabe en función de la distancia, en kilómetros, a la que se sitúe de un
núcleo de población, acuden los clientes, en cientos, que figuran en la tabla:

Nº de Clientes (X) Distancia (Y)

8 15

7 19

6 25

4 23

2 34

1 40

1 C al c u l ar e l co e fi c ie nt e d e c o r re l aci ó n l i ne al .
2 Si el ce n tro c om e rc i al s e s i tú a a 2 km , ¿c uánto s c l ie nte s pue de es pe rar?
3 Si de s e a rec i bi r a 5 cl ie n te s , ¿a qué di s tanc i a de l núc le o de po bl ac i ó n de be
si tu ars e ?

xi yi x i ·y i xi2 yi2

8 15 120 64 225

7 19 133 49 361

6 25 150 36 625

4 23 92 16 529

2 34 68 4 1 156

1 40 40 1 1 600
28 156 603 170 4 496

Co r re l ac i ó n ne g at i va muy fue r te .

3 Las notas obtenidas por cinco alumnos en Matemáticas y Química son:

Matemáticas Química

6 6.5

4 4.5
8 7

5 5

3.5 4

De te rm i n ar l as r e c t as d e r e g re si ó n y calcular la nota esperada en Química para un


alumno que tiene 7.5 en Matemáticas.

xi yi x i ·y i xi2 yi2

6 6. 5 36 42. 25 39

4 4. 5 16 20. 25 18

8 7 64 49 56

5 5 25 25 25

3. 5 4 1 2. 2 5 16 14

2 6. 5 27 1 5 3. 2 5 152. 5 152
4 U n co n ju n to de dato s bi di me ns i onal e s ( X , Y) ti e ne co e fi cie nte de
c o rr e l ac ió n r = − 0. 9, s ie n do l as me di as de las di s tri buc io ne s m argi nale s =
1, = 2. Se s abe que u n a de l as c uatro e c uac io ne s s i gui e nte s co rre s po nde a

l a re c t a d e r e g re si ó n de Y s o bre X :

y = -x + 2 3x - y = 1 2x + y = 4 y = x + 1

S el e cc i o n ar razo n adame n te e s ta re c ta.

C om o e l c o e fi c i e nt e d e c or r e l aci ó n li ne al e s negati vo , l a pe ndie nte de

l a re c t a tam bié n se rá ne g at i va , po r tanto de s c artam o s l a 2ª y 4ª.

U n pu n to de la re c ta h a de s e r ( , ) , es de c i r, ( 1, 2) .

2 ≠ - 1 + 2

2 . 1 + 2 = 4

La re c ta pe di da es : 2x + y = 4 .

5 Las estaturas y pesos de 10 jugadores de baloncesto de un equipo son:

Estatura (X) Pesos (Y)

186 85

189 85

190 86
192 90

193 87

193 91

198 93

201 103

203 100

205 101

C al c ul ar:

1 La r e c t a de re g r e si ó n de Y so bre X.
2 El co e fi c ie nt e d e c o r re l ac i ó n .
3 El pe so es ti m ado de u n ju gado r que m i de 208 c m.

xi yi xi2 yi2 x i ·y i

186 85 34 596 7 225 15 810

189 85 35 721 7 225 16 065

190 86 36 100 7 396 16 340

192 90 36 864 8 100 17 280

193 87 37 249 7 569 16 791

193 91 37 249 8 281 17563


198 93 39 204 8 649 18 414

201 103 40 401 1 0 6 09 20 703

203 100 41 209 1 0 0 00 20 300

205 101 42 025 1 0 2 01 20 705

1 950 921 380 618 8 5 2 55 179 971

C o rre l aci ó n po s i ti va m u y f u e rte .

6 A parti r de lo s s i gu ie n te s dato s ref e re nte s a ho ras trabajadas en un tall e r

( X ), y a u ni dade s pro du ci das ( Y) , de te rm i nar l a r e cta de re gr e si ó n de Y so bre


X , e l c o e fi c i e nt e d e c or r e l aci ó n li ne al e interpretarlo.
Horas (X) Producción (Y)

80 300

79 302

83 315

84 330

78 300

60 250

82 300

85 340

79 315

84 330

80 310

62 240

xi yi xi ·yi xi2 yi2

80 300 6 400 90 000 24 000

79 302 6 241 91 204 23 858


83 315 6 889 99 225 26 145

84 330 7 056 108 900 27 720

78 300 6 084 90 000 23 400

60 250 3 600 62 500 15 000

82 300 6 724 90 000 24 600

85 340 7 225 115 600 28 900

79 315 6 241 99 225 24 885

84 330 7 056 108 900 27 720

80 310 6 400 96 100 24 800

62 240 3 844 57 600 14 880

936 3 632 73 760 1 109 254 285 908


Co r re l ac i ó n po si t i va muy fue r te

7 Se ha solicitado a un grupo de 50 individuos información sobre el número de horas que

dedican diariamente a dormir y ver la televisión. La clasificación de las respuestas ha permitido


elaborar la siente tabla:

Nº de horas dormidas (X) 6 7 8 9 10

Nº de horas de televisión (Y) 4 3 3 2 1

Frecuencias absolutas (fi) 3 16 20 10 1

S e pi de :

1 C al c u l ar e l co e fi c ie nt e d e c o r re l aci ó n .
2 De te rmi n ar l a ec u ac i ón de l a re cta de r e gre si ó n de Y s o bre X .
3 Si una persona duerme ocho horas y media, ¿cuánto cabe esperar que vea la televisión?

xi yi fi xi · fi xi2 · fi yi · fi yi2 · fi xi · yi · fi

6 4 3 18 108 12 48 72

7 3 16 112 784 48 144 336

8 3 20 160 1280 60 180 480

9 2 10 90 810 20 40 180

10 1 1 10 100 1 1 10

50 390 3082 141 413 1078


E s u n a c o rr e l ac ió n ne g at i va y fue r te .

8 La tabla siguiente nos da las notas del test de aptitud (X) dadas a seis dependientes a prueba y

ventas del primer mes de prueba (Y) en cientos de euros.

X 25 42 33 54 29 36

Y 42 72 50 90 45 48

1 H al l ar e l co e fi c ie nt e d e c o r re l aci ó n e inte rpre tar e l re s ul tado obte ni do.


2 C al c u l ar l a r e c t a de re g r e si ó n de Y so bre X. Pre de ci r las ve ntas de un
ve n de do r qu e o bte n ga 47 en e l te s t.

xi yi xi ·yi xi2 yi2

25 42 625 1 764 1 050

42 72 1 764 5 184 3 024

33 50 1 089 2 500 1 650

54 90 2 916 8 100 4 860


29 45 841 2 025 1 305

36 48 1 296 2 304 1 728

209 347 8 531 21 877 13 617

Ejercicios de correlación y regresión

1 Una compañía desea hacer predicciones del valor anual de sus ventas totales en cierto país a partir

de la relación de éstas y la renta nacional. Para investigar la relación cuenta con los siguientes datos:

X Y

189 402
190 404

208 412

227 425

239 429

252 436

257 440

274 447

293 458

308 469

316 469

X re pre se n ta l a re n ta n ac io n al e n mi ll o ne s de e uro s e Y re pre s e nta l as ve ntas de l a

c om pañ í a en mi le s de e u ro s e n el pe ri o do que va de s de 1990 has ta 2000 ( am bo s

i n cl u s i ve ). C al cu l ar:

1 La r e c t a de re g r e si ó n de Y so bre X.
2 El co e fi c ie nt e d e c o r re l ac i ó n l i ne al e inte rpre tarl o .
3 Si en 2001 l a re n ta n ac io n al de l paí s f ue de 325 mi ll o ne s de e uros . ¿C uál s e rá l a
pre di cc i ó n para las ve n tas de l a co m pañí a e n e s te año ?

xi yi xi ·yi xi2 yi2

189 402 35 721 1 6 1 604 75 978

190 404 36 100 1 6 3 216 76 760


208 412 43 264 1 6 9 744 85 696

227 425 51 529 1 8 0 625 96 475

239 429 57 121 1 8 4 041 102 531

252 436 63 504 1 9 0 096 109 872

257 440 66 049 1 9 3 600 113 080

274 447 75 076 1 9 9 809 122 478

293 458 85 849 2 0 9 764 134 194

308 469 94 864 2 1 9 961 144 452

316 469 99 856 2 1 9 961 148 204

2 753 4 791 708 933 2 092 421 1 209 720


2 La información estadística obtenida de una muestra de tamaño 12 sobre la relación existente

entre la inversión realizada y el rendimiento obtenido en cientos de miles de euros para


explotaciones agrícolas, se muestra en el siguiente cuadro:

Inversión (X) Rendimiento (Y)

11 2

14 3

16 5

15 6

16 5

18 3

20 7

21 10

14 6

20 10

19 5

11 6
C al c ul ar:

1 La r e c t a de re g r e si ó n de l re ndim i e nto re s pe c to de l a i nve rs ió n.


2 La previsión de inversión que se obtendrá con un rendimiento de 1 250 000 €.

xi yi xi ·yi xi2 yi2

11 2 121 4 22

14 3 196 9 42

16 5 256 25 80

15 6 225 36 90

16 5 256 25 80

18 3 324 9 54

20 7 400 49 140

21 10 441 100 210

14 6 196 36 84

20 10 400 100 200

19 5 361 25 95

11 6 121 36 66

195 68 3 297 454 1 1 63


3 El número de horas dedicadas al estudio de una asignatura y la calificación obtenida en el
examen correspondiente, de ocho personas es:

Horas (X) Calificación (Y)

20 6.5

16 6

34 8.5

23 7

27 9

32 9.5

18 7.5

22 8

S e pi de :
1 Re c ta de re gre s i ó n de Y so bre X.
2 Calificación estimada para una persona que hubiese estudiado 28 horas.

xi yi x i ·y i xi2 yi2

16 6 256 36 96

18 7. 5 324 56.25 1 35

20 6. 5 400 42.25 1 30

22 8 484 64 1 76

23 7 529 49 1 61

27 9 729 81 2 43

32 9. 5 1 024 90.25 3 04

34 8. 5 1156 72.25 2 89

192 62 4 902 491 1 534


4 En la tabla siguiente se indica la edad (en años) y la conducta agresiva (medida en una escala

de cero a 10) de 10 niños.

Edad Conducta Agresiva

6 9

6 6

6.7 7

7 8

7.4 7

7.9 4

8 2

8.2 3

8.5 3

8.9 1

1 O bte ne r l a re c t a d e r e g re si ó n de l a co nduc ta agre s i va en f unc i ó n de la


edad.
2 A partir de dicha recta, obtener el valor de la conducta agresiva que correspondería a un niño
de 7.2 años.

xi yi xi ·yi xi2 yi2

6 9 36 81 54

6. 4 6 40.96 36 3 8. 4
6. 7 7 44.89 49 4 6. 9

7 8 49 64 56

7. 4 7 54.76 49 5 1. 8

7. 9 4 62.41 16 3 1. 6

8 2 64 4 16

8. 2 3 67.24 9 2 4. 6

8. 5 2 72.25 4 17

8. 9 1 79.21 1 8. 9

75 49 570.72 313 3 4 5. 2

5 Los valores de dos variables X e Y se distribuyen según la tabla siguiente:

Y/X 100 50 25
14 1 1 0

18 2 3 0

22 0 1 2

S e pi de :

1 C al c u l ar l a c o var i anz a .
2 O bte ne r e in te rpre tar e l c oe f i ci e nte de co r r el aci ó n li ne al .
3 E c u aci ó n de la re c t a d e r e g re si ó n de Y s o bre X .

Convertimos la tabla de doble entrada en una tabla simple.

xi yi fi xi · fi xi2 · fi yi · fi yi2 · fi xi · yi · fi

100 14 1 100 10 000 14 196 1 400

100 18 2 200 20 000 36 648 3 600

50 14 1 50 2 500 14 196 700

50 18 3 150 7 500 54 972 2 700

50 22 1 50 2 500 22 484 1 100

25 22 2 50 1 250 44 968 1 100

10 600 43 750 184 3 464 10 600


E s u n a c o rr e l ac ió n ne g at i va dé bil .

6 Las puntuaciones obtenidas por un grupo de alumnos en una batería de test que mide la

habilidad verbal (X) y el razonamiento abstracto (Y) son las siguientes:

22>Y/X 22>20 22>30 22>40 22>50

22>(25-35) 6 4 0 0

22>(35-45) 3 6 1 0

22>(45-55) 0 2 5 3

22>(55-65) 0 1 2 7

S e pi de :

1 ¿E xi s te c o rr e l ac ió n e n tre am bas vari abl e s ?


2 Se gú n l o s dato s de l a tabl a, si uno de e s to s al um no s obti e ne una puntuac i ón
de 70 pu n to s en razo n am ie n to abs trac to , ¿e n cuánto s e e s tim ará s u habi li dad
ve rbal ?
Convertimos la tabla de doble entrada en tabla simple.

xi yi fi xi · fi xi2 · fi yi · fi yi2 · fi xi · yi · fi

20 30 6 120 2 400 180 5 400 3 600

20 40 3 60 1 200 120 4 800 2 400

30 30 4 120 3 600 120 3 600 3 600

30 40 6 180 5 400 240 9 600 7 200

30 50 2 60 1 800 100 5 000 3 000

30 60 1 30 900 60 3 600 1 800

40 40 1 40 1 600 40 1 600 1 600

40 50 5 200 8 000 250 12 500 10 000

40 60 2 80 3 200 120 7 200 4 800

50 50 3 150 7 500 150 7 500 7 500

50 60 7 350 17 500 420 25 200 21 000

40 1 390 53 100 1 080 86 000 66 500


7 S e s abe qu e en tre e l c o n su m o de pape l y el núme ro de l i tro s de agua po r

m e tro cu adrado qu e se re co ge n en una c i udad no e xi s te re l aci ó n.


1 ¿C u ál e s e l val o r de l a c o var i anz a de es tas vari abl e s ?
2 ¿C u án to val e el co ef i c ie n te de co r r el aci ó n li ne al ?
3 ¿Q ué ec u ac i on e s tie n e n l as do s re ctas de re gr e si ó n y c uál e s su po si c i ón
en el pl ano ?

1 ¿C u ál e s e l val o r de l a c o var i anz a de es tas vari abl e s ?

= 0

2 ¿C u án to val e el c o e fi c i e nt e d e cor r e l aci ó n li ne al ?

r = 0

3 ¿Q ué ec u ac i on e s tie n e n l as do s re ctas de re gr e si ó n y c uál e s su po si c i ón e n e l

pl an o ?

= k1 , = k2 k1, k2 .

Las re c tas s o n paral e l as a l os e je s y pe rpe ndi c ul are s e ntre s í.

8 En una empresa de transportes trabajan cuatro conductores. Los años de antigüedad de

permisos de conducir y el número de infracciones cometidas en el último año por cada uno de
ellos son los siguientes:
Años (X) 3 4 5 6

Infracciones (Y) 4 3 2 1

C al c ul ar el c o e fi c i e nt e d e c or r e l aci ó n li ne al e interpretarlo.

xi yi x i ·y i xi2 yi2

3 4 12 9 16

4 3 12 16 9

5 2 10 25 4

6 1 6 36 1

18 10 40 86 30

La co r r el ac i ó n e s pe r fe c t a e i nve r sa .
9 Una persona rellena semanalmente una quiniela y un boleto de lotería primitiva anotando el

número de aciertos que tiene. Durante las cuatro semanas del mes de febrero, los aciertos
fueron:

Quiniela (X) 6 8 6 8

Primitiva (Y) 1 2 2 1

O bte n e r el co e fi c ie nt e d e c o r re l aci ó n l i ne al e interpretarlo. ¿Ofrecerían confianza


las previsiones hechas con las rectas de regresión?

xi yi xi ·yi xi2 yi2

6 1 6 36 1

8 2 16 64 4

6 2 12 36 4

8 1 8 64 1

28 6 42 200 10
No e xi s te co r r el ac i ó n en tre am bas vari abl e s, po r tanto l as e s tim ac i o ne s he c has
c o n l as re c t as d e re g r e si ó n no o fre ce ni nguna co nfi anz a .

You might also like