Métodos Estadísticos para La Ingeniería Ambiental y La Ciencia - Dr. Héctor Adolfo Quevedo Urias

UNIVERSIDAD AUTÓNOMA DE CD.
JUÁREZ
INSTITUTO DE INGENIERÍA Y TECNOLOGÍA
DEPARTAMENTO DE INGENIERÍA CIVIL Y AMBIENTAL
MÉTODOS ESTADÍSTICOS PARA LA

INGENIERÍA AMBIENTAL Y LA CIENCIA
DR. HÉCTOR ADOLFO QUEVEDO URIAS
AGOSTO DE 2006
Copyright © 2006. Métodos Estadísticos para la Ingeniería Ambiental y la Ciencia.
Héctor Adolfo Quevedo Urías
Es propiedad del autor. Queda hecho el depósito que marca la ley.
Advertencia
Prohibida la reproducción de este libro, además de los esquemas e ideas originales del
autor que se hallan en este texto, ya sea por medios electrónicos, mecánicos,
fotocopiado o de cualquier otra forma, puesto que todo esto pertenece al dominio de
la propiedad intelectual y está protegido por la ley.
Para revisores, críticos o reseñadores literarios, a quienes se les asigne la tarea de

hacer revisiones literarias de esta obra, lo pueden hacer, previo acuerdo con el autor.
Impreso en Cd. Juárez, Chihuahua, México
Library of Congress Cataloging in Publication Data

Héctor Adolfo Quevedo Urías
Este libro fue publicado en el Internet en Enero de 2006 por la Biblioteca Virtual de la
Universidad Autónoma de Cd. Juárez.
La dirección electrónica del libro es:
http://bivir.uacj.mx/LibrosElectronicosLibres/UACJ/ua00001.pdf
Estadísticos e-Books & Papers

CONTENIDO
Página
Introducción i
Capítulo 1 Estadística Descriptiva 1-1
Definición de estadística.- Población y muestra.- Estadística inductiva y de inferencia.-

Estadística descriptiva.- Variables continuas y discretas.- Medidas de tendencia central.-
Medidas de dispersión.- La variable aleatoria estandarizada z.- Las desviaciones del
promedio.- El rango.- Sesgo y kurtosis.- Distribuciones de frecuencia.- Diagramas de tallo y
hoja.
Capítulo 2 Probabilidad 2-1
Probabilidad de frecuencia relativa.- Probabilidad subjetiva.- Axiomas y propiedades

básicas de la probabilidad.- Diagramas de Venn y álgebra de conjuntos.- Técnicas de
conteo: Regla de producto para pares ordenados, la regla de multiplicación más general,
regla factorial, diagramas de árbol, permutaciones y combinaciones.- Regla multiplicativa
para eventos dependientes e independientes.- Regla aditiva para eventos mutuos
excluyentes y eventos no mutuos excluyentes.-
Capítulo 3 Distribución Binomial e Hipergeométrica 3-1
Aplicaciones generales de la distribución binomial.- Relación entre la distribución normal

y la distribución binomial.- Relación entre la distribución binomial y la distribución de
Poisson.- La distribución hipergeométrica.- Suposiciones y propiedades de la distribución
hipergeométrica.-
Capítulo 4 Distribución de Poisson 4-1
Aplicaciones de la distribución de Poisson.- Condiciones que se requieren para aplicar la

distribución de Poisson.- Funciones probabilísticas de la función de Poisson.- Aplicación
de la distribución de Poisson dentro de sus propios términos y como una aproximación a
la distribución binomial.- Propiedades de la distribución de Poisson.- Problemas de la
distribución de Poisson usando el programa Minitab.
Capítulo 5 Distribuciones de Probabilidad Continua 5-1
Función de densidad de probabilidad de la variable aleatoria continua X.- Fórmula

fundamental del cálculo.- Distribución normal y sus características.- Relación entre la curva
normal y la binomial.- Áreas bajo la curva normal.- Distribución exponencial.- Distribución
Gamma.- Distribución Weibull.- Intervalos de confianza para µ.- Estadística de inferencia:

teoría de decisión estadística y pruebas de hipótesis.- Pruebas de hipótesis estadísticas.
Hipótesis nula (Ho:) e hipótesis alternativas (H1:, H2:, H3:).- Tipos de errores I (alfa) y II
(beta).- Pruebas de hipótesis no tradicionales usando el valor de la probabilidad p.- Pruebas
de hipótesis para uno y dos promedios poblacionales (µ1, y µ2).- Pruebas de hipótesis para
las diferencias de dos promedios poblacionales (µ1 – µ2), para muestras grandes (n ≥ 30)
usando la distribución normal, con varianzas conocidas e iguales (σ21 = σ22).- Intervalos de
confianza para dos promedios poblacionales.- Pruebas de hipótesis e intervalos de confianza
para proporciones.-
Capítulo 6 Distribuciones de t de Estudiante, JI Cuadrada y F 6-1
Propiedades de la distribución de t de Estudiante.- Intervalos de confianza para el promedio

poblacional µ.- Prueba de hipótesis para µ.- Prueba de t pareada para detectar diferencias
entre dos tratamientos.- Prueba de t para probar la hipótesis de dos promedios, cuando las
varianzas son iguales.- Prueba de t para probar la hipótesis de dos promedios cuando las
varianzas son desiguales.- Mecanismos para calcular el valor de p cuando se hacen pruebas
de hipótesis no tradicionales.- Intervalos de confianza y pruebas de hipótesis con la JI
cuadrada, (χ2).- Aplicación de la JI cuadrada en cuanto a la prueba de bondad de ajuste
comparando las frecuencias observadas y las frecuencias teóricas.- Distribución F y su
aplicación en la comparación de varianzas muestrales.-
Capítulo 7 Análisis de Varianza 7-1
Diseños de análisis de varianza completamente aleatorizados y diseño de bloques

aleatorizados.- Método de comparaciones múltiples para saber cuales poblaciones son
iguales y cuales son desiguales.- Análisis de varianza de diseño de bloques
aleatorizados.- Suposiciones del modelo de bloques aleatorios completos.- Análisis de
varianza en dos sentidos.- Interacción con ANOVA de dos factores.- Análisis de varianza
en tres sentidos: diseño completamente aleatorio.- Interacción con ANOVA de diseños
factoriales de tres clasificaciones.- Ejemplos de ANOVA usando el programa Minitab.-
Capítulo 8 Regresión Lineal Simple y Múltiple 8-1
Suposiciones del modelo de regresión lineal.- Ecuaciones normales para calcular el

intercepto en la ordenada a y la pendiente b de la curva o línea de regresión.- Coeficiente de
determinación R2 de la muestra que estima a ρ2 el coeficiente de determinación
poblacional.- Coeficiente de correlación R de la muestra que estima a ρ, el coeficiente de
correlación poblacional.- Intervalo de confianza para el coeficiente poblacional β
componente de la línea de regresión µY|X = α + βX, estimado por b, la pendiente de la
línea.- Intervalo de confianza para el parámetro poblacional α, el intercepto de la
ordenada de la línea de regresión µY|X = α + βX, cuyo estimador es a.- Hipótesis nula de
Ho:β = βo contra las hipótesis alternativas de H1:β < 1 y H2:β > 1.- Hipótesis nula de Ho:α
= αo contra las hipótesis alternativas de H1:α ≠ αo, H2:α > αo, y de H3: α < αo.- Intervalo
de confianza para µY|X de la línea poblacional estimada por Y.- Regresión y correlación

múltiple.- Métodos para validar el modelo de regresión lineal simple y múltiple: a través de
estadística de inferencias y a través del análisis gráfico de los residuales estandarizados.
Procedimiento de regresión múltiple usando el programa Minitab.-
Capítulo 9 Regresión Polinomial 9-1
Modelos polinomiales de segundo orden (k = 2) con una variable independiente.- Modelo de

polinomios de tercer orden (k = 3), con una variable independiente.- Modelo de segundo
orden (cuadrático) con interacción.- Modelo polinomial (de segundo orden o cuadrático),
con tres variables independientes con interacción.- Evaluación de los modelos de
regresión.- Prueba estadística para comparar la suma de los cuadrados del error (SSe) de
cada modelo probado, para saber cual modelo es superior.- Modelos de regresión no lineales
y de regresión logística.- Modelos de regresión exponenciales paramétricos, con una sola
variable independiente.- Procedimientos para la Identificación de valores atípicos extremos.
Diagnóstico y mitigación de multicolinealidad.- Medidas para corregir multicolinealidad
severa.- Ejemplos de problemas de regresión polinomial usando el programa de
computadora Minitab.- Autocorrelación en datos de series de tiempo.- Heteroscedasticidad y
homoscedasticidad.- Prueba de White para el problema de heteroscedasticidad.-
Capítulo 10 Estadística no Paramétrica. El modelo de Distribución

de ANOVA Libre 10-1
Ventajas de los métodos no paramétricos.- Desventajas de los métodos no paramétricos.-

Prueba de H de Kruskal-Wallis para análisis de varianza por rangos.- Pruebas de hipótesis
con las funciones no paramétricas.- Procedimientos de pruebas de Kruskal-Wallis para
ANOVA simple.- Pruebas de hipótesis no tradicionales, para la prueba de Kruskal-Wallis,
es decir, usando el valor de la probabilidad p.-
Capítulo 11 Series de Tiempo 11-1
Clasificación de los movimientos de las series de tiempo.- Tendencias a largo plazo.-

Componentes cíclicos de series de tiempo.- Variaciones estacionales.- Variación irregular.-
Métodos para encontrar líneas de tendencia.- Línea de los cuadrados mínimos y parábolas
de los cuadrados mínimos.-
Capítulo 12 Selección del Tamaño de la Muestra 12-1
Derivación de la fórmula para estimar el tamaño más apropiado de la muestra para el

promedio.- Selección del tamaño de la muestra para dos poblaciones.-
Apéndices
Apéndice A Lista de Tablas Estadísticas Apéndice-A

Apéndice B Bibliografía Apéndice-B
Apéndice C Papel de gráfica Apéndice-C
Apéndice D Índice Apéndice-D

Introducción
La estadística y los métodos probabilísticos o estocásticos juegan un papel muy
importante en todas las fases del comportamiento humano. El uso de la probabilidad y
de la estadística se ha extendido, no tan solo a las áreas tradicionales universitarias o
escolásticas, sino también a todos los campos de la ingeniería, la agricultura, la
biología, la química, las comunicaciones, la economía, la electrónica, la medicina, la
física, las ciencias políticas, la psicología, la sociología, las encuestas políticas, la
mercadotecnia, la ecología, la meteorología, y así sucesivamente.
Este texto de probabilidad y de estadística, está diseñado para cursos de
postgrado de la Ingeniería Ambiental y la Ciencia. Este libro es una compilación de
más de 25 libros de referencias bibliográficas de probabilidad y de estadística
orientados, no tan solo a la ingeniería ambiental, sino también a la ingeniería en
general, la economía, la química, la física, la agricultura, la medicina, etc. Este texto
consta de más de 700 páginas que incluyen conceptos teóricos, muchos ejemplos
prácticos y muchos ejercicios. El autor de este texto, sin intenciones de ufanarse,
incluye un diseño de una fórmula (que no aparece en los libros de estadística) para
interpolar, manualmente, valores y estimar la probabilidad p.
En verdad, el propósito de este texto es el de ayudar al lector a entender los
conceptos, ideas y funciones de la probabilidad y de la estadística aplicados a
problemas de la ingeniería ambiental y a la ciencia. Este texto deberá ser también útil
para aquellos estudiosos quienes deseen hacer aplicaciones de la probabilidad y de la
estadística a problemas de la ingeniería en términos generales, así como también a la
investigación.
Cada capítulo se inicia con definiciones pertinentes y claras, teoremas y
i

principios, con material abundante de gráficas, de materiales descriptivos y de
muchos ejemplos y ejercicios.
Por ejemplo, el Capítulo 1 da la introducción a la estadística clásica. Este
capítulo da una clara distinción entre lo que es una población y una muestra. Este
capítulo habla, además, de estadística descriptiva y de distribuciones de frecuencia.
Más adelante, el Capítulo 2 habla de la teoría de probabilidad y todo lo relacionado
con la probabilidad clásica. Después, los Capítulos 3 y 4 hablan de las distribuciones
discretas, como la binomial, la hipergeométrica y la Poisson. Aquí se incluye el
concepto de la lógica deductiva, la cual es un concepto de difícil entendimiento. El
Capítulo 5 describe las funciones continuas de probabilidad, especialmente la
distribución normal, además, de las distribuciones Weibul, exponencial, Gamma, etc.
El Capítulo 6 habla de la teoría de muestreo pequeño como la t de Estudiante, JI
cuadrada y la distribución F. En este renglón, en las pruebas de hipótesis, para el
control de calidad, se habla de la lógica inductiva, que es un concepto de difícil
entendimiento y discutido en poquísimos libros de estadística. Además, el Capítulo 7
está relacionado con diseños de análisis de varianza completamente aleatorizados y
diseños de bloques aleatorizados. Este capítulo también discute modelos factoriales
de dos y tres clasificaciones. El Capítulo 8 está relacionado con regresión lineal
simple y múltiple. El Capítulo 9 está relacionado con regresión polinomial, el cual
incluye modelos polinomiales de segundo y tercer orden, con una variable
independiente y con más de dos variables regresivas. Este capítulo habla también de
modelos de regresión no lineales de regresión logística y de modelos exponenciales
paramétricos, con una sola variable independiente. Más adelante, el Capítulo 10 habla
de pruebas no paramétricas. Otrosí, el Capítulo 11 habla de las series de tiempo.
Finalmente, el Capítulo 12 habla de métodos para seleccionar el tamaño de muestra
ii

más apropiado.
Este texto, además, incluye varios apéndices con tablas de las distribuciones
binomiales, de Poisson, normal, de t de Estudiante, de F, de JI cuadrada, etc.
Igualmente, este texto incluye una serie de referencias bibliográficas. Finalmente, este
libro de estadística incluye una sección que contiene más de 340 ejercicios
relacionados con cada capítulo y ejemplos usando el programa de computadora
Minitab y Excel. En este contexto, este texto de estadística da muchos ejemplos de
problemas usando el paquete de computadora Minitab, es decir, describiendo el uso
del Minitab con minuciosidad de detalles; situaciones presentadas por muy pocos
libros de estadística.
Para concluir, debo decir que este es un texto de estadística diseñado para los
estudiantes de ingeniería ambiental de posgrado y de la ciencia en general. Es decir,
para aquellos investigadores quienes deseen encontrar, prácticamente, todos los
conceptos de la probabilidad y de la estadística, que les pueda ayudar en el desarrollo
de su profesión de ingeniería, en la investigación o en cualquier otra área de la
ciencia en general.
iii

Dr. Héctor Quevedo Urías
CAPITULO 1
Estadística Descriptiva
Definición de estadística.- Población y muestra.- Estadística inductiva y de

inferencia.- Estadística descriptiva.- Variables continuas y discretas.- Medidas
de tendencia central.- Medidas de dispersión.- La variable aleatoria
estandarizada z.- Las desviaciones del promedio.- El rango.- Sesgo y kurtosis.-
Distribuciones de frecuencia.- Diagramas de tallo y hoja.
Estadística es el estudio de los métodos para coleccionar, resumir, organizar,

presentar y analizar información de datos. El término estadística también se refiere a
la derivación de conclusiones válidas y a la formación de decisiones razonables, en
base a semejantes análisis. En la colección de datos de un grupo de observaciones, a
menudo es imposible o impráctico observar toda la población. De manera qué, en
lugar de examinar el grupo en su totalidad, llamado la población o universo, es
conveniente examinar solamente una parte de la población llamada muestra.
Población se refiere a un grupo de ítems que tienen una característica en
común. Una población puede ser definida como un grupo de individuos, como por
ejemplo, una persona, un animal, un objeto o una medición. Además, una población
puede ser finita o infinita. Por ejemplo, la población consistente de todos los tornillos
producidos en una fábrica, en un día, es finita. En contraste, la población consistente
de todos los posibles resultados (caras o águilas) de los lanzamientos sucesivos de una
moneda es infinita. A menudo la población no existe pero, sin embargo, es de
importancia. Por ejemplo, al estudiar un nuevo colorante para telas de algodón
podemos probar el nuevo colorante, con solamente 10 piezas de un metro del material
1-1
y hacer mediciones de la resistencia del colorante. La muestra consiste de 10 piezas

de algodón tratadas con el colorante. La población consiste de todas las piezas de
algodón posibles de un cierto tipo que pudieran ser tratadas con el nuevo colorante.
Esta población no existe. Sin embargo, la población total nos la podemos imaginar al
estudiar las 10 piezas de algodón con el objeto de hacer inferencias.
En el caso de una muestra, esto se refiere a una estadística y es un estimador de
un parámetro de población. Por ejemplo, si X denota el promedio aritmético
estadístico de una muestra, entonces, X es el estimador del parámetro µ de todo el
conjunto o población. Sin embargo, en contraste como se dijo antes, es impráctico o
imposible observar toda la población, por esta razón se examina una pequeña parte
del grupo o población llamada muestra estadística. Aquí, es conveniente introducir
términos tales como muestra aleatoria o al azar, muestreo, estadística inductiva o de
inferencia y estadística descriptiva. También es muy crítico distinguir entre los
términos parámetros (donde se usan símbolos griegos) versus estadísticas. Los
parámetros se refieren a poblaciones infinitas o finitas. Sin embargo, las estadísticas
ser refieren a una muestra. Por ejemplo, si una muestra es representativa de una
población se pueden sacar conclusiones importantes acerca de esta población. Sin
embargo, es importante notar que la muestra debe ser aleatoria, porque de otra
manera, la inferencia acerca de la población será inválida.
Con respecto a la estadística inductiva y a la estadística de inferencia, éstas se
refieren al proceso de inferir conclusiones acerca de una población basándose en un
muestreo aleatorio (al azar), de tal manera que la probabilidad de tener una inferencia
correcta puede ser determinada de acuerdo con varias hipótesis concerniendo la
población bajo estudio. Dicho en otras palabras, debido a que semejante inferencia no
puede ser absolutamente cierta, el lenguaje de probabilidad es, a menudo usado en la
1-2
presentación de los resultados o conclusiones.

En contraste, la fase de estadística que busca únicamente describir y analizar
datos de una distribución continua (como la normal), sin sacar ninguna conclusión o
inferencia acerca de la población o universo, se denomina estadística descriptiva.
Aquí se incluyen términos como colección de datos sin procesar, formación de datos
en orden descendiente o ascendente (cuya diferencia entre el mayor y menos se
denomina rango), distribuciones de frecuencia, que es un término para describir el
arreglo relativo de un conjunto de elementos de los valores de una variable y de las
frecuencia de ocurrencia de cada valor (la más importante llamada curva normal y t
de estudiante). Otros términos usados en estadística descriptiva son promedios
aritméticos, promedios geométricos, promedios armónicos, medianas, modas,
percentiles, desviaciones estándar, varianzas, etc., pero, sin sacar inferencias del
grupo que provienen.
Sin embargo, con relación a la estadística descriptiva y la estadística de
inferencia, en el caso de la estadística descriptiva, este tipo de estadística incluye la
presentación de conjuntos de observaciones, de tal manera que puedan ser
comprendidas e interpretadas y sirven para resumir o describir datos. En cambio, la
estadística de inferencia se relaciona con estimaciones de magnitudes de poblaciones
y pruebas de acerca de las características de la población. Ambas son útiles para
determinar cual entre dos a más cursos de acción se siguen cuando el curso correcto
es determinado por una característica particular o desconocida de la población.
En el campo de la ingeniería (como en la ingeniería ambiental) y ciencias
experimentales el uso de la estadística es requerido en el diseño de plantas de aguas
residuales e industriales, en el diseño de chimeneas industriales, en el diseño del
equipo de control de la contaminación, en pruebas de rutina de laboratorio, en
1-3
trabajos de investigación y en la producción de calidad y construcción. Por ejemplo,

en el laboratorio si el muestreo es preciso o si la variabilidad de nuestros resultados es
mayor de lo esperado, entonces hay que corregir la variación refinando las técnicas de
laboratorio o incrementando el tamaño de la muestra.
En el campo de la investigación tal vez estemos interesados en saber si un
cambio es un ingrediente que afecta las propiedades del material resultante, para
comparar la eficiencia de procesos o de máquinas probadoras; para determinar si los
resultados obtenidos encajan en una forma postulada o sospechada. Otra aplicación
muy importante es el control de la calidad en la ingeniería industrial.
Con relación a las variables continuas y discretas, en este caso se dice que una
variable aleatoria es una función que asigna un valor numérico a cada evento simple
en un espacio de la muestra. Así, una variable aleatoria continua puede asumir una
figura innumerable y, teóricamente, puede asumir cualquier valor entre dos valores
dados. Por ejemplo las alturas de una persona pueden ser 62.0 pulgadas, 63.8
Pulgadas, 65.8456 Pulgadas, etc. En contraste, una variable es discreta si puede
asumir, solamente, un número contable de posibles valores.
Medidas de tendencia central o de localización: el promedio, la mediana y la

moda. Símbolos usados en las sumatorias de estadística:
n
El símbolo Σ Xj se usa para denotar la suma de todas las
j=1
Xjs, desde j = 1 hasta j = N.
n
Ejemplo #1. Σ Xj = X1 + X2 + X3 + ... + Xn
j=1
1-4
n
Ejemplo #2. Σ XjYj = X1Y1 + X2Y2 + X3Y3 + ...+ XNYn
j=1
n
Ejemplo #3. Σ aXj = aX1 + aX2 +...+ aXn
j=1
n
= a(X1 + X2 +,..,+ Xn) = a Σ Xj
j=1
Nótese la diferencia entre ΣX 2 y (ΣX)2
La suma de los cuadrados (SS), es decir, la suma de las desviaciones al cuadrado de X

de su promedio X se denota como:
kn
La suma total de los cuadrados = Σ (Xi - X )2 = SS (1-1)
i=1
= ΣX 2 - (ΣX)2/n
El promedio aritmético
El promedio aritmético es un valor el cual es típico o representativo de un conjunto de
datos de distribuciones continuas. Existen diferentes tipos de promedios. Los más
comunes son el promedio aritmético, la mediana, la moda, el promedio geométrico, el
promedio harmónico, etc. Cada uno tiene sus ventajas y desventajas dependiendo de
los datos y el propósito a seguir. El promedio aritmético no se debe usar como
sinónimo de promedio o media, porque hay otros tipos de promedios.
El promedio aritmético es un valor que representa un conjunto de datos; es una
medición de tendencia central. El promedio aritmético es el estimador del parámetro
1-5
de población, µ y se define como:
X = (X1 + X2 + X3 +...+ Xn) / n = ΣXj / n = ΣX/n (1-2)
Si los números X1, X2, X3,…,Xk ocurren f1, f2,…,fk veces, es decir, con datos
agrupados, entonces:
X = fXi / n (1-3)
Con las distribuciones continuas, es de notarse qué, el promedio aritmético, X

es un estimador de µ, es decir, del parámetro de población. En muy raras ocasiones se
conoce µ (toda la población), siendo así, entonces, se calcula directamente.
Ejemplo #4. El promedio de una muestra de observaciones de ciertos análisis de

aguas, cuyos valores son 8, 3, 5, 12, 10, es:
X = (8 + 3 + 5 + 12 + 10)/5 = 38/5 = 7.6
Ejemplo #5. Calcular X , de una muestra de 5, 8, 6, y 2 casos que ocurren con una
frecuencia de de 3, 2, 4, y 1.
X = [(3)(5) + (2)(8) + (4)(6) + (1)(2)]/(3+2+4+1) = 5.7
La mediana
~
La mediana, X es el valor de en medio de un grupo de números u observaciones
(puestas en forma ascendente) o el promedio aritmético de los dos valores de en
medio. Geométricamente hablando, la mediana es el valor de X (abscisa)
correspondiente a esa línea vertical que divide a un histograma en dos partes teniendo
áreas iguales. La mediana es una posición de promedio, mientras que el promedio
aritmético es un promedio calculado.
1-6
Ejemplo # 6. La muestra de observaciones 3, 4, 4, 5, 6, 8, 8, 10 tiene una mediana de

~
X = (5+6)/2 = 5.5.
Ejemplo #7. La muestra de observaciones 5, 5, 7, 9, 11, 12, 13, 15, 18 tiene una
~
mediana de X = 11.
La moda
La moda es una estadística que demuestra el valor que ocurre con más frecuencia en
una muestra (poniendo los datos en forma ascendente). Una distribución puede tener
una moda, puede ser bimodal, etc. Este valor se denota por X̂ . Sin embargo, algunas
ocasiones la moda no existe.
Ejemplo #8. La muestra de observaciones 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 18 tiene
una moda de X̂ = 9, es decir, el valor que ocurre con más frecuencia.
Ejemplo #9. Los valores 3, 5, 8, 10, 12, 15, 16 no tienen moda.
Ejemplo #10. La muestra de observaciones 2 ,3, 4, 4, 4, 5, 5, 7, 7, 7, 9 tiene dos
modas, 4 y 7 y es bimodal, es decir, X̂ = 2.
1-7
Relación entre el promedio aritmético, la mediana y la moda

Si el promedio, la mediana y la moda coinciden, entonces la distribución es simétrica;
de otra manera, la distribución es asimétrica con sesgo a la derecha o la izquierda. Ver
figuras de abajo.
Figura 1.0. Distribución oblicua Figura 1.1. Distribución oblicua

a la derecha (sesgo positivo). a la izquierda (sesgo negativo)
(Elaboración propia) (Elaboración propia)
Ejemplo #11. Encontrar el promedio aritmético, la mediana y la moda para una

muestra de análisis de aire de Pb cuyos valores son: 3, 5, 2, 6, 5, 9, 5, 2, 8, 6 partes
por millón (ppm).
Solución:
X = 5.1 ppm
~
X = (5+5)/2 = 5
X̂ = número que ocurre con más frecuencia = 5
Ejemplo #12. Encontrar el promedio, la mediana y la moda de los casos 48.7, 48.8,
1-8
49.5, 50.3, 51.6.

Solución:
~
X = 49.8, X = 49.5, X̂ = no existe
El promedio geométrico
El promedio geométrico se usa como un disfraz de transformación logarítmica. Es útil
para promediar tasas de crecimiento (aumento o decremento) de una muestra
estadística. La fórmula es:
G= n
x x x ... x
1 2 3 n
(1-4)
Ejemplo #13. Encontrar el promedio geométrico de los valores 3, 5, 6, 6, 7, 10, 12

Solución:
G = 7 (3)(5)(6)(6)(7)(10)(12) = 7 453,600
log G = 1/7 log(453,000) = 0.8081 y antilog 0.8031 = 6.43
Existen otros promedios como el promedio harmónico, el promedio cuadrático,
etc. También hay otras medidas de localización más finas que dividen los datos en
más de dos partes. Por ejemplo, los cuartiles dividen el conjunto de datos en cuatro
partes iguales. Por ejemplo, el tercer cuartil (Q3) describe la cuarta parte superior del
conjunto de datos. El segundo cuartil (Q2) es idéntico a la mediana. El primer cuartil
(Q1) separa la cuarta parte inferior de las tres cuartas partes superiores. Además, los
percentiles pueden dividir los datos en 100 partes iguales. Por ejemplo, el 99avo
percentil separa el 1% más alto del 99% restante, etc.
Otra forma de ver la simetría de los datos es usando diagramas de caja.
También hay lo que se llama diagramas de punto, que ayudan, visualmente, a revisar
la simetría de los datos.
1-9
La varianza
La varianza, s2 es una medida de dispersión y nos dice, qué tanta variación existe de
una observación a otra (o del promedio) o de una muestra a otra. Una s2 grande tiene
más casos diversificados, que una con una varianza pequeña. La varianza s2 de una
muestra estadística (o de varias muestras) es el estimador del parámetro de la
varianza, σ2 de una población o poblaciones. La fórmula de la varianza es:
n
s2 = Σ (X - X )2/(n-1) = [ΣX 2 – (ΣX)2/n]/(n - 1) (1-5)
i=1
= SS/(n – 1)
Ejemplo #14. Calcular la varianza y la desviación estándar de la muestra 2, 4, 6.

Solución:
Calculando X = 4 y usando el método largo nos da:
s2 = [(2 - 4)2 + (4 - 4)2 + (6 - 4)2]/(3 - 1)
= 8/2 = 4
Usando el método corto:
Varianza = s2 = [ΣX2 – (ΣX)2/n]/(n – 1) nos daría:
s2 = [ΣX2 –(ΣX)2/n]/(n – 1)
= (56 – 48)/2
=4
La desviación estándar
La desviación estándar, s es una forma especial de la desviación promedio de la
media. Es una medida de dispersión. A medida que aumenta la desviación estándar o
la varianza, mayor diversidad habrá entre las observaciones de una muestra. Esta
1-10
estadística se da como:
s = √ [ΣX 2 – (ΣX)2/n] / (n – 1) (1-5a)
Para datos agrupados, la desviación estándar es:
s = √ [fj ΣX 2 – (ΣX)2/n] / (n – 1) (1-5b)
Ejemplo #15. Para el ejemplo de arriba, calcular la desviación estándar.
Solución:
Si la varianza, s2 = 4, por lo tanto, la desviación estándar, s es:
s = s2 = 4 = 2
Ejemplo #16. Encontrar X , s, s2, la mediana, el error estándar del promedio, el sesgo
y la kurtosis de una muestra al azar de 36 análisis de fosfatos (PO4-3), en mg/L. ¿Qué
tanta fidelidad hay en los datos? La tabla de abajo da la información.
__________________________________________________________________
Valores de X | 61 64 67 70 73 69 68 70
Frecuencia | 5 8 4 5 5 4 3 2
Solución:
Usando un paquete de computadora da: X = 67.27, s = 3.78, s2 = 14.31, mediana =
68, sesgo = -0.22 y kurtosis = -0.95. Al juzgar por los resultados, hay una buena
aproximación a la distribución normal, puesto que X y la mediana son parecidos.
Además el valor del sesgo no difiere mucho de 0. Se le pide al lector usar la fórmula
(15-b) para corroborar los resultados computarizados obtenidos.
Propiedades de la desviación estándar

Para una distribución normal el 68.27% de todas las observaciones están incluidas
entre ( X - s) y ( X + s), esto es, una desviación estándar a cualquier lado del
promedio. Similarmente, el 95.45% de todos los casos se incluyen entre ( X - 2s) y
1-11
( X + 2s), esto es entre z = ±2. Además, en el 99.73% de todos los casos se incluyen
entre ( X - 3s) y ( X + 3s), esto es, entre z = ±3.
Figura 1.2. Distribución normal mostrando las áreas para diferentes percentiles de la
variable estandarizada z (Spiegel, 1961).
Variable aleatoria estandarizada z
Esta variable aleatoria estandarizada z mide las desviaciones del promedio en
unidades de desviación estándar y se da como:
z = (X - X ) / s. (1-6)
Su parámetro respectivo es:
Z = (X - µ)/σ (1-7)
Ejemplo #16. Calcular las siguientes probabilidades:
(a) P(z ≤ 1.25)
(b) P(z > 1.25)
(c) P(z ≤ -1.25)
(d) P(-.38 ≤ z ≤ 1.25)
Solución:
(a) Para esto, buscamos en la tabla de la distribución normal del renglón marcado con
1-12
1.2 y la columna .05 y da .8944; por lo cual, P(X ≤ 1.25) = .8944.

(b) P(z > 1.25) = 1 – P(z ≤ 1.25) = 1 - .8944 = .1056
c) P(z ≤ -1.25) = .1056. Por simetría de la curva normal, es la misma respuesta que en
el inciso (b)
(d) P(-.38 ≤ z ≤ 1.25) = (área de -∞ a z = 1.25) – (área de -∞ a z = -.38) = .8944 -
.3520 = .5424 (de la tabla de z)
Otra manera de ver lo mismo es usando anotación de probabilidades:
P(-.38 ≤ z ≤ 1.25) = P(z ≤ 1.25) – P(z ≤ -.38)
= .8944 - .3520 = .5424
Las desviaciones del promedio
Las desviaciones del promedio son otras medidas de dispersión. Matemáticamente....
n
Desviación del promedio = Σ |Xj - X |/N (1-8)
j=1
Ejemplo #17. Encontrar la desviación promedio de los valores 2, 3, 6, 8, 11.

Solución:
El promedio aritmético es X = 6
La desviación promedio = (|2-6|+|3-6|+|6-6|+|8-6|+|11-6|)/5
= 2.8
El rango
El rango de las observaciones de una muestra es la diferencia entre el número más
grande y el más pequeño. Aquí, es de notarse qué, entre más grande sea la diferencia,
más dispersión habrá, es decir, la varianza y la desviación estándar serán más grandes.
Ejemplo #18. Encontrar el rango de 2, 3, 3, 5, 5, 5, 8, 10, 12.

Solución:
1-13
El número más pequeño es el 2 y el más grande es el 12, esto es, 12 - 2 = 10

Nota: Existen otras funciones de dispersión como la dispersión relativa y absoluta o el
coeficiente de variación, etc.
Sesgo y kurtosis
El sesgo de una distribución mide el grado de la simetría. Si la curva de frecuencia de
una distribución tiene un extremo más largo a la derecha del máximo central que el de
la izquierda, la distribución es oblicua hacia la derecha o con sesgo positivo. Lo
contrario es correcto y se dice que es oblicua hacia la izquierda o de sesgo negativo.
Esta condición se denomina el primer coeficiente de sesgo de Pearson. El sesgo de la
distribución normal es igual a 0.
Ya se explicó que, la relación entre el promedio, la mediana y la moda pueden
dar una indicación del grado de simetría de los datos de una distribución. Por ejemplo,
si el promedio es mayor que la mediana, mayor que la moda, entonces, la distribución
es asimétrica con sesgo positivo hacia la derecha. De otra manera, la distribución
tiene sesgo negativo hacia la izquierda.
La kurtosis de una distribución mide lo puntiagudo de una distribución normal.
Una distribución que tiene una cima o pico relativamente alta se llama leptokúrtica,
mientras que aquélla que está achatada se llama platykúrtica. La curva normal que no
está picuda ni achatada se llama mesokúrtica. La kurtosis de la curva normal es igual
a 3.
Error estándar
Además de reportar el valor de una estimación puntual, también debe indicarse su
precisión. La medida de precisión usual es el error estándar del estimador usado. Por
ejemplo, los errores estándares de algunas distribuciones de la muestra son los del
promedio, de proporciones, de desviaciones estándar y de medianas.
1-14
Así, de esta manera, los errores estándares del promedio, de las proporciones o
la mediana es, respectivamente:
σX = σ √ N (1-9)
σp = pq/N (1-9a)
σs = σ 2N (para poblaciones normales) (1-9b)
Π
σmed.= σ (para n ≥ 30) (1-9c)
2N
Términos importantes
Parámetros. Se refieren a valores poblacionales. Se usan los símbolos griegos para
denotarlos.
Estadística. Se refiere a una muestra tomada de una población. Es un estimador de los
parámetros de población.
Promedio aritmético. Si se conoce toda la población se usa la variable µ. Si se refiere
a una muestra estadística, se usa la variable X . De cualquier manera el promedio
aritmético es la sumatoria de un grupo de observaciones dividido entre el total de los
casos.
Promedio. En general un promedio se refiere a una medida de tendencia central.
Ejemplos son el promedio aritmético, la mediana y la moda. Hay también promedios
geométricos, armónicos, etc.
Mediana. Es el valor del ítem central cuando los datos son agrupados por tamaño
~
( X ).
Moda. Es el valor que ocurre con más frecuencia ( X̂ ).
Distribución bimodal. Se refiere a una distribución con dos modas.
1-15
Medidas de dispersión. Se refiere al grado de dispersión de los datos numéricos del

promedio. Los más comunes son: el rango, la desviación estándar, la variancia, la
desviación promedio, desviación de cuartiles, etc.
Varianza. Es una medida de dispersión. Se denota como σ2 para describir toda la
población. Sin embargo, si se refiere a la varianza de la muestra, se usa el símbolo s2 y
se describe como la suma de los cuadrados dividida entre el número de valores de la
muestra menos uno. Se usa el símbolo s2 que es el estimador del parámetro
poblacional σ2.
Desviación estándar. Se obtiene sacando la raíz cuadrada de la varianza poblacional o
de la varianza de la muestra.
Coeficiente de variación. Es la relación matemática de la desviación estándar divida
entre el promedio aritmético. Generalmente se expresa como porcentaje. Es útil para
comparar distribuciones donde las unidades puedan ser diferentes.
Variables discretas. Variables discretas se refieren a características tales como color,
sexo, religión, etc., que se pueden expresar en clasificaciones o categorías cualitativas.
Por ejemplo, el número n de una familia de niños asume valores de 0, 1, 2, 3,..., pero
que no puede asumir valores de 2.5 o de 3.856.
Variables continuas.- Se refiere a variables que, teóricamente, pueden asumir
cualquier valor entre dos valores dados. Se pueden expresar en clasificaciones o
categorías cuantitativas. Por ejemplo, la altura h de un individuo, la cual puede ser
63.9 pulgadas, 65.9945 pulgadas, es una variable continua.
Sesgo. Mide la simetría de una distribución. El sesgo puede ser positivo (oblicuo
hacia la derecha) o negativo (oblicuo hacia la izquierda). Si es sesgo es positivo,
~
entonces X > X > X̂ . Sin embargo, si el sesgo es negativo, entonces, es el reverso.
La kurtosis mide lo achatado o puntiagudo de la distribución.
1-16
Variable estandarizada. Mide la desviación del promedio en unidades de desviación

estándar, simplemente, se refiere al número de desviaciones estándar de una
observación que está abajo o arriba del promedio de la distribución.
Métodos gráficos y tabulares usados en estadística descriptiva
Otras técnicas visuales, que son muy útiles en la probabilidad y la estadística de
inferencia, son el uso de desplegados de tallo y hojas. Otros más son los diagramas de
punto (explicados posteriormente) y los histogramas. Por ejemplo, para construir un
diagrama de tallo y hoja, esta situación se explica en el tópico de diagramas de tallo y
hoja. Los diagramas de tallo y hoja son parecidos a los histogramas y sirven el mismo
propósito. Esto es, porque los diagramas de tallo y hoja revelan el rango de los datos,
muestran donde ocurre la concentración más alta de valores, proveen información
acerca de la presencia o ausencia de simetría y, pueden indicar el grado de simetría en
la cual los datos son homogéneos.
Distribuciones de frecuencia
Cuando se están procesando grandes cantidades de datos es conveniente distribuirlos
dentro de clases o categorías, para determinar el número de observaciones que
pertenecen a cada clase llamada frecuencia de clase. Así, un arreglo tabular de datos
por clases junto con las frecuencias de clases correspondientes se llama distribuciones
de frecuencia o tablas de frecuencias.
Definición de términos
Órdenes.- Un orden es un arreglo de datos numéricos sin procesar en orden de
magnitud ascendente o descendente.
Intervalo de clase.- Es un arreglo que define una clase digamos de 60-62 la cual se
llama intervalo de clase. Los números terminales 60 y 62 se llaman límites de clases o
límites de clase inferior y superior. El intervalo 60-62 incluye, teóricamente, las
1-17
mediciones 59.5-62.5 y se llaman límites de clases. Estos se obtienen sumando el

límite superior de un intervalo con el límite inferior del siguiente intervalo de clase y
dividiendo entre 2.
Clases de punto intermedio o marcas de clases.- Las clases de punto intermedio o
marcas de clases son el punto medio de un intervalo de clase que se obtiene sumando
los límites superiores e inferiores y dividiendo entre dos. Por ejemplo, el punto medio
del intervalo 60-62 es (60 + 62)/2 = 61 y, así sucesivamente.
Tamaños de intervalos de clase. El tamaño de un intervalo de clase es la diferencia
entre los límites o linderos superiores e inferiores.
Reglas para hacer distribuciones de frecuencia
1. Determinar los números más pequeños y más grandes de los datos sin procesar.
2. Dividir el rango en un número conveniente de intervalos de clases que tengan el
mismo tamaño. Si esto no es posible, usar intervalos de clase de diferentes tamaños.
3. Determinar el número de observaciones que caen dentro de cada uno de estos
intervalos de clases.
4. Los límites de clases no deben de coincidir con los datos reales. La fórmula para
calcular el tamaño de clase de una distribución de frecuencia es:
i = (h - l) / k (1-10)
Donde:
i = el tamaño del intervalo de clase
h = el valor del ítem más alto
l = el valor del ítem más bajo
k = número de clases
Tipos de curvas de frecuencia
1. Curva de frecuencia simétrica o en forma de campana. Un ejemplo importante es
1-18
la curva normal.
2. Curva asimétrica u oblicua cuyos extremos de la curva están al lado derecho o al
izquierdo del máximo central.
3. Curva de frecuencia en forma de J.
4. Curva de frecuencia en forma de U.
5. Curva de frecuencia bimodal que tiene dos máximos.
6. La curva de frecuencia multimodal que tiene más de dos máximos.
Figura 1.3 Gráficas mostrando los tipos de curvas de frecuencia (Spiegel, 1961).
Histogramas y polígonos de frecuencia
1-19
La forma más común de representación gráfica de una distribución de frecuencia es el

histograma. Estos histogramas consisten en rectángulos adyacentes, las alturas de los
cuales representan las frecuencias de clases, mientras que sus bases se extienden entre
sucesivas fronteras de clases. Esto quiere decir que tienen bases sobre la abscisa con
centros en las marcas de clases y con las longitudes igual a los intervalos de clases.
Por otro lado, los polígonos de frecuencia son gráficas de líneas de frecuencias
de clases que se grafican contra las clases de marcas. Se obtienen conectando los
puntos medios de arriba de los rectángulos en los histogramas.
Figura 1.4. En los histogramas y polígonos de frecuencia se acostumbra a sumar las

extensiones pq y rs para la siguiente marca de clase más baja y más alta que tienen la
correspondiente clase de frecuencia de cero. En tales casos, la suma de las áreas de
los rectángulos es igual al área total circundada por el polígono de frecuencia y el eje
de las equis. (Elaboración propia)
Distribuciones de frecuencia relativa
La frecuencia relativa de un intervalo de clase es la frecuencia de la clase dividida
entre la frecuencia total de todas las clases y se expresa como porcentaje.
1-20
Ejemplo #20. Hacer una tabla de distribución con intervalos de clase y la frecuencia
relativa para las alturas de 100 estudiantes de una universidad.
TABLA 1.0. Alturas de los estudiantes. (Spiegel, 1961).
___________________________________________________________________
Distribución de las alturas Frecuencia relativa
por intervalos de clase de estudiantes (%)
___________________________________________________________________
60 - 62 pulgadas 5%
63 - 65 18 %
66 - 68 42 %
69 - 71 27 %
72 - 74 8%
_________________________________________________________
Total 100 %
Distribuciones de frecuencias acumuladas y distribuciones de frecuencias

relativas acumuladas
Aquí se discutirán las distribuciones de frecuencias acumuladas y la frecuencia
relativa acumulada que se obtiene dividiendo la frecuencia acumulada por la
frecuencia total.
Ejemplo #21. Tabular los valores de la tabla de frecuencia de 500 observaciones
formando una tabla con los intervalos de clase más apropiados, con la frecuencia, la
frecuencia relativa (%), la frecuencia acumulada y la frecuencia relativa acumulada.
Usar papel de probabilidad y encontrar el promedio aritmético y la desviación
estándar. Confirmarlos gráficamente y calcularlos.
1-21
TABLA 1.1. Frecuencias de 500 observaciones de fosfatos (mg/L). (Elaboración

propia).
_____________________________________________________________
X f X f X f X f
_____________________________________________________________
20 1 - - - - - -
21 0 36 7 51 20 66 6
22 0 37 9 52 19 67 5
23 1 38 10 53 19 68 4
24 1 39 11 54 18 70 3
25 1 40 12 55 18 70 3
26 1 41 13 56 17 71 2
27 1 42 14 57 16 72 2
28 2 43 16 58 14 73 1
29 2 44 17 59 13 74 1
30 3 45 18 60 12 75 1
31 3 46 18 61 11 76 1
32 4 47 19 62 10 77 1
33 5 48 19 63 9 78 0
34 6 49 20 64 7 79 0
35 6 50 20 65 6 80 1
__________________________________________________________________
1-22
TABLA 1.2. Tabla de frecuencias de 500 casos de fosfatos. (Elaboración propia)

_________________________________________________________________
Intervalo de clase f f. r.(%) f. a. f. r. a. (%)
________________________________________________________________
< 30.5 13 2.6 13 2.6
30.5-35.5 24 4.8 37 7.4
35.5-40.5 49 9.8 86 17.2
40.5-45.5 78 15.6 164 32.8
45.5-50.5 96 19.2 260 52.0
50.5-55.5 94 18.8 354 70.8
55.5-60.5 72 14.4 426 85.2
60.5-65.5 43 8.6 469 93.8
65.5-70.5 21 4.2 490 98.0
> 70.5 10 2.0 500 100.0
_______________________________________________________________
Total 500
1-23
Figura 1.5. Papel de probabilidad mostrando las 500 observaciones de fosfatos

relacionadas con la TABLA 1.2. (Elaboración propia)
Analizando la Figura 1.5, se puede ver qué, para calcular el promedio µ localizamos
.50 en la ordenada y por interpolación calculamos el valor de 50. Igualmente, para
calcular la desviación estándar σ, nos movemos a .84 y por interpolación calculamos
el valor de 10, que está entre 50 y 60.
Ejemplo #22. Para los siguientes 40 datos de análisis de agua de concentraciones de
calcio, en mg/L, contestar las siguientes preguntas:
(a) Construir una tabla de frecuencias con intervalos de 5 y estimar el punto
intermedio o marca de clase.
(b) Construir otra tabla más con intervalos de tamaño 9 y estimar el punto intermedio
1-24
o marca de clase.
(c) Para ambos casos construir un histograma y un polígono de frecuencia y también,
en función de frecuencia relativa.
(d) Para ambos casos, construir una gráfica de frecuencia acumulada y frecuencia
relativa acumulada.
(e) Usar papel de probabilidad para estimar el promedio aritmético y la desviación
estándar. Comparar estos resultados con el cálculo del promedio y la desviación
estándar usando las fórmulas estadísticas.
TABLA 1.3. Tabla mostrando las concentraciones de calcio de 40 análisis de agua.
(Elaboración propia)
138 164 150 132 133 125 149 157

146 158 140 147 136 148 152 144
168 126 138 176 163 119 154 165
146 173 142 147 135 153 140 135
161 145 135 142 150 156 145 128
Solución:
El rango es de 176 - 119 = 57 mg/L
Si se usan intervalos de clase de tamaño 5, los intervalos de clase son 57/5 = 12,
aproximadamente. Sin embargo, si se usan intervalos de clase de tamaño 9, los
intervalos de clase son 57/9 = 6, aproximadamente. Las tablas de abajo muestran estas
estimaciones.
1-25
TABLA 1.4. Tabla de frecuencias de las concentraciones de Calcio (Ca) usando un

intervalo de tamaño 5. (Elaboración propia)
_________________________________________________________________
Intervalo de clase Marca de clase f f.a. f.r. f.r.a.
_________________________________________________________________
118 - 122 120 1 1 2.5% 2.5%
123 - 127 125 2 3 5.0% 7.5%
128 - 132 130 2 5 5.0% 12.5%
133 - 137 135 4 9 10.0% 22.5%
138 - 142 140 6 15 15.0% 37.5%
143 - 147 145 8 23 20.0% 57.5%
148 - 152 150 5 28 12.5% 70.0%
153 - 157 155 4 32 10.0% 80.0%
158 - 162 160 2 34 5.0% 85.0%
163 - 167 165 3 37 7.5% 92.5%
168 - 172 170 1 38 2.5% 95.0%
173 - 177 175 2 40 5.0% 100.0%
__________________________________________________________________
Total 40
TABLA 1.5. Tabla de frecuencias de las concentraciones de Ca usando un intervalo

de tamaño 9. (Elaboración propia)
_________________________________________________________________
Intervalo de clase Punto intermedio f f.a. f.r. f.r.a.
_________________________________________________________________
118 - 126 122 3 3 7.5% 7.5%
127 - 135 131 5 8 12.5% 20.0%
136 - 144 140 9 17 22.5% 42.5%
145 - 153 149 12 29 30.0% 72.5%
154 - 162 158 5 34 12.5% 85.0%
163 - 171 167 4 38 10.0% 95.0%
172 - 180 176 2 40 5.0% 100.0%
__________________________________________________________________
Total 40
Los incisos (c), (d) y (e) se reservan para que el estudiante los haga.
1-26
También se puede calcular el promedio aritmético de una distribución de

frecuencia, cuando se dan los intervalos de clase y las frecuencias. La fórmula para
tales casos es:
X = ΣfX / Σf = ΣfX / nΣ (1-11)
Ejemplo #22. Se dan los siguientes datos de temperaturas ambientales en grados
Fahrenheit (oF) en la tabla de abajo.
TABLA 1.6. Tabla mostrando los datos. (Elaboración propia)

Temperaturas (oF) Marca de clase (X) f fX
60 – 62 61 5 5 x 61 = 305
63 – 65 64 18 64 x 18 = 1152
66 – 68 67 42 67 x 42 = 2814
69 – 71 70 27 70 x 27 = 1890
72 – 74 73 8 73 x 8 = 584
N = Σf = 100 ΣfX = 6745
Por lo tanto, X = ΣfX / Σf = ΣfX / N = 6745 / 100 = 67.45 oF
Diagramas de tallo y hoja usando el programa Minitab
Ejemplo # 23. Para ilustrar la construcción de una gráfica de tallo y hoja,

considérese la tabla de abajo, la cual muestra las mediciones de 40 observaciones.
TABLA 1.7. Tabla mostrando las mediciones de 40 objetos. (Elaboración propia).

2.2 4.1 3.5 4.5 3.2 3.7 3.0 2.6
3.4 1.6 3.1 3.3 3.8 3.1 4.7 3.7
2.5 4.3 3.4 3.6 2.9 3.3 3.9 3.1
3.3 3.1 3.7 4.4 3.2 4.1 1.9 3.4
4.7 3.8 3.2 2.6 3.9 3.0 4.2 3.5
_____________________________________________________________
Procedimiento:
Para formar el diagrama de tallo y hoja, se separa cada observación en dos partes
1-27
consistentes de un tallo y una hoja. Siendo así, el tallo representa el dígito que
precede al punto decimal y, la hoja, corresponde al dígito a la derecha del punto
decimal. Por ejemplo, con el número 3.7, el dígito 3 representa el tallo y el dígito 7
representa la hoja. De acuerdo a los datos de la TABLA 1.8 hay cuatro tallos, es
decir, 1, 2, 3, 4. Una vez hecho esto, se identifican los números a la derecha del
punto decimal correspondientes a cada tallo. Por ejemplo, para el tallo 1 hay dos
hojas, 6 y 9; para el tallo 2 hay 5 hojas, es decir, 2, 5, 6, 9 y 5, etc. La TABLA 1.8
de abajo representa la gráfica de tallo y hojas para este problema.
No obstante, para poder construir la TABLA 1.8 se puede usar el Minitab de
acuerdo a las siguientes indicaciones:
Graph → Stem-and-leaf
En el recuadro que aparece poner las variables de la columna C1 en la ventanilla de
“Stem-and-leaf” y en la ventanilla de “Increments” poner 1. Esto produce los datos
de la TABLA 1.8 mostrada abajo.
TABLA 1.8. Tabla mostrando los resultados de tallo y hoja correspondientes a las
observaciones de la TABLA 1.7.
__________________________________________________________________
Stem-and-Leaf Display: Mediciones de 40 objetos
Stem-and-leaf of Mediciones de 40 objetos N = 40

Leaf Unit = 0.10
Frecuencia Tallos Hojas
2 1 69
7 2 25669
(25) 3 0011112223334445567778899
8 4 11234577
__________________________________________________________________
1-28
Sin embargo, los resultados de la TABLA 1.8 no dan un panorama adecuado de la

distribución de los datos. Para remediar esta situación se necesita aumentar el
número de tallos en la gráfica. Una manera simple de hacerlo es doblando cada
tallo. Para esto, nuevamente introducir los datos como se hizo anteriormente y en la
ventanilla de “Increments” poner .5. Esto produce la tabla de abajo.
TABLA 1.9. Tabla mostrando los tallos dobles y de hojas.
Stem-and-Leaf Display: Mediciones de 40 objetos
Stem-and-leaf of Mediciones de 40 objetos N = 40

Leaf Unit = 0.10
Frecuencia Tallos Hojas

2 1 69
3 2* 2
7 2 5669
(15) 3* 001111222333444
18 3 5567778899
8 4* 11234
3 4 577
__________________________________________________________________
Las tablas de las distribuciones de tallo y hoja se pueden usar para estimar los
intervalos de clase cuando se hacen distribuciones de frecuencia. El procedimiento
es como sigue:
1. Primero se saca el rango de los datos. Por ejemplo, de la TABLA 1.7 el valor
máximo es 4.7 y el valor mínimo es 1.6, o sea: rango = 4.7 – 1.6 = 3.1.
2. Enseguida se estima el ancho del intervalo dividiendo el rango entre el número
de tallos (7 en este caso), es decir, 3.1 / 7 = .4.
3. Ahora, para estimar el primer intervalo de clase empezamos con 1.5 y le
1-29
sumamos .4 para dar 1.9. El siguiente intervalo de clase es 2.0 más .4 para dar 2.4.
El siguiente intervalo de clase es 2.5 más .4 para dar 2.9 y así sucesivamente, como
se muestra en la TABLA 1.10 de abajo.
TABLA 1.10. Tabla mostrando los intervalos de clase, el punto medio, la
frecuencia, la frecuencia relativa y la frecuencia relativa acumulada.
Intervalo de Punto Frecuencia Frecuencia Frecuencia relativa
clase medio (f) relativa (f.r.) acumulada (f.r.a.)
1.5 – 1.9 1.7 2 0.050 0.050
2.0 – 2.4 2.2 1 0.025 0.075
2.5 – 2.9 2.7 4 0.100 0.175
3.0 – 3.4 3.2 15 0.375 0.550
3.5 – 3.9 3.7 10 0.250 0.800
4.0 – 4.4 4.2 5 0.125 0.925
4.5 – 4.9 4.7 3 0.075 1.000
Por otro lado, con los datos de la TABLA 1.10 se pueden hacer histogramas
de frecuencia relativa, con curvas normales sobrepuestas y curvas de frecuencia
relativa acumulada para calcular medidas de localización como cuartiles o
percentiles. Por ejemplo, los cuartiles dividen el conjunto de datos en cuatro partes
iguales. Siendo así, el primer cuartil o .25 fractil (Q1) separa la cuarta parte inferior
de las tres cuartas partes superiores, esto es, el 25% de las mediciones de abajo. El
segundo cuartil o .50 fractil (Q2) es idéntico a la mediana o sea que la mitad de las
observaciones están debajo de este valor. Las observaciones arriba del tercer cuartil
o .75 fractil (Q3) son la cuarta parte superior del conjunto de datos. Finalmente, los
1-30
intercuartiles miden la diferencia entre los cuartiles Q1 y Q2.

De la misma manera, el conjunto de datos de la muestra se puede dividir en
100 partes iguales por medio de percentiles. Por ejemplo, el 99avo percentil separa
el 1% más alto del 99% restante; el 84avo percentil separa el 16% más alto del
84% restante. Bajo estas condiciones, el 84avo percentil correspondiente al valor
de la variable aleatoria z de la distribución normal es, aproximadamente, z = +1 y
por simetría es z = -1.
Los cuartiles y percentiles junto con la estadística descriptiva se pueden
calcular con el programa Minitab usando el mandato:
Stat → Basic statistics → Display Descriptive Statistics
Igualmente, los cuartiles y percentiles también se pueden calcular de una gráfica de
frecuencia relativa acumulada vs. valores de X.
Usando los datos de la TABLA 1.7 vamos a proceder a hacer los cálculos de la
estadística descriptiva, los cuales se dan en la tabla de abajo.
TABLA 1.11. Tabla mostrando la estadística descriptiva del ejemplo #23.

Descriptive Statistics: Mediciones de 40 objetos
Variable N N* CumPct Mean SE Mean StDev Variance CoefVar
Mediciones 40 0 100 3.413 0.111 0.703 0.494 20.60
Variable Minimum Q1 Median Q3 Maximum Range
Mediciones 1.600 3.100 3.400 3.875 4.700 3.100
__________________________________________________________________
1-31
Histogram (with Normal Curve) of Mediciones de 40 objetos

Mean 3.413
12
StDev 0.7028
N 40
10
Frequency
6
0
1.6 2.4 3.2 4.0 4.8
Mediciones de 40 objetos
Figura 1.6. Figura mostrando el histograma de frecuencia con curva normal

sobrepuesta.
Ahora, el procedimiento para hacer una gráfica de frecuencia relativa acumulada en

función de los valores de X se procede de la siguiente manera:
1. Irse a:
Calc → Probability Distribution → Normal
2. En el recuadro que aparece puntear “Cummulative distribution” y almacenar los
datos de la distribución de frecuencia acumulada en C2.
3. Para hacer la gráfica de frecuencia relativa acumulada vs. valores de X, irse a:
Graph → Scatterplot → With connect line
4. En la ventana de “Scatterplot with connect line” introducir los datos de la
distribución de frecuencia acumulada (de la columna C2) vs. los valores de X.
5. En la ventanilla de “Scatterplot-Scale”, llenar todos los recuadros.
De esta manera, para calcular la distribución de frecuencia acumulada proceder

como en el paso 1 de arriba. Todas estas órdenes producen la tabla conteniendo los
valores de X (no se muestra aquí). La gráfica de las frecuencias relativas
1-32
acumuladas y valores de las observaciones se hace como en el paso 3 de arriba.

De la gráfica de abajo se pueden leer todos los cuartiles y percentiles
deseados.
Figura mostrando la grafica de f.r.a. y valores de X

1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0
1.0 1.0
0.8 0.8
Distribucion de f.r.a.
0.6 0.6
0.4 0.4
0.2 0.2
0.0 0.0
1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0

Mediciones de 40 objetos
Figura 1.7. Figura mostrando la gráfica de la frecuencia relativa acumulada versus

valores de X.
Ejemplo #24. Encontrar los cuartiles (Q1, Q2 y Q3) de una muestra de 15

mediciones de sólidos suspendidos, en unidades de mg/L, de una muestra de agua
residual.
7 19 12 5 17 29 8 19 4 27 30 1 4 10 21
__________________________________________________________________
Solución:
1-33
Primero se arreglan los datos en forma ascendente, esto es:
1, 4, 4, 5, 7, 8, 10, 12, 17, 19, 19, 21, 27, 29, 30

↑ ↑ ↑
Q1 Q2 Q3
El primer cuartil (Q1) es 5. El segundo cuartil (Q2) o la mediana es 12 y el tercer

cuartil (Q3) es 21.
1-34
Ejercicios Capítulo 1
1.1. Calcular el promedio, la varianza y la desviación estándar de las observaciones de
la muestra: 12, 6, 7, 3, 15, 10, 18, 5. (9.5, 27.1, 5.2)
1.2. Encontrar la desviación estándar y el promedio de los valores: 3, 6, 2, 1, 7, 5. De
acuerdo a la relación de los valores obtenidos del promedio y la desviación estándar o
varianza. ¿Qué conclusiones se pueden sacar?
1.3. Escribir los siguientes términos usando anotación de sumatoria.
10
2 2 2 2
(a) X 1 +X 2 +X 3 + ...+ X 10 (Σ Xi)
x=0
5
(b) (X1 + Y1) + (X2 + Y2) + .... + (X5 + Y5) (Σ Xi+Yi)
x=0
(c) f1 X1Y1 + f2 X2Y2 + f3 X3Y3 + f4 X4Y4
1.4. Encontrar la desviación promedio de:

(a) -3, 7,-9,5
(b) 2.4, 1.6, 3.8, 4.1, 3.4
1.5. El rango de los números 5, 3, 8, 4, 7, 6, 12, 4, 3 es: (9)
1.6. De 50 mediciones la más grande es 8.34 Kg. Si el rango es .46, encontrar la
medición más pequeña.
1.7. Convertir las siguientes observaciones a unidades de desviación estándar: 6, 2, 7,
5. (z6=0.46, z2=-1.39, z7=0.93, z5=0)
1.8. Escribir los siguientes términos en forma de sumatoria.
6
(a) Σ Xj
j=1
1-35
4
(b) Σ (y1 - 3) 2
j=1
5
(c) Σ fkxk
k=1
1.9. Usando el programa de computadora Minitab, EXCEL o una calculadora de

bolsillo, encontrar:
(a) El promedio aritmético (95.84)
(b) La desviación estándar
(c) El error estándar del promedio
(f) La varianza (106.49)
Tabla mostrando los datos del problema. (Elaboración propia)

Observación x | 70 74 78 82 86 90 94 98 102 106 110 114 118 122 126
_______________________________________________________________________________
Frecuencia f| 4 9 16 28 45 66 85 72 54 38 27 18 115
_______________________________________________________________________________
1.10. En una distribución, si el promedio es 5.0, la mediana es 7.0 y la moda es 9.0,

contestar a los siguientes enunciados:
(a) ¿Qué tipo de sesgo tiene esta distribución?
(b) ¿Dónde se encuentra la mayor concentración de valores?
1.11. En una distribución, si el promedio es de 10.0, la mediana es de 8.0 y la moda es
de 5.0, contestar las siguientes preguntas:
(a) ¿Qué tipo de sesgo tiene esta distribución? (Sesgo positivo)
(b) ¿Dónde se encuentran la mayor concentración de valores?
1.12. En un examen final de estadística, los grados fueron: 100, 100, 66, 65, 64, 60,
59, 57, 58, 50.
1-36
¿Es esta distribución oblicua hacia la derecha o hacia la izquierda? Justificar el

argumento usando la relación del promedio, la mediana y la moda.
1.13. Encontrar el promedio geométrico de una muestra aleatoria de de observaciones
10, 12, 16. (12.43)
1.14. Si el promedio aritmético de una muestra de 30 casos es igual a 10 y la
desviación estándar es igual a 2, calcular la variable estandarizada correspondiente al
valor de X = 15.
1.15. La tabla de abajo muestra los coeficientes de inteligencia de 550 niños de una
escuela elemental. Encontrar:
(a) El promedio aritmético. (97.03)
(b) La desviación estándar. (13.22)
(c) El error estándar del promedio (0.56)
___________________________________________________________________
Marca de | 75 78 78 82 86 91 94 98 102 106 110 114 118 122 126
clase (X)
Frecuencia (Y) | 53 5 10 20 45 60 85 72 54 38 27 18 11 50 2
1.16. Los siguientes datos están relacionados con las temperaturas, en oC, de 10
regiones de México. La tabla de abajo muestra esta situación:
__________________________________________________________________
Temp. Frecuencia Frecuencia Frecuencia Frecuencia relativa
o
( C) acumulada relativa (%) acumulada
__________________________________________________________________
20 3 3 30% 30%
21
22 2 9 20% 90%
23 1
Total 10
1-37
(a) Completar la tabla de arriba.

(b) Hacer gráficas de frecuencia versus frecuencia relativa.
(c) Hacer gráficas de frecuencia acumulada (f.a.) vs. frecuencia relativa acumulada
(f.r.a.).
1.17. Se saca una muestra aleatoria de análisis químicos de compuestos de cloruros
(Cl-) expresados en unidades de mg/L procedentes de una muestra de aguas
residuales. Estos análisis se hicieron usando el método de nitrato de mercurio descrito
en el texto Métodos Estándares. La tabla con los valores de los cloruros se da abajo:
___________________________________________________________________
17.2, 17.1, 17.0, 17.1, 16.9, 17.0, 17.1, 17.0, 17.3, 17.2, 16.9,
17.0, 17.1, 17.3, 17.2, 17.4, 17.1, 17.1, 17.0, 17.1
(a) Encontrar el promedio. (17.11)

(b) Encontrar la varianza. (0.017)
(c) Encontrar la desviación estándar. (0.132)
(d) Hacer una tabla de frecuencia mostrando la frecuencia, la frecuencia relativa y la
frecuencia relativa acumulada. (el lector lo deberá hacer)
(e) Hacer un histograma. (el lector lo deberá hacer)
(f) Hacer un polígono de frecuencia. (el lector lo hará)
(g) ¿Qué tanta simetría hay en esta distribución? (el lector responderá a esto)
1.18. Completar la tabla de abajo y hacer una gráfica en función de los intervalos de
las concentraciones de DBO, de la frecuencia (f) y de la frecuencia relativa acumulada
(f.r.a.).
1-38
Tabla mostrando los datos. (Elaboración propia)

__________________________________________________________________
Intervalos Número de Puntos Frecuencia
(Conc. DBO) análisis intermedios relativa (%)
__________________________________________________________________
50.00 - 59.99 8
60.00 - 69.99 10
70.00 - 79.99 16
80.00 - 89.99 14
90.00 - 99.99 10
100.00 - 109.99 5
10.00 - 119.99 2
1.19. Una organización caritativa que ayuda a damnificados por huracanes ha hecho
una lista de donaciones recibidas durante el presente año, en miles de pesos. El
propósito de este ejemplo es el de hacer una tabla de distribución de frecuencia
encontrando los intervalos de clase más apropiados usando la técnica de diagramas de
tallo y hoja. La tabla de abajo muestra los datos. Para esto hacer lo siguiente:
(a) Calcular el promedio y la mediana. (139, 135)
(b) Hacer una tabla de distribución de frecuencia usando un diagrama de tallo y hoja.
Encontrar los puntos intermedios, la frecuencia, la f. r. y la frecuencia relativa
acumulada y construir un histograma y una gráfica de f. r. a. contra valores de X.
Tabla mostrando los datos del problema (Elaboración propia).
___________________________________________________________________
253.0 173.4 117.0 191.2 151.4
182.0 132.0 162.0 212.9 155.9
221.0 158.0 135.0 124.4 68.9
89.7 95.6 84.1 135.1 123.2
101.0 126.5 142.8 20.2 119.0
___________________________________________________________________
1-39
1.20. La siguiente tabla da las emisiones de óxidos de azufre (SO2 en toneladas

métricas) provenientes de 200 plantas siderúrgicas localizadas en cierta región
industrial.
___________________________________________________________________
Emisión de SO2 (ton) Número de plantas
___________________________________________________________________
1.00 - 1.02 6
1.02 - 1.04 26
1.04 - 1.06 52
1.06 - 1.08 58
1.08 - 1.10 39
1.10 - 1.12 15
1.12 - 1.14 5
1.14 - 1.16 1
(a) Calcular el promedio aritmético de la distribución.

(b) Calcular la desviación estándar.
(c) Calcular la mediana y la moda de la distribución.
1.21. Se dan los siguientes datos en la tabla de abajo.
Tabla mostrando los datos de este problema. (Elaboración propia)
__________________________________________________________________
Altura (pulgadas) Marca de clase (x) Frecuencia fx
60 - 62 61 5 5 x 61 = 305
63 - 65 64 18 64 x 18 = 1152
66 - 68 67 42 67 x 42 = 2814
69 - 71 70 27 70 x 27 = 1890
72 - 74 73 8 73 x 8 = 584
__________________________________________________________________
(a) Calcular el promedio aritmético. Sugerencia: usar la función del promedio igual a
Σf X/Σf
1-40
1.22. Se da la siguiente tabla de distribución de datos (intervalos de clase) de

emisiones de partículas atmosféricas menores de 10 micras provenientes de varias
industrias. (Elaboración propia)
___________________________________________________________________
Mediciones de partículas Número de industrias
___________________________________________________________________
50.00 - 59.99 8
60.00 - 69.99 10
70.00 - 79.99 16
80.00 - 89.99 14
90.00 - 99.99 10
100.00 - 109.99 5
110.00 - 119.99 2
__________________________________________________________________
(a) Calcular la marca de clase X.

(b) Calcular el promedio aritmético.
(c) Calcular la frecuencia relativa (f.r.) y la frecuencia relativa acumulada (f.r.a.).
(d) Hacer un histograma.
(e) Usar papel de probabilidad para ver que tanta uniformidad hay en los datos.
1.23. Completar los faltantes de la tabla de abajo, de una distribución de frecuencia de
las vidas de 400 tubos de radios. Además, hacer los cálculos pedidos abajo.
(a) Encontrar el límite superior de la quinta clase. (799)
(b) Encontrar el límite inferior de la octava clase. (1000)
(c) Encontrar la marca de clase de la séptima clase. (949.5)
(d) Encontrar los límites de la última clase. (1099.5-1199.5)
(e) Encontrar el tamaño del intervalo de clase. (100)
(f) Encontrar la frecuencia de la cuarta clase. (76)
(g) Encontrar la f.r. de la sexta clase. (15.5%)
1-41
(h) Encontrar el % de los tubos cuyas vidas sean < 600 horas. (29.5%)
(i) Graficar los datos en papel de probabilidad y leer el promedio aritmético y la
desviación estándar de la gráfica.
(j) Hacer una grafica de frecuencia relativa acumulada versus puntos medios y
calcular los percentiles Q1, Q2 y Q3.
___________________________________________________________________
Vida de los No. de (f) f.r. f.a. f.r.a. Punto
tubos tubos medio
___________________________________________________________________
300 - 399 14
400 - 499 46
500 - 599 58
600 - 699 76
700 - 799 68
800 - 899 62
900 - 999 48
1000 - 1099 22
1100 - 1199 6
__________________________________________________________________
1.24. Se da la tabla de debajo consistente en una muestra aleatoria de mediciones de

óxidos de nitrógeno (NO2), procedentes de una planta de tratamiento de aguas
residuales. La tabla con los datos se da abajo.
1-42
Tabla con los datos. (Elaboración propia)

Mediciones de NO2 Frecuencia Marca de f.r f.r.a.
(Intervalos) clase (X)
3.0 – 5.0 14
6.0 – 8.0 46
9.0 – 11.0 58
12.0 – 14.0 76
15.0 – 17.0 68
18.0 – 20.0
21.0 – 23.0 48
24.0 – 26.0 22
27.0 – 29.0 6
Total 400
(a) Llenar los faltantes de la tabla.

(b) Calcular el promedio aritmético.
(c) Usando papel de grafica de probabilidad, graficar los datos.
(d) De la grafica de probabilidad obtenida en el inciso (c) calcular el promedio
aritmético y compararlo con el promedio obtenido en (b).
(e) De la misma grafica de probabilidad estimar la desviación estándar.
1.25. Se da la tabla de abajo.
__________________
X P(X)
__________________
0 0.8574
1 0.1354
2 0.0071
3 0.0001
_________________
Para los problemas de abajo encontrar las siguientes sumatorias usando la tabla de
arriba.
1-43
(a) Σ p(x) (0.9928)

x=0
2 1
(b) Σ p(x) – Σ p(x)
x=0 x=0
1
(c) Σ p(x) (0.9928)
x=0
3
(c) Σ p(x) (1.000)
x=0
1-44
1-45
CAPITULO 2
Probabilidad
Probabilidad clásica.- Probabilidad de frecuencia relativa.- Probabilidad

subjetiva.- Axiomas y propiedades básicas de la probabilidad.- Diagramas de
Venn y algebra de conjuntos.- Técnicas de conteo: Regla de producto para pares
ordenados, la regla de multiplicación más general, regla factorial, diagramas de
árbol, permutaciones y combinaciones.- Regla multiplicativa para eventos
dependientes e independientes.- Regla aditiva para eventos mutuos excluyentes y
eventos no mutuos excluyentes.-
El desarrollo de la teoría de la probabilidad matemática ocurrió en el siglo 17, y está
relacionada con el noble francés Antoine Gombauld y con el matemático Francés
Blaise Pascal. El estudio de la probabilidad es una rama de las matemáticas que se
inició hace 300 años.
Maneras de medir las probabilidades:
(1) La probabilidad clásica
(2) La probabilidad de frecuencia relativa
(3) La probabilidad subjetiva
Probabilidad clásica
El término probabilidad se refiere al estudio de lo aleatorio y de la incertidumbre. El
concepto clásico de la probabilidad de un evento A se define como sigue: si hay a
posibles resultados favorables la ocurrencia del evento A y, b resultados desfavorables
a la ocurrencia de A, y si todos los resultados son igualmente mutuos excluyentes (que
no pueden ocurrir a la vez), entonces la probabilidad de que A ocurra se denota como
P(A), es decir:
2-1

a Número de resultados favorables al evento A

P(A) = ———— = ———————————————————— (2.0)
(a + b) Número total de resultados posibles
Otra manera de definir la probabilidad es:
p = Pr{E} = h / n (2-0a.)
Donde:
E = el tipo de evento que estamos haciendo

h = número de maneras favorables de que pueda ocurrir el evento o número de puntos
en el evento del espacio A
n = número total de posibles resultados o de número de puntos en el espacio de la
muestra (S)
La probabilidad de que no ocurra el evento es q, es decir:
q = Pr{que no ocurra E} = 1 - h / n = 1 - Pr{E} (2-1)
Por lo tanto, p + q = 1
Ejemplo #1. Si una moneda tiene dos caras denotadas por águilas o sellos, calcular la
probabilidad de que salga un sello.
Solución:
Usando la función (2-0) y dejando que A sea el evento sello y B el evento águila,
entonces, la probabilidad de sellos es:
P(A) = 1 / (1 + 1) = 0.5.
Ejemplo #2. En el caso de un dado que tiene 6 números: 1, 2, 3, 4, 5, 6, si el dado es

honesto, todos los números tienen la misma probabilidad de salir. Siendo así, calcular
2-2

las siguientes probabilidades:

(a) La probabilidad de sacar el número 1
(b) La probabilidad de sacar los números pares
(c) La probabilidad de sacar los números 3 o 4
(d) La probabilidad de no sacar los números 3 o 4
Solución:
(a) P(sacar el número 1) = 1 / (1 + 5) = 1/6.
(b) En este caso hay 3 números pares en las seis caras del dado, por lo tanto, la
probabilidad de sacar los pares es: P(pares) = 3/(3 + 3) = 1/2
(c) Aquí, el evento puede ocurrir de dos maneras, es decir, como (3 o 4). Por lo tanto,
P(3 o 4) = 2/(2 + 4) = 1/3.
(d) La probabilidad de no sacar el 3 o 4 es: q = 1 - 1/3 = 2/3
Ejemplo #3. Encontrar la probabilidad de que una pareja con 3 hijos tendrán:
(a) Exactamente 2 varones (X = 2)
(b) 3 varones y 3 hembras
(c) A lo más dos varones (X ≤ 2)
(d) Cuando menos 2 varones (X ≥ 2)
(e) Más de 2 hembras (X > 2)
(f) Menos de 2 varones (X < 2)
Solución:
Dejemos que el evento varón sea v y, el evento hembra, sea h. Aquí el espacio
muestral S se puede hacer de un árbol de probabilidad y da 8 resultados:
S = {vvv, vvh, vhv, vhh, hvv, hvh, hhv, hhh}
(a) P(2 varones en 3 nacimientos) = P(X = 2) = 3/8 = 0.375
2-3

(b) P(X = 3 varones) • P(X = 3 hembras) = (1/8)(1/8) = 1/64

(c) P(X ≤ 2) = 6/8 = 3/4
(d) P(X ≥ 2) = 4/8 = 1/2
(e) P(X > 2) = 1/8
(f) P(X < 2) = 3/8
Probabilidad de frecuencia relativa
La probabilidad de frecuencia relativa puede interpretarse como la proporción de

veces un evento ocurre a largo plazo, bajo condiciones estables o uniformes. Este tipo
de probabilidad se define como:
P(E) = n / N (2-2)
Donde:
n/N es la proporción del tiempo que el evento E ocurre en experimentos repetidos.
Ejemplo #4. Si 8,000 de 1,000,000 hombres anglos de 35 años murieron durante el
año, la frecuencia relativa de muertes o la probabilidad de muerte para individuos de
este grupo es:
P(de muerte) = 8,000 / 1,000,000 = 0.00080
Ejemplo #5. Supóngase que se estudian 10,000 personas de 20 años y se encuentra
que 9961 vivieron 21 años. Encontrar la probabilidad de que una persona de 20 años
vaya a vivir 21 años.
Solución:
Aquí, los dos resultados de vivir y morir no son igualmente probables, de manera que
la aproximación de frecuencia relativa debe usarse. Entonces la aproximación
empírica de frecuencia relativa es:
P(de la persona de 20 años que viva 21 años) = 9,961/10,000 = .996
Probabilidad subjetiva
2-4

La probabilidad subjetiva es un desarrollo relativamente reciente. Esta probabilidad se

define como el grado de credibilidad o confianza de un evento que varía con el juicio
o estado de ánimo de la persona. Esta probabilidad es útil en decisiones financieras y
otros tipos de trabajos.
Relación entre la probabilidad (usando distribuciones discretas) y la estadística
de inferencia (usando distribuciones continuas) usando lógica deductiva e
inductiva
La relación entre la probabilidad usando distribuciones discretas como la binomial,
hipergeométrica o la Poisson y la estadística de inferencia (usando distribuciones
continuas como la normal, la t de Estudiante, la distribución F, gamma, exponencial,
etc.) radica en el hecho de qué, en el primer caso, el razonamiento va del conjunto o de
la población hacia la parte (razonamiento deductivo o lógica deductiva). En contraste,
con la estadística de inferencia, el razonamiento va desde la muestra o la parte hacia la
población o total (razonamiento inductivo o lógica inductiva).
Anotación para encontrar probabilidades
Las anotaciones usadas en encontrar probabilidades se definen como: P denota una
probabilidad; A, B, C denotan eventos específicos y, P(A), denota la probabilidad de
que ocurra el evento A.
1. P denota una probabilidad
2. A, B, C denotan eventos específicos
3. P(A) denota la probabilidad de que ocurra el evento A
4. P (B) denota la probabilidad de que ocurra el evento B, etc.
Axiomas y propiedades básicas de la probabilidad

2-5

1. Para cualquier evento A, P(A) ≥ 0. Además, la probabilidad no puede ser mayor que
1, ni tampoco negativa.
2. La probabilidad de un espacio muestral es: P(S) = 1
3. Si A1, A2,...., Ak es una colección finita de eventos mutuos excluyentes (que no
puede ocurrir a la misma vez), entonces:
k
P(A1 ∪ A2 ∪....∪ Ak) = Σ P(Ai) (2-3)
i=1
Si A1, A2, A3,... es una colección infinita de eventos mutuos excluyentes, entonces:
k
P(A1 ∪ A2 ∪ A3 ∪...) = Σ P(Ai) (2-4)
i=1
Ejemplo #6. Este es un ejemplo adaptado del libro de Richard A. Jonson, intitulado
Probabilidad y Estadística para Ingenieros de Miller y Freund (1994). Las
probabilidades de que un consumidor que prueba el servicio de un nuevo dispositivo
anticontaminante para autos, lo clasifique como muy deficiente, deficiente, suficiente,
bueno, muy bueno o excelente son: 0.07, 0.12, 0.17, 0.21, y 0.011. ¿Cuáles son las
probabilidades de que las clasificaciones del dispositivo sean?:
(a) ¿Muy deficientes?
(b) ¿Deficientes?
(c) Suficientes o buenas?
(d) ¿Buenos, muy buenos o excelentes?
Solución:
Puesto que las posibilidades son mutuamente excluyentes (que no pueden ocurrir a la
vez), la sustitución directa de cada una de las cinco clasificaciones, en la función (2-3)
da como resultado:
(a)-(c) es: 0.07 + 0.12 + 0.17 + 0.32 = 0.68
2-6

(d) 0.32 + 0.21 + 0.11 = 0.64

Terminología usada en probabilidad
Cuando se habla de probabilidad se incluyen términos como: experimento, resultados,

eventos, espacio muestral, teoría de conjuntos (uniones, intersecciones, complemento
como A'), eventos mutuos excluyentes, variables aleatorias discretas (estocásticas de
conjetura o probabilidad), probabilidad de frecuencia relativa, probabilidad subjetiva,
técnicas de conteo (combinaciones y permutaciones, regla de multiplicación y adición,
etc.), teorema de Bayes, independencia, eventos mutuos excluyentes, diagramas de
Venn, árboles de probabilidad, etc. Algunas definiciones de estos términos se dan
abajo.
Experimento.- Un experimento es un proceso que nos ayuda a obtener observaciones
de dos o más resultados distintos, donde el resultado que ocurre no puede ser
predecible con certeza, sino en términos de probabilidad.
Evento.- Es una colección de uno o más resultados elementales de un experimento. Un
evento es un subconjunto de un espacio muestral. Por subconjunto se entiende
cualquier parte de un conjunto, incluyendo el conjunto en su totalidad. Aquí, también
puede haber conjuntos vacíos denotados por ф, los cuales no poseen ningún elemento.
Eventos mutuos excluyentes. Dos eventos A y B son mutuos excluyentes o desunidos,
si su intersección A ∩ B = ф, esto es, si A y B no tienen elementos en común. Por
ejemplo, los eventos A y B se dice que son mutuos excluyentes o desunidos, si A y B
no pueden ocurrir simultáneamente o en un solo ensayo de un experimento. Por ende,
si A y B son eventos mutuos excluyentes, por lo tanto, P(A ∩ B) = 0. En este renglón
se puede usar la regla aditiva, el teorema de Bayes o eventos independientes.
Ejemplo #7. Dos eventos A y B son mutuos excluyentes o desunidos, si A ∩ B = ф,
esto es, si A y B no tienen elementos en común. Siendo así, decir si en un solo
2-7

lanzamiento de una moneda los dos eventos A y B son mutuos excluyentes.

Solución:
Debido a que si cae la cara, el águila no puede caer a la misma vez y viceversa, por lo
tanto, los eventos A y B son mutuos excluyentes.
Ejemplo #8. Si E1 es el evento de sacar un as de un mazo de 52 naipes y E2 es el
evento de sacar un rey, ¿son estos eventos mutuos excluyentes?
Solución:
Aquí, en este caso, si son eventos mutuos excluyentes porque no se puede sacar el as o
el rey a la misma vez.
Espacio muestral.- El espacio muestral (S) es el conjunto de todos los resultados
posibles de un experimento estadístico. Los espacios muestrales se clasifican de
acuerdo al número de elementos (puntos) que contienen. En este respecto, se pueden
enlistar los elementos separados por comas y enclaustrados en corchetes ({}). Los
espacios muestrales pueden ser finitos, no finitos, discretos y continuos. Sin embargo,
los dos tipos básicos de espacios muestrales son los discretos y continuos. Por
ejemplo, un espacio muestral discreto tiene un número finito de eventos simples o un
número infinito contable de eventos simples. En el caso de espacios muestrales
continuos, esto se refiere cuando los elementos (puntos) de un espacio muestral
constituyen un continuo, como por ejemplo, todos los puntos de una línea; todos los
puntos de un segmento de línea o todos los puntos de un plano. En algunos
experimentos puede ser útil enlistar los elementos del espacio muestral,
sistemáticamente, por medio de diagramas de árbol.
Ejemplo #9. Un ejemplo de un espacio muestral discreto finito es el lanzamiento de
una moneda dos veces, el cual tiene un espacio muestral de 4 eventos simples, donde
H denotan caras y T denotan águilas. Esto es:
2-8

S = {HH, HT, TH, TT}

Ejemplo #10. Un ejemplo de un espacio no finito está relacionado con el siguiente
experimento. Si unos mecánicos encargados de verificar la emisión de óxidos de
nitrógeno de los autos, les interesa saber el número de autos que deben inspeccionar
antes de ver, cuál es el número de ellos que no satisfacen los reglamentos
gubernamentales. Aquí, bien podría ocurrir que fuese el primer auto, el segundo, el
tercero, etc., y que tuvieran que verificar miles de autos antes de encontrar uno que no
cumpla con los reglamentos. Dado a que no se sabe que tan lejos tendrían que llegar,
por lo tanto, se considera una cantidad de autos contable infinita.
Ejemplo #11. En el caso de espacios muestrales con un número infinito de puntos
muestrales, estos se describen mejor usando métodos de regla. Por ejemplo, si todos
los resultados posibles de un experimento, es el grupo de ciudades en el mundo, con
una población de más de un millón, entonces, el espacio muestral S es:
S = {x|x es una ciudad con una población de más de un millón}
Ejemplo #12. Para explicar un espacio muestral continuo, considérese el experimento
de observar el tiempo para completar una tarea en particular, digamos, en un intervalo
de 0 a 40 segundos. En este caso, el espacio muestral es continuo debido a que hay un
número de valores infinitamente contable, en el intervalo de 0 a 40 segundos.
S = {todas las veces posibles entre 0 y 40 segundos}
Unión.- La unión de dos eventos, digamos A y B, se denotan por el símbolo A ∪ B y
se lee A o B, y es el evento que contiene todos los elementos que pertenecen a A o B o
ambos. Por lo tanto, el evento A ∪ B ocurre, si A ocurre, si B ocurre o si ambos A y B
ocurren.
Ejemplo #13. Si dejamos que el evento A = {a, b, c} y B = {b, c, d, e}, siendo así, por
lo tanto, A ∪ B = {a, b, c, d, e}
2-9

Ejemplo #14. Si M = {x|3 < x < 9} y N = {y|5 < y < 12}, entonces, encontrar la unión
de M ∪ N. (Walpole 1993, p. 14)
Solución:
M ∪ N = {z}3 < z < 12}
Intersección de los eventos. La intersección de dos eventos A y B, se denota por el
símbolo A ∩ B, que se lee "A y B". La intersección A ∩ B es el grupo de puntos en el
evento del espacio A y en el evento del espacio B. Por lo tanto, el evento A ∩ B
ocurre, solamente, si ambos eventos A y B ocurren. Aquí, la palabra clave “y” se
refiere al evento conteniendo todos los elementos que son comunes o que están en
ambos, A y B.
Ejemplo #15. Si S = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}, A = {0, 2, 4, 6, 8}, B = {1, 3, 5, 7, 9},
C = {2, 3, 4, 5} y D = {1, 6, 7}, encontrar:
(a) A ∩ B.
(b) A ∩ C
Solución:
(a) Debido a que en A ∩ B no hay ningún elemento en común, por lo tanto, A ∩ B = ф
y no pueden ocurrir a la misma vez.
(b) Debido a que, solamente el 2 y el 4 son comunes en ambos eventos A y C, por lo
tanto, A ∩ C = {2, 4}
Ejemplo #16. Si dejamos que M = {a, e, i, o, u} y N = {r, s, t}, por lo tanto, M ∩ N =
Φ, lo cual dice que M y N no tienen elementos en común y que no pueden ocurrir a la
misma vez.
Complemento.- El complemento de un evento A, denotado por A', es el conjunto de
todos los resultados en el espacio muestral S, que no están contenidos en A.
Ejemplo #17. Si A = {0, 1, 2, 3, 4}, B = {3, 4, 5, 6} y C = {1, 3, 5}, entonces,
2-10

encontrar:
(a) A ∪ B
(b) A ∪ C
(c) A ∩ B
(d) A ∩ C
(e) A'
(f) {A ∪ C}'
Solución:
(a) A ∪ B = {0, 1, 2, 3, 4, 5, 6} = S
(b) A ∪ C = {0, 1, 2, 3, 4, 5}
(c) A ∩ B = {3,4}
(d) A ∩ C = {1,3}
(e) A' = {5,6}
(f) (A ∪ C)' = {6}
2-11

Figura 2.0. Diagrama mostrando los espacios muestrales y los eventos. (Johnson,
1997).
Ejemplo #18. Refiriéndose al problema anterior representar con símbolos de Venn las
siguientes regiones:
(a) 4, 6, 7
(b) 1,4
(c) 1, 2, 5, 7
(d) 1, 2
(e) 1, 3, 4
Solución:
(a) (A U C)
(b) (A ∩ C)
(c) (A U B)
(d) (A ∩ B)
(e) (A U B) ∩ C)
Ejemplo #19. Si S = {libro, catalizador, cigarrillo, químico, ingeniero, remache} y, si
dejamos que A = {catalizador, remache, libro, cigarrillo}, entonces A' = {químico,
2-12

ingeniero}
Ejemplo #20. El espacio muestral de un experimento aleatorio se da como S = {AA,
AN, NA, NN}. Si E1 = {AA, AN, NA} y E2 = {AN, NA, NN}, entonces, encontrar:
(a) E1 ∪ E2
(b) E1 ∩ E2
(c) E1'
(d) E2'
Solución:
(a) E1 ∪ E2 = {AA, AN, NA, NN}
(b) E1 ∩ E2 = {AN, NA}
(c) E1' = {NN}
(d) E2' = {AA}
Eventos mutuos excluyentes.- Dos o más eventos se dice que son mutuos excluyentes
o desunidos, cuando no hay elementos comunes entre si. Para esto se usa la
simbología de intersecciones, es decir, A ∩ B = Φ, esto dice que A y B no tienen
elementos en común. Esto nos dice qué, cuando uno de los resultados ocurre, los otros
no pueden ocurrir al mismo tiempo. Por ejemplo, cuando se lanza un dado, la sacada
de un 1 y un 2 son eventos mutuos excluyentes, debido a que, si el sale el 1, no puede
salir el 2, a la misma vez. Igualmente, con los naipes si sale un rey no puede salir un as
o cualquier otra carta del mazo de cartas.
Si E1 y E2 son eventos mutuos excluyentes, entonces:
Pr{E1E2} = 0.
Si E1 + E2 denotan los eventos de que, ya sea que E1 o E2 o ambos ocurran, entonces:
Pr{E1 + E2} = Pr{E1} + Pr{E2} - Pr{E1E2}
En general para eventos mutuos excluyentes:
2-13

Pr{E1 + E2} = Pr{E1} + Pr{E2} (2-5)

Ejemplo #21. De los siguientes eventos, determinar, cuáles eventos son mutuos
excluyentes y cuáles no lo son.
(a) Manufacturando un componente electrónico defectuoso.
Manufacturando un componente electrónico bueno.
(b) Probando un sujeto con un coeficiente de intelecto > 100.
Probando un sujeto con un coeficiente de intelecto < 95
(c) Seleccionando un médico, quien es cirujano
Seleccionando un médico quien es mujer
(d) Seleccionando un tipo con personalidad dominante
Seleccionando un tipo de personalidad sumisa.
Solución:
En este caso, los incisos (a), (b), (d) son eventos mutuos excluyentes. Sin embargo, el
inciso (c) es evento no mutuo excluyente.
Ejemplo #22. Supóngase que hay 3 distribuidores de autos: el distribuidor de GM
vende Chevrolet, Pontiac y Buick; el distribuidor de la Ford vende Mercury y Ford y,
el distribuidor de la Chrysler vende Plymouth y Chrysler. Si un experimento consiste
en observar la marca del siguiente auto vendido, entonces, los eventos A = {Chevrolet,
Pontiac, Buick} y B = {Ford, Mercuy} son mutuos excluyentes porque el siguiente
auto vendido no puede ser producto de GM o de Ford.
Ejemplo #23. Dos eventos A y B son mutuos excluyentes o desunidos, si A ∩ B = Φ,
esto es, si A y B no tienen elementos en común. Siendo así, decir si en un solo
lanzamiento de una moneda los eventos A y B son mutuos excluyentes.
Solución:
Debido a que, si cae la cara de la moneda, la cara opuesta no puede caer a la misma
2-14

vez y viceversa. Por lo tanto, los dos eventos A y B son mutuos excluyentes.
Probabilidad condicional.- Se define como la probabilidad de que un evento A ocurra,
cuando se sabe que el evento B ha ocurrido y se denota como P (A|B). También la
probabilidad de que un evento B ocurra, cuando se sabe que el evento A ha ocurrido,
se denota por P (B|A). Las funciones usadas para tales fines son:
P (A ∩ B) P(A ∩ B)
P (B|A) = ——————; P (A|B) = ————— (2-6)
P(A) P(B)
Ejemplo #24. Si P(D) = 0.83, P(A) = 0.82 y P(D ∩ A) = 0.78, encontrar los siguientes
enunciados:
(a) P(A|D)
(b) P(D|A)
Solución:
(a) P(A|D) = P(D ∩ A)/P(D)
= 0.78/0.83
= 0.94
(b) P(D|A) = P(D ∩ A)/P(A)
= 0.78/0.82
= 0.95
Ejemplo #25. Los resultados obtenidos de 266 muestras de aire se clasifican de
acuerdo a la presencia de dos moléculas raras. Sean A: el evento formado por todas las
muestras de aire en la que se encuentra la molécula rara 1, y B: el evento formado por
todas las muestras de aire donde está presente la molécula rara 2. Si se calculó que la
probabilidad P(A ∩ B) = 12/66 y P(A) = 36/266, entonces, calcular la probabilidad del
evento formado por todas las muestras de aire con la molécula 2, dado el evento
2-15

formado por todas las muestras de aire con la molécula 1. (Montgomery et al. 1996)
Solución:
P(B|A) = P(A ∩ B) / P(A)
= (12/266) / (36/266)
= 12/36
Ejemplo #26. Refiriéndose al problema anterior, encontrar P(A|B), si P(B) es igual a
30/266.
Solución:
P(A|B) = P(A ∩ B) / P(B) = 12/266/(30/266) = 12/30
Eventos independientes y dependientes.- En este caso, sin embargo, cuando hablamos
de probabilidad condicional se incluyen lo que se llaman eventos independientes y
eventos dependientes. Por ejemplo, si la ocurrencia de un evento, no cambia la
probabilidad de la ocurrencia del otro evento, entonces, se dice que los dos eventos
son independientes. Sin embargo, si cualquiera de estas condiciones no se satisfacen,
los dos eventos se dicen que son dependientes, es decir, P(A|B) ≠ P(A).
En el caso especial de que A y B sean independientes, es decir, de manera que,
P(A|B) = P(A), esto conduce a la regla especial de multiplicación:
P(A ∩ B) = P(A) · P(B) (2-7)
Ejemplo #27. Encontrar la probabilidad de sacar dos caras en dos lanzamientos de una
moneda honesta.
Solución:
Puesto que la probabilidad de las caras es de 0.5 por cada lanzamiento y los dos
lanzamientos son independientes, la probabilidad es (1/2)(1/2) = ¼
Ejemplo #28. Se sacan dos cartas, aleatoriamente, de un mazo de 52 naipes. ¿Qué
probabilidad hay de obtener dos ases si?
2-16

(a) La primera carta se reemplaza antes de que se saque la segunda.

(b) La primera carta no se reemplaza antes de que se saque la segunda carta.
Solución:
(a) Dado que entre los 52 naipes hay cuatro ases, la probabilidad de sacar dos ases es
de: (1/13)(1/13) = 1/169.
(b) Dado que entre los 51 naipes restantes, al sacar un as del fajo de cartas, quedan
solo 3 ases, entonces, la probabilidad es: (4/52)(3/51) = 1/221. Aquí se ve que este es
un evento dependiente, porque 1/221 ≠ 1/169, ya que los eventos son dependientes,
cuando hay muestreo sin reemplazo.
Ejemplo #29. Para dos eventos J y K se sabe que P(J) = 0.60, P(K) = 0.4 y P(J ∩ K) =
0.10. Decir si estos dos eventos son independientes.
Solución:
Debido a que P(J ∩ K) = 0.10, P(J/K) = P(J ∩ K)/P(K) = 0.10/0.40 = 0.25, entonces,
siendo que P(J/K) = 0.25 ≠ P(J) = 0.6 y los dos eventos son dependientes.
Ejemplo #30. Encontrar P(A|B), si P(B) = 20/26 y P(A ∩ B) = 30/26
Solución:
Usando la función P(A|B) = P(A ∩ B)/P(B) y sustituyendo da:
P(A|B) = (30/26)/(20/26)
= 600/676
= 0.888
Variable aleatoria (va).- Fundamentalmente, hay dos tipos de variables aleatorias:
variables aleatorias discretas y variables aleatorias continuas. La variable aleatoria es
una función que asigna un número real a cada resultado en un espacio muestral S. Es
un valor de una función numéricamente definido sobre S, es decir, una regla que
asocia un número a cada resultado en el espacio muestral S. Algunos estadísticos
2-17

relacionan el término "variable aleatoria" con el término "estocástico", que se

relaciona con conjetura o probabilidad. Hay variables aleatorias binomiales, de
Poisson, hipergeométricas, variables de la distribución normal, de la distribución de t
de estudiante, de JI cuadrada, de Fisher, etc.
Estocástico.- Es un término que involucra una variable aleatoria o que relaciona
casualidad o probabilidad.
Variable aleatoria discreta (vad).- La vad es un conjunto o rango de valores finitos o
infinitamente contables en números. La vad se asocia con distribuciones de Bernoulli,
de Poisson, geométrica, hipergeométrica, negativa binomial, etc. Un ejemplo de vad
finita es el número de autos manejados con una flota de 6 vehículos, es decir, donde x
= 0, 1, 2, 3, 4, 5. Sin embargo, un ejemplo de vad infinitamente contable es el número
de personas que entran a una tienda de compras cada mes.
Variable aleatoria continua (vac).- La vac se define como el rango de una variable
aleatoria X que contiene un intervalo infinito o finito de números reales. Por ejemplo,
si X es el valor del peso de una persona, el rango de X es X ≥ 0. Las distribuciones
continuas asociadas con vac son la distribución normal, la familia de las distribuciones
gamma, beta, la distribución exponencial, la JI cuadrada, la t de estudiante, etc.
Diagramas de Venn y álgebra de conjuntos
Diagrama de Venn.- Es un dispositivo gráfico para representar el espacio muestral y
las operaciones que implican eventos. El inglés J. Venn desarrolló este tipo de
diagrama para representar, gráficamente, los resultados de un experimento. El
concepto de las reglas de eventos mutuos excluyentes y varias otras reglas de
probabilidad se pueden representar con diagramas de Venn. Para construir un
diagrama de Venn un espacio se enclaustra representando el total de todos los
resultados posibles.
2-18

Las reglas de las tres operaciones básicas del álgebra de conjuntos para formar
uniones, intersecciones y complementos de eventos se describen en la TABLA 2.1.
TABLA 2.1. Tabla mostrando las leyes del álgebra de conjuntos. (Elaboración
propia)
___________________________________________________________________
Ley asociativa: (A ∪ B) ∪ C = A ∪ (B ∪ C)
(A ∩ B) ∩ C = A ∩ (B ∩ (B ∩ C)
Ley conmutativa: A∪B=B∪A
A∩B=B∩A
Ley distributiva: A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C)
A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)
Leyes de Morgan: (A ∪ B)' = A' ∩ B'
(A ∩ B)' = A' ∪ B'
Leyes complementarias: A ∪ A' = S
A ∩ A' = Φ
(A')' = A
S' = Φ, Φ' = S
Leyes idénticas: A∪Φ=A
A∩S=A
A∪S=S
A∩Φ=Φ
Leyes con la misma potencia: A∪A=A
A∩A=A
__________________________________________________________________
2-19

Figura 2.2. Los esquemas de abajo muestran algunos diagramas de Venn. (Elaboración
propia)
Técnicas de conteo
Numerosas reglas de conteo han sido usadas para contar el número de puntos en
muestreos. Cuando los diversos resultados de un experimento son igualmente
probables, la tarea de calcular probabilidades se reduce a contar. Estas técnicas de
conteo son útiles para contar el número de eventos que componen el numerador y/o el
denominador de una probabilidad.
Ejemplos de técnicas de conteo son:
1. La regla del producto para pares ordenados
2. La regla del producto más general
2-20

3. Factoriales
4. Uso de diagramas de árbol
5. Permutaciones
6. Combinaciones
La regla del producto para pares ordenados
La forma más básica de conteo es la regla del producto mn. Por ejemplo, si el primer
elemento u objeto de un par ordenado se puede seleccionar en n1 formas, y por cada
una de estas n1 formas se puede seleccionar un segundo elemento del par en n2 formas,
entonces, siendo así, esto es una regla del producto.
Ejemplo #31. ¿Cuántos puntos muestrales hay en un espacio muestral S, cuando un
par de dados se lanzan una vez?
Solución:
El primer dado puede caer en n1 = 6 maneras. Para cada una de estas 6 maneras, el
segundo dado puede también caer en n2 maneras. Por lo tanto, el par de dados pueden
caer en n1n2 = (6) (6) = 36. El espacio muestral es:
S = {1-1, 1-2, 1-3, 1-4, 1-5, 1-6, 2-1, 2-2, 2-3, 2-4, 2-5, 2-6, 3-1, 3-2, 3-3, 3-4, 3-5, 3-
6, 4-1, 4-2, 4-3, 4-4, 4-5, 4-6, 5-1, 5-2, 5-3, 5-4, 5-5, 5-6, 6-1, 6-2, 6-3, 6-4, 6-5, 6-6}
Ejemplo #32. En un estudio médico los pacientes se clasifican en ocho maneras de
acuerdo a que tengan tipo de sangre, es decir, AB+, AB-, A+, A-, B+. B- o O+, O- y
también de acuerdo a, aquéllos que tengan presión alta, baja o normal. Encontrar el
número de maneras en las cuales un paciente se pueda clasificar.
Solución:
n1 = 8 tipos de sangre y n2 = 3 presiones arteriales. Por lo tanto, n1 n2 = (8) (3) = 24
maneras.
2-21

Regla de multiplicación más general

La regla del producto para k-arreglos se define como sigue: Si una operación puede
ser hecha en n1 maneras y, si para cada una de estas maneras, una segunda operación
puede ser hecha en n2 maneras, y, si por cada una de estas dos primeras operaciones,
una tercera operación puede ser hecha en n3 maneras y, así sucesivamente, entonces, la
secuencia de k operaciones o arreglos puede ser hecha en n1, n2, n3,..., nk arreglos, es
decir:
n1n2n3,…,nk (2-8)
Ejemplo #33. Supóngase que un cliente desea instalar un teléfono Trimline y se puede
seleccionar de n1 = 10 colores decorativos que se supone están disponibles en n2 = 3
longitudes de cables con n3 = 2 tipos de tonos rotativos. Entonces, ¿cuántos arreglos se
pueden hacer?
Solución:
n1n2n3 = (10)(3)(2)
= 60 arreglos
Ejemplo #34. Si cada clínica en un centro médico, tiene 4 especialistas del corazón, 3
especialistas en medicina interna y dos cirujanos generales, ¿cuántas maneras existen
de seleccionar un médico de cada tipo? (Nota: en este renglón, del punto de vista del
autor de este libro, no puede haber especialistas médicas de cada una de las partes,
órganos o sistemas del cuerpo, como comúnmente se cree. Si así fuera, esto
equivaldría a decir que cada órgano o sistema del cuerpo funciona independientemente
del resto del organismo; lo cuál no es correcto. Esto se debe a qué, el cuerpo está
compuesto por órganos o sistemas contingentes o dependientes, cuyo funcionamiento
depende, en turno, de la dirección que se le dé a todo el organismo como unidad
independiente. El hecho de que un órgano o sistema del cuerpo esté aparentemente
2-22

enfermo, esto no quiere decir qué, solamente, ese órgano en particular está enfermo,
sino que toda la química del cuerpo está alterada, como resultado de vida antinatural.
Este razonamiento está relacionado con la tesis de Hipócrates conspiratio una).
Solución:
n1n2n3 = (4)(3)(2) = 24
Regla factorial
Dado un íntegro positivo n, el producto de todos los números enteros desde n hasta 1
se llama factorial n y se escribe n!. En general, n! = n(n – 1)(n – 2)(n – 3)….1. Por
definición 0! = 1. Aquí nótese que 10! = 10·9!; 5! = 4·4!, y n! = n(n – 1)!
Más adelante, cuando se discuta el tema de permutaciones se verá que, la
diferencia entre la regla factorial y la regla de permutaciones, es la siguiente: la regla
factorial dice cuántos arreglos son posibles, cuando se usan todos los diferentes
objetos de n. Sin embargo, cuando se habla de permutaciones, se seleccionan
solamente algunos de los objetos n, no todos, como en el caso de la regla factorial.
Ejemplo #35. Calcular los siguientes factoriales:
(a) 10!
(b) 5!
(c) 9!/0!
Solución:
(a) 10! = 3,628,800
(b) 5! = 120
(c) 9!/0! = 362,880/1 = 362,880
Ejemplo #36. Un candidato presidencial planea visitar cada uno de 28 estados de un
país. ¿Cuántas rutas diferentes son posibles?
Solución:
2-23

Las capitales de los diferentes 28 estados se pueden arreglar en 28! maneras, de tal
forma el número de diferentes rutas es 28! = 3.049x1029.
Ejemplo #37. En la facultad de ingeniería, en cierta oficina, los escritorios de 4
becarias se ponen en línea contra una pared. Cada becaria se puede sentar en cualquier
escritorio. ¿Cuántos arreglos para sentar a las becarias son posibles?
Solución:
Usando n! = 4! = (4)(3)(2)(1) = 24
Diagramas de árbol
En las reglas de producto o regla de multiplicación se puede usar una configuración
llamada diagrama de árbol, para representar esquemáticamente, todas las posibilidades
y calcular cualquier probabilidad en los resultados obtenidos del diagrama de árbol.
De esta manera, los espacios muestrales pueden describirse gráficamente en términos
de un diagrama de árbol.
Ejemplo #38. Supóngase que una computadora pueda seleccionar, aleatoriamente, uno
de dos factores, Rh (positivo y negativo) y uno de tres tipos de sangre. Calcular la
probabilidad de sacar un factor Rh positivo con tipo de sangre A.
Solución:
Usando la regla de multiplicación n1 n2 = (2) (3) = 6 se hace este cálculo. Sin embargo,
aquí es difícil visualizar las combinaciones calculadas en la probabilidad. No obstante,
el uso de un diagrama de árbol simplifica esta tarea.
Ejemplo #39. Con relación al problema anterior hacer un diagrama de árbol para
relacionar el factor Rh y el tipo de sangre.
Solución:
2-24

Factor Rh Tipo de sangre Resultado

A +A
+ O +O
B +B
A -A
- O -O
B -B
Figura 2.3. Diagrama mostrando el factor Rh, el tipo de sangre y el resultado.

Del diagrama de árbol de arriba podemos ver que el espacio muestral es:
S = {+A, +O, +B, -A, -O, -B)
Examinando esta situación vemos qué, una sola rama corresponde a: +A. Por lo tanto,
la probabilidad de sacar este arreglo es de 1/6.
Ejemplo #40. Supóngase que se quiera encontrar la probabilidad de un infante, que sea
una hembra con ojos azules. Asumir que la probabilidad de varones y hembras es
igual y que puedan salir con colores de ojos cafés, verdes, azules o castaños.
Solución:
Usando la regla de productos da: n1 n2 = (2) (4) = 8. La probabilidad de una hembra
con ojos azules es 1/8.
Pero, haciendo un diagrama de árbol simplificamos el cálculo de la probabilidad de
sacar una hembra con ojos azules.
2-25

ojos cafés ojos cafés
ojos azules ojos azules

varón hembra
ojos verdes ojos verdes
ojos castaños ojos castaños
Figura 2.4. Diagramas de árbol para varones y hembras. El espacio muestral S da 8

posibilidades. De manera que, la probabilidad de una hembra de ojos azules es de 1/8.
Ejemplo #41. Considérese el lanzamiento de una moneda tres veces (o el lanzamiento

de tres monedas a la vez). Hacer los siguientes enunciados:
(a) Usar un diagrama de árbol para representar el número de resultados experimentales
y el espacio muestral.
(b) Calcular la probabilidad de que caigan exactamente 3 soles (caras)
(c) Calcular la probabilidad de que caigan cuando menos 2 soles.
(d) Calcular la probabilidad de que caigan a lo más 2 águilas.
(e) Calcular la probabilidad de cada uno de los resultados del espacio muestral.
Solución:
(a) La figura de abajo muestra el diagrama de árbol del experimento de lanzar las tres
monedas simultáneamente.
2-26

Etapa 1 Etapa 2 Etapa 3

Primera moneda Segunda moneda Tercera moneda
Figura 2.5. Diagrama de árbol del experimento de lanzar las tres monedas
simultáneamente, donde S = soles y A = águilas. (Elaboración propia)
Con este diagrama de árbol vemos que hay 8 resultados al lanzar una moneda tres
veces consecutivas o tres monedas simultáneamente. El espacio muestral es:
S = {(SSS), (SSA), (SAS), (SAA), (ASS), (ASA), (AAS), (AAA)}
(b) La probabilidad de caigan exactamente 3 soles es:
P(soles = 3) = 1/8
(c) La probabilidad de que caigan cuando menos 2 soles es:
P(soles ≥ 2) = 4/8 = 1/2
(d) La probabilidad de caigan a lo más dos águilas es:
P(águilas ≤ 2) = resolverse por el lector
(e) La probabilidad de todo el conjunto muestral es: P(S) = 1 o sea:
= P(SSS)+P(SSA)+P(SAS)+P(SAA)+P(ASS)+P(ASA)+P(ASS)+P(AAA)
= 1/8 + 1/8 + 1/8 + 1/8 + 1/8 + 1/8 + 1/8 + 1/8 = 1
2-27

Ejemplo #42. Una pareja de recién casados desea tener 4 hijos.

(a) Enlistar el espacio muestral.
(b) ¿Cual es la probabilidad de tener 3 varones? ¿4 varones?
(c) ¿Cuál es la probabilidad de tener puras hembras? ¿Más de 2 hembras?
Solución:
(a) S = {vvvv, vvvh, vvhv, vvhh, vhvv, vhvh, vhhv, vhhh, hvvv, hvvh, hvhv, hvhh,
hhvv, hhvh, hhhv, hhhh}
(b) P(3 varones) = 2/8 = ¼; P(4 varones) = 1/16
(c) P(puras hembras) = 1/16; P(más de 2 hembras) = 5/16
Permutaciones
Una permutación es un arreglo ordenado de objetos o casos. De esta manera, hasta
ahora se ha discutido, únicamente, las reglas del producto para pares ordenados y la
regla de multiplicación más generalizada. Como se dijo, estas reglas dicen que, los
elementos sucesivos de un k-arreglo se seleccionaron de conjuntos diferentes y con
opciones con reemplazo para el mismo elemento que pueda aparecer más de una vez.
Sin embargo, en el caso de las permutaciones, vamos a considerar un fondo fijo
formado por n distintos elementos y suponiendo que se forma un k-arreglo, al
seleccionar sucesivamente de este conjunto, sin reemplazo, para que un elemento
pueda aparecer a los sumo en una de las k posiciones.
Definición: Una permutación es un arreglo de todos o parte de un conjunto de objetos,
donde el orden es de importancia (en contraste con la combinación en la cual veremos
que el orden no es de importancia).
Teorema 1: El número de permutaciones de objetos tomados todos a un tiempo es n!
Este teorema nos da el número total de todos los objetos tomados todos a un tiempo
(el cual es el espacio muestral).
2-28

Ejemplo #43. Usando una calculadora de bolsillo, evaluar las siguientes

permutaciones: (a) 8P3, (b) 6P4, (c) 15P1, (d) 3P3
Solución:
(a) 8P3 = n! / (n - r)! = 8!/(8 – 3)! = 336
(b) 6P4 = (6)(5)(4)(3) = 360
(c) 15P1 = 15
(d) 3P3 = (3)(2)(1) = 6
Ejemplo #44. El número de permutaciones de las cuatro letras, a, b, c, d (tomadas
todas a un tiempo) es:
n! = 4! = 24
Esta permutación es, realmente, una regla factorial, porque se tomaron todas las letras
a un tiempo.
Teorema 2: El número de permutaciones de n objetos distintos tomados a un tiempo r
(una parte nomás) se da como:
nPr = n! / (n - r)! (2-9)
Ejemplo #45. Dos boletos de la lotería se sacan de 20 para el primero y segundo lugar.
Encontrar el número de puntos muestrales en el espacio. Encontrar también todo el
espacio muestral S.
Solución:
Aquí los objetos son tomados de 2 en 2 es decir, n = 20 y r = 2 y usamos la fórmula:
nPr = n! / (n - r)! = 20P2 = 20!/(20 - 2)!
= 380
Ahora, si queremos todo el espacio muestral quiere decir que los vamos a tomar todos
a un tiempo r. Esto dice que la fórmula:
nP r = n! / (n - r)! se reduce a n! o sea 20! = 2.43x1018.
2-29

Ejemplo #46. ¿De cuántas maneras puede la Sociedad Química Mexicana seleccionar
a 3 conferencistas para 3 conferencias diferentes, si hay únicamente 5 fechas
disponibles?
Solución:
Aquí n = 5 y r = 3 usando nPr = n! / (n - r)! y sustituyendo los valores da:
nPr = n! / (n - r)! = 5P3 = 5! / 2! = 60. En resumen, aquí vemos qué, si queremos todas
las permutaciones posibles o todo el espacio muestral, entonces, usamos n! Pero, si
queremos, únicamente, una parte, usamos nPr = n!/(n - r)!
Ejemplo #47. ¿Cuál es el número de permutaciones de las letras a, b, c tomadas todas
a un tiempo?
Solución:
Seis, v.g., ab, ba, ac, ca, bc, cb
Ejemplo #48. Considérese una carrera de 10 caballos y un premio de exacta para
cualquiera que pueda escoger el orden exacto del primero hasta el décimo lugar.
Asumiendo que todos los caballos tienen la misma oportunidad de ganar, ¿Cuántos
arreglos hay?
Solución:
10P10 = 3,628,800 permutaciones
Ejemplo #49. Bajo las condiciones del problema #7, ¿Cuál es la probabilidad de ganar
si se compra un solo boleto?
Solución:
P(Con un solo boleto) = 1 / 10P10 = 1/3,628,800
= 2.76x10-7
Ejemplo #50. Supóngase que hay 6 partes diferentes para ser almacenadas, pero
solamente, hay 4 cajas disponibles. ¿Cuántas permutaciones son posibles?
2-30

Solución:
Aquí, n = 6 y r = 4, es decir: 6P4 = 360
Teorema 3. El número de diferentes permutaciones de n objetos, de los cuales n1 son
de una clase, n2 son de una segunda clase,...nk son de una k-ésima clase se da como:
n! / (n1! n2!..nk!) (2-10)
Donde: n! es el total de los objetos
Ejemplo #51. ¿De cuántas maneras pueden arreglarse en un cordón eléctrico 3 focos
rojos, 4 amarillos y 2 azules en 9 portalámparas?
Solución:
Usando la regla de partición n!/(n1!n2!..nk!)
Donde, n! = 9, n1 = 3, n2 = 4 y n3 = 2, da:
9! / (3! 4! 2!) = 1260
Ejemplo #52. Un colegio juega 12 juegos durante la temporada. De cuantas maneras
puede el equipo terminar la temporada con 7 juegos ganados, 3 perdidos y 2 empates?
Solución:
Usando la función (2-9) con n! = 12, n1 = 7, n2 = 3 y n3 = 2 y sustituyendo da:
12!/[(7!)(3!)(2!) = 7920
Otra forma de ver las permutaciones es cuando estamos interesados en el
número de maneras de partir un conjunto de n objetos en r subconjuntos llamadas
celdas.
Teorema 4. El número de maneras de partir un conjunto de n objetos en r celdas con n1
elementos en la primera celda, n2 elementos en la segunda y, así sucesivamente, es:
2-31

 n 
  = C = n! / n1! n2!...nr! (2-11)
  n n1,n2..nr
 n1,n2..nr 
Donde:
n1 + n2 + nr = n
Ejemplo #53. En cuántas maneras pueden 7 científicos ser asignados a un cuarto triple
y a 2 cuartos dobles en un hotel.
Solución:
 7 
  = 7! / (3!2!2!) = 210
 3, 2 , 2 
Ejemplo #54. De cuántas maneras se pueden acomodar a 10 viajeros en un hotel

asignándolos en 2 cuartos triples y 3 cuartos dobles?
Solución:
Usando la función (2-11) y sustituyendo da:
10! / (3! 3! 2! 2! 2!) = 12,600
Combinaciones
Una combinación es un arreglo de objetos, sin importar el orden. El número de
combinaciones de n objetos tomados a un tiempo r puede escribirse como nCr.
Teorema: El número de combinaciones de n objetos distintos tomados a un tiempo r es
una combinación; esto es, el número de subconjuntos de tamaño r que pueden
seleccionarse de un conjunto de n objetos distintos donde el orden no es importante
(como en el caso de la permutación, en la cual el orden si es importante). La
combinación se denota por la función:
nCr = n! / r! (n - r)! (2-12)
Donde:
nCr es la combinación, que también se puede denotar como Cnr
2-32

Ejemplo #55. Evaluar 7C4.

Solución:
Usando la fórmula (2-12) nCr = n! / r!(n - r)! y sustituyendo los valores da:
= 7C3 = 7! / 4! 3!
= 35
Ejemplo #56. Un fabricante de llantas hace 10 tipos de neumáticos para diferentes
tamaños y quiere preparar una partida que contenga 6 tipos de llantas. ¿Cuántas
combinaciones de llantas están disponibles?
Solución:
Usamos la función de combinación, la cual es un arreglo de objetos, sin importar el
orden. Aquí se usa nuevamente, la función (2-12) definida como:
nCr = n!/ r!(n - r)! = nPr / r!
Aquí, n = 10, r = 6. Substituyendo estos valores en la función de arriba da:
10C6 = 10! / 6! 4! = 210
Ejemplo #57. Un grupo de tres inspectores va a inspeccionar las actividades de una
industria contaminante. El grupo se va a formar seleccionando los tres agentes de un
grupo de 5. ¿Cuántos grupos diferentes se pueden formar siguiendo un orden
definido? ¿Siguiendo un orden indefinido?
Solución:
Para el primer caso, sería una permutación, porque se quiere un orden definido.
Usando la fórmula nPr = n!/(n - r)! con n = 5 y r = 3 y sustituyendo los valores da:
5P 3 = 5! / (5 - 3)! = 5!/3! = 20
Para el segundo caso, o sea un orden indefinido, sería una combinación, porque el
orden no es de importancia, es decir, usando la fórmula (2-12):
5C3 = 10
2-33

Otra variación de combinación se define como el número de combinaciones de

n objetos tomados 1, 2, 3,... n a un tiempo. De esta manera, en general, para cualquier
íntegro positivo n se da por la función de abajo:
nC1 + nC2 + nC3 + ... + nCn = 2n – 1 (2-13)
Ejemplo #58. Una persona tiene cinco monedas de diferentes denominaciones.
¿Cuántas sumas diferentes de dinero se pueden formar?
Solución:
La moneda se puede seleccionar ya sea una de 5 monedas, dos de 5 monedas,….,
cinco de 5 monedas. Usando la función de arriba (2-13) y sustituyendo los valores
apropiados da:
5C1 + 5C2 + 5C3 + 5C4 + 5C5 = 5 + 10 + 10 + 5 + 1
= 31
Otra forma de hacer este problema sería razonando de la siguiente manera. Cada
moneda se puede manejar de dos maneras, a medida que se selecciona o no se
selecciona. Debido a que cada una de las dos maneras de tratar con una de las
monedas es asociada con dos maneras de usar, con cada una de las otras monedas, el
número de maneras de tratar con las cinco monedas es usando la relación 25 maneras.
Pero la cantidad 25 maneras incluye el caso en el cual ninguna moneda se selecciona.
Por lo tanto, el número requerido de sumas de dinero es de 25 – 1 = 31.
Dentro del tópico de combinaciones, también se puede incluir el uso de la regla
hipergeométrica (Pfaffenberger et al. 1987). Siendo así, supóngase que hay n objetos
en un grupo y, que n1 son de un tipo y n2 son de otro tipo. El número de grupos de r
objetos, donde r1 son del primer tipo y r2 son del segundo tipo, que pueden ser
formados por medio de sacar r objetos de n, se da por: n1
n1Cr1 · n2Cr2 donde n1 + n2 = n; r1 + r2 = r (2-14)
2-34

Ejemplo #59.Un reclutador de una firma de empleos ha hecho entrevistas con 10

ingenieros, de los cuales 6 son ingenieros civiles y 4 no. El reclutador quiere emplear
5 de los 10 ingenieros entrevistados. ¿Cuántos grupos posibles de los cinco ingenieros
empleados contendrán exactamente tres ingenieros civiles?
Solución:
Dejar que n1 = 6 y n2 = 4 u usar la regla hipergeométrica (2-14). En el subgrupo de
tamaño r = 5, queremos r1 = 3 ingenieros civiles y r2 igual a los que no son ingenieros
civiles. Entonces, el número de grupos de tamaño 5 de esta categoría es:
6! 4!
6C3·4C2 = ————— · ————— = (20)(6) = 120
3!(6 – 3)! 2!(4 – 2)!
Aquí nótese que la regla hipergeométrica es “poniendo juntos” el producto y la regla

de combinaciones para obtener el resultado.
Eventos independientes y dependientes.- Dos eventos A y B se dice que son
independientes si la ocurrencia de A no afecta la probabilidad de la ocurrencia de B, es
decir:
P(A|B) = P(A) (2-15)
o bien P(B|A) = P(B) (2-16)
Eventos dependientes.- Si la ocurrencia o no ocurrencia de A, afecta la probabilidad
de ocurrencia de B, entonces, los eventos son dependientes. Además, para tres eventos
independientes, digamos, E1, E2, E3 la probabilidad es:
Pr{E1E2E3} = Pr{E1}Pr{E2|E1}Pr{E3|E1E2}.
Ejemplo #60. Se selecciona aleatoriamente una carta de una baraja común de 52
cartas. Si A es el evento de que la carta elegida sea un as y B sea el evento de que sea
un corazón, entonces, A y B son eventos independientes, ya que P(AB) = 1/52, P(A) =
2-35

4/52 y P(B) = 13/52. Esto se debe a que hay 4 ases y 13 cartas de corazones.
Ejemplo #2. Considerar el espacio muestral S = {A, B, C, D), donde P(A) = P(D) = .3
y P(B) = P(C) = .2. (Keller et al. 1990)
(a) Siendo así, definir los eventos:
1 = {A, B}
2 = {B, C}
3 = {C, D}
(b) ¿Cuál de los siguientes pares de eventos son independientes o dependientes?
(b) 1 y 2
(c) 2 y 3
(d) 1 y 3
Solución:
(a) 1 = {A, B} = .3, .2
2 = {B, C} = .2, .2
3 = {C, D} = .2, .3
(b) Los eventos 1 y 2 son independientes
(c) Los eventos 2 y 3 son independientes
(d) Los eventos 1 y 3 son dependientes
2-36

Regla multiplicativa para eventos dependientes e independientes

En algunas ocasiones se pueden resolver problemas de probabilidad, por medio de
contar el número de puntos en un espacio muestral, el cual se refiere como la regla
multiplicativa. La regla multiplicativa o de conteo de número de puntos en un espacio
muestral se usa en este caso. Sin embargo, podemos ver que esta regla aplica para dos
eventos dependientes y para dos eventos independientes. Esta regla de multiplicación
es sugerida por la definición de probabilidad condicional arriba descrita. Esta regla de
probabilidad condicional se da como:
P(A|B) = P(A|B)/P(B), P(B) ≠ 0 (2-17)
Podemos reescribir esta ecuación para obtener:
P(A|B) = P(B) P(A|B) (2-18)
La regla multiplicativa para dos eventos dependientes es:
P(A y B) = P(A) P(B|A) y P(A y B) = P(B) P(A|B) (2-19)
Que finalmente, también se escribe como:
P(A ∩ B) = P(B) P(A|B) (2-19a)
= P(A) P(B|A) (2-20b)
Donde:
P(A|B) se refiere a la probabilidad condicional de que el evento A ocurra dado que B
ya ocurrió y P(B|A) se refiere a la probabilidad condicional de que el evento B ocurra
dado que A ya ocurrió.
En verdad, la regla multiplicativa para eventos dependientes es la probabilidad
de la intersección (A|B) de dos eventos A y B. Esto dice que, la probabilidad de
ocurrencia conjunta de evento A y evento B es igual a la probabilidad condicional de
A dado B por la probabilidad marginal de B.
La regla multiplicativa para dos eventos independientes es:
2-37

P(A y B) = P(A) P(B) (2-21)

O bien P(A ∩ B) = P(A) P(B) (2-21a)
Ejemplo #61. Entre 3 discos de computadora uno está defectuoso. Dos de ellos se
seleccionan aleatoriamente, pero el primero es reemplazado, antes de sacar el segundo
disco. ¿Cuál es la probabilidad de que ambos discos estén buenos?
Solución:
Dejemos que A sea el evento de sacar un disco bueno y, B, el evento de sacar un
segundo disco bueno. Entonces, la probabilidad de A es P(A) = 2/3 y la probabilidad
de B es P(B) = 2/3. Debido a que hay reemplazo, esto nos lleva a la regla
multiplicativa de eventos independientes. Por lo tanto:
P(A y B) = P(A ∩ B) = P(A) P(B)
= (2/3)(2/3) = 4/9
Ejemplo #62. Veinte unidades de un producto manufacturado se sitúan en un depósito.
Dos de estas unidades están defectuosas. Si se inspeccionan todas las 20 unidades,
¿cuál es la probabilidad de seleccionar (aleatoriamente), las 2 unidades defectuosas?
Solución:
Dejar que A sea la primera unidad defectuosa y B la segunda unidad defectuosa.
Entonces, queremos encontrar la probabilidad de intersección de los dos eventos, es
decir, (A ∩ B). Los eventos son claramente dependientes, porque la probabilidad de
que la segunda unidad sea defectuosa depende de que si la primera unidad sea o no
defectuosa. Aquí: P(A) = 2/20 y P(B/A) = 1/19 Sustituyendo estos valores en la
función de la regla de multiplicación para eventos dependientes da:
P(A ∪ B) = P(A) P(B/A)
= (2/10)(1/19)
= 0.00526
2-38

Nota: La probabilidad condicional P(B/A) es igual a 19, porque si A ocurre (una

unidad defectuosa seleccionada en la primera sacada), entonces, quedarán solamente
19 unidades para ser seleccionadas en la segunda sacada. Por lo tanto, la probabilidad
de seleccionar las 2 unidades defectuosas es de 0.00526, la cual es muy improbable, es
decir, ¡5 oportunidades en 1,000!
Por otra parte, la regla multiplicativa para eventos independientes se define
como:
P(A ∩ B) = P(A) P(B) (2-22)
Ejemplo #63. Supóngase que en una caja hay 20 fusibles, de los cuáles 5 están
defectuosos. Si se seleccionan 2 fusibles aleatoriamente, en sucesión, ¿cuál es la
probabilidad de que los 2 fusibles seleccionados estén defectuosos?
Solución:
Dejemos que A sea el evento de sacar el primer fusible defectuoso y, B, sea el evento
de sacar el segundo fusible defectuoso. Si interpretamos A ∩ B como el evento de
que A ocurre y B el evento después de que A ocurrió, entonces, la probabilidad de A
es P(A) = 5/20 y, la probabilidad de B es P(B) = 4/19. Por lo tanto,
P(A ∩ B) = P(A) P(B|A)
= (5/20)(4/19)
= 1/19
Ejemplo #64. En los juegos de los dados (honestos) la suma de un total de 7 puntos de
los dos dados gana. ¿Cuál es la probabilidad de que un jugador lance dos 7
consecutivos?
Solución:
Los dos eventos son independientes, porque el resultado del segundo lanzamiento no
afecta al resultado del primero. Aquí el espacio muestral es de (36)(36) = 1,296 y la
2-39

probabilidad de sacar la suma de 7 es de 6, es decir, (2+5, 5+2, 3+4, 4+3, 1+6, 6+1).
Usando la regla multiplicativa para eventos independientes da:
P(A ∩ B) = P(A) · P(B)
= (6/36)(6/36) = 1/36
Ejemplo #65. ¿Cuántos puntos muestrales hay en un espacio muestral, cuando un par
de dados se lanzan una vez?
Solución:
El primer dado puede caer en n1 = 6 maneras. Para cada una de estas 6 maneras, el
segundo dado puede caer en n2 maneras. Por lo tanto:
n1 n2 = (6)(6) = 36 maneras posibles
El espacio muestral es:
S = {1-1, 1-2, 1-3, 1-4, 1-5, 1-6, 2-1, 2-2, 2-3, 2-4, 2-5, 2-6, 3-1, 3-2, 3-3, 3-4, 3-5, 3-6,
4-1, 4-2, 4-3, 4-4, 4-5, 4-6, 5-1, 5-2, 5-3, 5-4, 5-5, 5-6, 6-1, 6-2, 6-3, 6-4, 6-5, 6-6}
Regla aditiva para eventos mutuos excluyentes y eventos no mutuos excluyentes
En muchas aplicaciones de la teoría de probabilidad, estamos interesados en combinar
probabilidades de eventos que están relacionados de alguna manera. En este caso se usa
la regla aditiva. Así, la regla aditiva se usa para computar la probabilidad de la unión de
dos eventos. Esta regla aplica para eventos no mutuos excluyentes y, también, para
eventos mutuos excluyentes.
Por ejemplo si A y B son eventos mutuos excluyentes el modelo aditivo es:
P(A ∩ B) = P(A) + P(B) (2-23)
Que también se puede escribir como:
P(A o B) = P(A) + P(B) (2-23a)
Nota. El símbolo P(A o B) se refiere a la probabilidad de cualquiera de los eventos A o
B ocurran o, bien, que ambos ocurran.
2-40

Sin embargo, si los casos A y B no son eventos mutuos excluyentes, el modelo

aditivo es:
P(A ∪ B) = P(A) + P(B) - P(A ∩ B) (2-24)
Esta función también se puede expresar como:
P(A o B) = P(A) + P(B) - P(A y B) (2-25)
Nota: El símbolo P(A y B) se usa para denotar la probabilidad de que ambos eventos A
y B ocurrirán.
Ejemplo #66. ¿Cuál es la probabilidad de obtener un 6 en el primer o segundo
lanzamiento de un dado o, en ambos lanzamientos?
Solución:
Aquí, usamos la regla aditiva para eventos no mutuos excluyentes:
P(A1 o A2) = P(A1) + P(A2) - P(A1 y A2)
O bien P(A o B) = P(A) + P(B) - P(A y B)
Para esto, dejemos que A1 denote el evento de un 6 en el primer lanzamiento y A2 el
evento de un 6 en el segundo lanzamiento. Queremos encontrar la probabilidad de P(A1
o A2), lo cual quiere decir que estamos buscando que el 6 aparezca, ya sea en el primer
lanzamiento o en el segundo lanzamiento o en ambos lanzamientos. De manera que:
P(A1) = 1/6, P(A2) = 1/6 y P(A1 y A2) = 1/36
Substituyendo todos estos valores en la fórmula da:
P(A1 o A2) = 1/6 + 1/6 - 1/36 = 11/36
Ejemplo #67. La probabilidad de que Marina pase matemáticas es de 2/3, y la
probabilidad de que pase el curso de inglés es 4/9. Si la probabilidad de pasar ambos
cursos es de 1/4, ¿cuál es la probabilidad de que Marina pase, cuando menos uno de
estos cursos?
Solución:
2-41

Dejar que A = 2/3 sea el evento de pasar matemáticas y B = 4/9 el evento de pasar
inglés y P(A y B) = 1/4 el evento de pasar matemáticas e inglés, entonces por la regla
aditiva:
P(A o B) = P(A) + P(B) - P(A y B)
P(A ∪ B) = P(A) + P(B) - P(A ∩ B)
P(2/3 o 1/4) = P(2/3) + P(1/4) - P(2/3 y 1/4)
= 2/3 + 4/9 - 1/4 = 31/36
Ejemplo #68. ¿Cuál es la probabilidad de que una carta seleccionada, aleatoriamente, de
un mazo de 52 cartas sea un rey o un corazón?
Solución:
Debido a que hay un traslapado, se usa la regla aditiva para eventos no mutuos
excluyentes P(A o B) = P(A) + P(B) - P(A y B). Siendo así, dejemos que A = un rey
cualquiera y B = precisamente un corazón cualquiera. Por lo tanto, P(A) = 4/52, P(B) =
13/52, P(A y B) rey o corazones = 1/52. Aquí, es lógico que la probabilidad conjunta
(Una probabilidad que mide la verisimilitud de que puedan ocurrir dos a más eventos a
la misma vez), de un rey y un corazón deba de restarse una vez. De no ser así se
incluiría dos veces en encontrar la probabilidad de que una carta seleccionada
aleatoriamente fuera, ya sea un rey o un corazón. Existe un traslapado de resultados, lo
cual quiere decir que existe la probabilidad de que el rey (A) y un corazón (B) ocurran
al mismo tiempo. Por lo tanto:
P(A o B) = P(A) + P(B) - P(A y B)
= 4/52 + 13/52 – 1/52 = 16/52
Ejemplo #69. Este es un problema sacado del libro Statistical Analysis for Decisión
Making de Morris Hamburg (1989), el cual está relacionado con la probabilidad de
obtener un 6 en el primero o segundo lanzamiento de un dado o en ambos lanzamientos.
2-42

Esto es lo mismo que calcular la probabilidad de obtener un 6, cuando menos una vez
en dos lanzamientos de un dado.
Solución:
Dejar que A1 denote la salida de un 6 en el primer lanzamiento del dado y A2 represente
la salida de un 6 en el segundo lanzamiento. Queremos encontrar el valor de P(A1 o A2).
Para esto analicemos los resultados posibles del primero y segundo lanzamiento.
1,1 2,1 3,1 4,1 5,1 6,1

1,2 2,2 3,2 4,2 5,2 6,2
1,3 2,3 3,3 4,3 5,3 6,3
1,4 2,4 3,4 4,4 5,4 6,4
1,5 2,5 3,5 4,5 5,5 6,5
1,6 2,6 3,6 4,6 5,6 6,6
La probabilidad de que un 6 salga en ambos lanzamientos es P(A1 y A2) = 1/36. La

probabilidad de que un 6 salga en el primer lanzamiento es P(A1) = 1/6 y en el segundo
lanzamiento es P(A2) = 1/6. Entonces, aplicando la regla aditiva da:
P(A1 o A2) = P(A1) + P(A2) – P(A1 y A2)
= 1/6 + 1/6 – 1/36
= 11/36
Aquí nótese que es necesario restarle 1/36 para evitar un traslapado.
2-43

Figura 2.6. Las Figuras (a), (b) y (c) muestran el uso de diagramas de Venn para la regla
aditiva, para eventos mutuos excluyentes y no mutuos excluyentes. (Elaboración propia)
Ejemplo #70. Una computadora genera aleatoriamente el último dígito de un número

telefónico. Encontrar la probabilidad de que el resultado sea un 8 o 9 (Triola, 1986).
Solución:
Los resultados de los números 8 y 9 son eventos mutuos excluyentes, por lo tanto, se
usa la función (2-23). Entonces, dejemos que P(A) = 8 y P(B) = 9, y aplicando la regla
aditiva P(A ∩ B) = P(A) + P(B) y sustituyendo da:
P(8 o 9) = P(8) + P(9) – P(8 y 9)
= 1/10 + 1/10 - 0
= 1/5
Ejemplo #71. Si E1 es el evento de sacar un as de un mazo de cartas y E2 es el evento de
sacar un rey, entonces, Pr{E1} = 4/52 y Pr{E2} = 4/52 = 1/13 y la probabilidad de sacar,
ya sea un as o un rey es de: Pr{E1 + E2} = Pr{E1} + Pr{E2} = 1/13 + 1/13 = 2/13.
2-44

Entonces, por lo tanto, debido a que ambos el as y el rey no pueden ser sacados de un
solo tiro, por lo tanto, son eventos mutuos excluyentes y se usa la función (2-23).
Ejemplo #72. Si E1 es el evento de sacar un as y E2 es el evento de sacar una espada,
entonces, E1 y E2 no son eventos mutuos excluyentes debido a que el as de espadas
puede ser sacado. Siendo así, se usa la función (2-25) para eventos no mutuos
excluyentes. Por lo tanto, la probabilidad de sacar ya sea un as o una espada o ambos es:
Pr{E1 + E2} = Pr{E1} + Pr{E2} - Pr{E1E2} = 4/52 + 13/52 - 1/52 = 4/13
Ejemplo #73. ¿Cual es la probabilidad de obtener un seis en el primero o segundo
lanzamiento de un dado o, en ambos lanzamientos de un dado honesto?
Solución:
Aquí, usamos la regla aditiva para eventos no mutuos excluyentes, es decir, la función
(2-25). Para esto dejemos que A1 denote el evento de un seis en el primer lanzamiento y
A2 denote el evento de un seis en el segundo lanzamiento. Queremos encontrar la
probabilidad de P(A1 o A2), lo cual dice que estamos buscando que el número seis
aparezca, ya sea en el primer lanzamiento o en el segundo lanzamiento o en ambos
lanzamientos. Entonces:
P(A1) = 1/6, P(A2) = 1/6 y P(A1 y PA2) = 1/36
Sustituyendo todos estos valores en la función (2-27) da:
P(A ∪ B) = P(A) + P(B) – P(A ∩ B)
P(A1 ∪ A2) = 1/6 + 1/6 – 1/36 = 11/36
Ejemplo #74. ¿Cuál es la probabilidad de que una carta seleccionada, aleatoriamente, de
un mazo de 52 cartas sea un as o un corazón?
Solución:
Aquí, nuevamente, se usa la regla aditiva para eventos no mutuos excluyentes. Para esto
dejemos que A = un as cualquiera y B = precisamente un corazón cualquiera. Usando el
2-45

mazo de 52 cartas (que contiene cuatro 2´s, cuatro 3´s, cuatro 4´s, ………, cuatro 10´s,
cuatro sotas, cuatro reinas, cuatro reyes y cuatro ases, con sus correspondientes figuras
de tréboles, corazones, espadas y diamantes), por lo tanto, para un as cualquiera, P(A) =
4/52 , para un corazón cualquiera, P(B) = 13/52 y, para ases o corazones, P(A y B)
igual a 1/52. Aquí, nuevamente, como en el caso del ejemplo #68 es lógico asumir qué,
la probabilidad conjunta (una probabilidad que mide la probabilidad de que puedan
ocurrir dos o más eventos a la misma vez), de un as y un corazón deba restarse una vez.
De no ser así, se incluiría dos veces en encontrar la probabilidad de que una carta
seleccionada al azar fuera, ya sea un as o un corazón. Existe un sobrepuesto de
resultados, lo cual dice que existe la probabilidad de que el as (A) y un corazón (B)
salgan a la misma vez. Por lo tanto:
P(as o corazón) = P(as) + P(corazón) – P(as y corazón)
= 4/52 + 13/52 – 1/52
= 16/52
Ejemplo #75. En este ejemplo, para ilustrar la ley aditiva de probabilidad, en la cual
existen traslapados, se puede hacer usando diagramas de Venn. Para esto, se hace el
siguiente experimento de lanzar dos monedas. Siendo así, estimar la probabilidad de
sacar, cuando menos una cara, ya sea en el primer lanzamiento o en el segundo
lanzamiento (Smith, 1985).
Solución:
Primeramente, enlistar los cuatro posibles resultados poniendo H = caras y T = a soles,
es decir, HT, HH, TH y TT. Aquí, para evitar un traslapado, se usa la regla aditiva para
eventos no mutuos excluyentes. El diagrama de Venn de abajo ilustra claramente, el
traslapado que pudiera ocurrir, si se sumara la probabilidad de una cara en el primer
lanzamiento, más la probabilidad de una cara en el segundo lanzamiento que daría ½ +
2-46

½ = 1, lo cual sería incorrecto. En este caso, la probabilidad de una cara en el primer

lanzamiento es de 0.5; la probabilidad de una cara en el segundo lanzamiento es 0.5 y,
la probabilidad de caras en ambos lanzamientos es de 0.25. Por lo tanto, la probabilidad
de una cara, ya sea en el primero o segundo lanzamiento es:
P(H o T) = P(H) + P(T) - P(H y T)
=½+½-¼=¾
El traslapado o la representación del potencial de un doble conteo (HH) se da abajo.
Figura 2.7. Figura esquemática mostrando un diagrama de Venn indicando el traslapado

de caras (HH), que ocurre en la intersección de A y B (Smith, 1985).
2-47

Regla multiplicativa para más de dos eventos

Otra regla útil para calcular la probabilidad de un evento es el modelo de la regla
multiplicativa. Esta regla se define como la probabilidad de la ocurrencia conjunta que
el evento A y el evento B sea igual a la probabilidad condicional del evento A dado el
evento B multiplicado por la probabilidad marginal de B.
Teorema 1: Si en un experimento, los eventos dependientes A1, A2, A3,...Ak pueden
ocurrir, entonces:
P(A1 ∩ A2 ∩ A3 ∩ ... Ak) = P(A1)P(A2|A1)P(A3|A1 ∩ A2) ...
...P(Ak|A1 ∩ A2 ∩ ... ∩ Ak-1) (2-26)
Teorema 2: Si los eventos A1, A2, A3,... Ak son independientes, entonces:
P(A1 ∩ A2 ∩ A3... ∩ Ak) = P(A1)P(A2)P(A3)….P(Ak) (2-27)
Ejemplo #76. Tres naipes se sacan en sucesión, sin reemplazo. Encontrar la
probabilidad de que ocurra el evento A1 ∩ A2 ∩ A3, cuando A1 es el evento de que la
primera carta sea un as rojo, A2 sea que la segunda carta sea un 10 o una sota y, A3 sea
el evento de que la tercera carta sea mayor que un 3, pero menor que un 7.
Solución:
Primero vamos a definir los eventos:
A1: la primera carta es un as rojo (aquí, nótese que hay nomás 2 ases rojos)
A2: la segunda carta sea un 10 o una sota (hay cuatro 10´s y cuatro sotas)
A3: la tercera carta sea mayor que 3 pero menor que 7 (hay doce cartas entre el 3 y el 7).
Los valores son: P(A1) = 2/52; P(A2|A1) = 8/51; P(A3|A1 ∩ A2) = 12/50. (Aquí nótese
que, en la primera sacada son 52 cartas, pero en la segunda sacada el número de cartas
baja a 51 y en la tercera sacada baja a 50 cartas).
Por lo tanto:
P(A1 ∩ A2 ∩ A3) = P(A1)P(A2|A1)P(A3|A1 ∩ A2)
2-48

= (2/52)(8/51)(12/50)
= 8/5,525
Ejemplo #77. Hacer el mismo ejemplo #1 de arriba pero, en esta ocasión, con reemplazo
de cartas.
Solución:
Al haber reemplazo de cartas, el problema se reduce a la regla multiplicativa para
eventos independientes. Los valores de las variables son:
P(A1) = 2/52; P(A2) = 8/52; y P(A3) = 12/52
Enseguida, substituyendo los valores en la expresión de abajo da:
P(A1 ∩ A2 ∩ A3) = P(A1)P(A2)P(A3)
= (2/52)(12/52)(12/52)
= 0.002
Ejemplo #78. Cuatro cartas se sacan en sucesión. Encontrar la probabilidad de que la
primera carta sea un rey; la segunda sea un 9 de diamantes; la tercera sea, cuando
menos, una sota (asumiendo que el as sea la última carta) y, la cuarta carta sea un 7
negro.
Solución:
Dejemos que A sea cualquiera de los 4 reyes; B sea precisamente un 9 de diamantes; C
sea igual a doce cartas, es decir, desde la sota hasta el as; y D sea cualquiera de los dos
sietes negros.
Siendo así, P(A) = 4/52, P(B) = 1/51, P(C) = 16/50, P(D) = 2/49
Por lo tanto:
P(A ∩ B ∩ C ∩ D) = (4/52)(1/51)(16/50)(2/49)
= 128/6,497,400 = .00002
Ejemplo #79. Dejemos que un par de dados sean lanzados una sola vez. Las tablas de
2-49

abajo muestran los resultados posibles, las probabilidades y su representación. Hacer

una gráfica que vaya en función de P(X), es decir, 1/36, 2/36, etc. (El estudiante lo
hará). Solución:
TABLA 2.1. Diagrama mostrando la distribución de probabilidades cuando se lanzan
dos dados una sola vez. (Elaboración propia)
No. éxitos | 1 2 3 4 5 6 5 4 3 2 1
Suma (X) |2 3 4 5 6 7 8 9 10 11 12
Probabilidad |1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
TABLA 2.2. Probabilidades cuando se lanzan dos dados. (Elaboración propia)

Suma de los dados Número de éxitos Probabilidad
2 1 1/36
3 2 2/36
4 3 3/36
5 4 4/36
6 5 5/36
7 6 6/36
8 5 5/36
9 4 4/36
10 3 3/36
11 2 2/36
12 1 1/36
2-50

TABLA 2.3. Resultados cuando se lanzan dos dados una sola vez. (Elaboración propia)
Primer dado Segundo dado Resultado Suma de los números

1 1-1 2
2 1-2 3
3 1-3 4
1 4 1-4 5
5 1-5 6
6 1-6 7
1 2-1 3
2 2-2 4
3 2-3 5
2 4 2-4 6
5 2-5 7
6 2-6 8
1 3-1 4
2 3-2 5
3 3-3 6
3 4 3-4 7
5 3-5 8
6 3-6 9
1 4-1 5
2 4-2 6
3 4-3 7
4 4 4-4 8
5 4-5 9
6 4-6 10
1 5-1 6
2 5-2 7
3 5-3 8
5 4 5-4 9
5 5-5 10
6 5-6 11
1 6-1 7
2 6-2 8
3 6-3 9
6 4 6-4 10
5 6-5 11
6 6-6 12
2-51

2.1. Si una moneda tiene dos caras denotadas por águilas o soles, ¿cuál es la
probabilidad de que salga un sol? (0.5)
2.2. En el caso de un dado que tiene 6 números o caras, entonces, si el dado es honesto,
todas los números del 1 al 6 tienen la misma probabilidad de caer. Entonces, ¿cuál es la
probabilidad de sacar un 1?
2.3. En el lanzamiento de un dado, ¿cuál es la probabilidad de que se muestren los
números 3 o 4? ¿Cuál es la probabilidad de no sacar un 3 o un 4? (2/3)
2.4. Si una persona es seleccionada al azar de un grupo de 20 psicólogos y 30
sociólogos, ¿cuál es la probabilidad de seleccionar un sociólogo?
2.5. ¿Cuál de los siguientes no es una probabilidad? 3/7, 2, -1/2, 3/4, 99/101, 0, 1, 5,
1.11, 1.0001, 0.0001, 0.001, 0.9999. (2, 5, 1.11, 1.0001
2.6. La probabilidad de que Juan esté vivo en 20 años es de 0.7 y la probabilidad de que
Pedro esté vivo en 20 años es 0.5. ¿Cuál es la probabilidad de que ambos estén vivos en
20 años?
2.7. Si E1 y E2 sean los eventos de "caras del quinto lanzamiento" y "caras en el sexto
lanzamiento" de una moneda, entonces, los eventos E1 y E2 son eventos independientes.
¿Cuál es la probabilidad de que salgan caras en ambos lanzamientos? (1/4)
2.8. ¿Cuál es la probabilidad de sacar cuando menos un 6 en dos lanzamientos de un
dado honesto? Sugerencia: Usar la regla de adición.
2.9. Asumiendo que los varones y las hembras ocurran igualmente y que el sexo de
cualquier hijo sea independiente de cualquiera de los hermanos o hermanas, encontrar el
espacio muestral y encontrar la probabilidad de que una pareja con 3 hijos tendrán:
(a) exactamente 2 varones. (3/8)
(b) Exactamente 2 hembras. (3/8)
2-52

(c) Cuando menos 2 varones (P(X ≥ 2))

2.10. Lanzar una moneda 2 veces. Encontrar los siguientes eventos:
(a) Encontrar el espacio muestral.
(b) Encontrar la probabilidad de que salgan exactamente una cara y un águila.
2.11. Encontrar el número de permutaciones de las letras a, b, c tomadas dos a un
tiempo. (6)
2.12. Encontrar el número de combinaciones de las letras a, b, c tomadas dos a un
tiempo.
2.13. Para dos eventos A y B, P(A) = 0.10, P(B) = 0.40 y P(A ∩ B) = 0.05. Determinar:
(a) P(A|B) (0.125)
(b) P(B|A). (0.50)
2.14. Si P(B) = 2750/10,000 y P(A ∩ B) = 0.14, encontrar P(A|B).
2.15. Dejemos que E sea el evento de que, los números pares de un dado, sean 2, 4, 6.
Encontrar la probabilidad de que salgan estos eventos. (1/2)
2.16. Un grupo de consumidores consiste de 80 estudiantes, 30 de los cuales son
mujeres. Si un estudiante es seleccionado aleatoriamente de este grupo, encontrar la
probabilidad de no escoger a una mujer.
2.17. De los siguientes eventos decir cuales eventos son mutuos excluyentes:
(a) Seleccionando un estudiante quien atiende las clases de estadística regularmente.
Seleccionando un estudiante quien posee una computadora.
(b) Seleccionando a una persona con pelo rubio.
Seleccionando a una persona con ojos cafés.
(c) Seleccionando un curso académico requerido. (evento mutuo excluyente)
Seleccionando un curso electivo
2.18. La probabilidad de que un vuelo de avión salga a tiempo es de P(D) = 0.83; la
2-53

probabilidad de que el vuelo llegue a tiempo es de P(A) = 0.82; y, la probabilidad de

que salga a tiempo y llegue a tiempo es de P(D ∩ A) = 0.78. Asúmase una probabilidad
condicional. Encontrar la probabilidad de que el avión:
(a) Llegue a tiempo dado que partió a tiempo.
(b) Salga a tiempo dado que arribó a tiempo.
2.19. Supóngase que una caja contiene 3 bolas blancas y 2 bolas negras. Asúmase que
no hay reemplazo y, por lo tanto, son eventos dependientes. Siendo así, calcular los
siguientes enunciados:
(a) ¿Cuál es la probabilidad de que la primera bola sacada sea negra? (2/5)
(b) ¿Cuál es la probabilidad de la segunda bola sacada sea negra dado que la primera
bola sacada fue negra? (1/4)
(c) ¿Cuál es la probabilidad de que ambas bolas sacadas sean negras? (1/10)
2.20. Usando la figura de abajo y la simbología de diagramas de Venn definir las
siguientes regiones:
(a) Regiones 1 y 2
(b) Regiones 1 y 3
(c) Regiones 1, 2, 3, 4, 5, y 7
(d) Regiones 4 y 7
(e) Región 1
(f) Regiones 2, 6, 7
2-54

Figura mostrando los diagramas de Venn. (Fuente: Montgomery et al.1996)
2.21. Supóngase que se estudian 10,000 personas de 20 años y se encuentra que 9961
vivieron 21 años. Encontrar la probabilidad de que una persona de 20 años vaya a vivir
21 años. (.9961)
2.22. Un estudio encuestó a un grupo de 100 profesionistas que consistía de 40
ingenieros (de los cuales la mitad eran mujeres) y a 60 arquitectos (de los cuales la
mitad eran mujeres). Encontrar la probabilidad de que un profesionista seleccionado
aleatoriamente sea ingeniero o mujer. Asumir una regla aditiva.
2.23. ¿Cuál es la probabilidad de que una carta seleccionada al azar de un mazo de 52
naipes sea una reina o un corazón? Asumir una regla aditiva para eventos no mutuos
excluyentes (4/13)
2.24. ¿Cuál es la probabilidad de sacar un 6 en el primero o segundo lanzamiento de un
dado honesto o, en ambos lanzamientos?
2.25. Un ingeniero fabricante de motores le preocupan tres tipos de principales defectos.
Por ejemplo, A es el evento en el que el eje del motor es demasiado grande, B el evento
en el que las bobinas son inadecuadas y C el evento en el que las conexiones eléctricas
son insatisfactorias. De ser así, expresar verbalmente qué eventos están representados
por las siguientes regiones del diagrama de Venn. (Johnson, 1997)
2-55

(a) Región 2. (Dado que la región 2 está en A y B, pero no en C, esto dice que, el eje es
demasiado grande y las bobinas son inadecuadas)
(b) Región 1 y 3 juntas
(c) Regiones 3, 5, 6 y 8 juntas (Debido a que todas estas regiones están fuera de la
región A, esto representa el evento en que el eje es demasiado largo o defectuoso)
Figura mostrando los espacios muestrales y eventos. (Fuente: Johnson 1997)

2.26. Refiriéndose al problema anterior representar con símbolos de Venn las siguientes
regiones:
(a) 4, 6, 7
(b) 1,4
(c) 1, 2, 5, 7
(d) 1, 2
(e) 1, 3, 4.
2.27. En estudios de higiene industrial y seguridad de obreros de una industria se
descubrió que el 8% necesitaron botas de hule para protección contra descargas
eléctricas, 15% necesitaron cascos protectores para la cabeza y, 3% necesitaron, ambos,
botas de hule protectoras y cascos protectores para la cabeza. ¿Cuál es la probabilidad
2-56

de que un trabajador seleccionado, al azar, necesitará, ya sea, botas protectoras de hule o

cascos protectores para la cabeza? Sugerencia: usar el modelo aditivo. (0.20)
2.28. Se lanza una moneda dos veces. Encontrar la probabilidad de sacar una cara, ya
sea en el primer lanzamiento o segundo lanzamiento o en ambos lanzamientos. Asumir
que H = caras, T = águilas.
2.29. Una computadora genera, aleatoriamente, el último dígito de un número
telefónico. Calcular:
(a) La probabilidad de que el resultado sea un 8 o 9. (1/5)
(b) La probabilidad de que el resultado sea un número non o menor que 4. (0.7)
2.30. Encontrar la probabilidad de sacar un total de 7 o 11 cuando un par de dados se
lanzan.
2.31. ¿La probabilidad de sacar un as o un rey de un mazo de 52 cartas? (2/13)
2.32. Cuál es la probabilidad de sacar, ya sea un as o una espada o ambos en una sacada
de cartas de un mazo de 52 naipes.
2.33 ¿Cuántas comidas consistentes de una sopa, un emparedado, un postre y un
refresco son posibles, si podemos seleccionar 4 sopas, 3 tipos de emparedados, 5 postres
y 4 refrescos? (240)
2.34. Dos monedas se lanzan. ¿Cuál es la probabilidad de que ambas monedas caigan en
águilas? Usar regla multiplicativa.
2.35. Una pareja de recién casados planea tener 3 hijos. Encontrar los siguientes
enunciados:
(a) La probabilidad que todos los hijos sean hombres. (1/8)
(b) La probabilidad de 3 hembras. (1/16)
(c) La probabilidad de exactamente 2 varones. (3/8)
(d) La probabilidad de 3 varones y 3 hembras. (1/64)
2-57

(e) La probabilidad de tener a lo más 2 varones. (3/8)

(f) La probabilidad de tener cuando menos 2 varones. (4/8)
Asumir que los varones y las hembras tienen la misma oportunidad y que el sexo de
cada hijo sea independiente del sexo del otro. Hacer un diagrama de árbol para facilitar
el cómputo.
2.36. Con referencia al problema anterior, si la familia fuera de 4 hijos, ¿cuál sería la
probabilidad de fueran 4 varones y/o 4 hembras?
2.37. Se sacan dos cartas al azar de un mazo de 52 naipes. ¿Qué probabilidad hay de
obtener dos ases si?
(a) La primera carta es repuesta antes de sacar la segunda carta. (1/69)
(b) La primera carta no es repuesta antes de sacar la segunda carta. Asumir una regla
multiplicativa. (12/2652)
2.38. Hay 10 rollos de película en una caja y 3 están defectuosos. Se sacan 2 rollos uno
detrás del otro. ¿Cuál es la probabilidad de seleccionar un rollo defectuoso seguido por
otro rollo defectuoso, sin no hay reemplazo? Usar regla multiplicativa.
2.39. Responder a las siguientes preguntas;
(a) ¿Cuántos resultados hay en un espacio muestral, cuando se lanzan un par de dados
una sola vez? (36)
¿Cuál es éste?
(b) ¿Cuántos puntos muestrales hay en un espacio muestral cuando se lanzan 3 dados
simultáneamente?
2.40. Un diseñador de una nueva subdivisión ofrece a los compradores de casas, una
selección de estilos exteriores de inglés, rústico, colonial, y exterior tradicional
combinados con tipos de rancho, de dos pisos y un desnivel. ¿De cuántas maneras se
puede ordenar una de estas casas con esos estilos de construcción? Hacer un diagrama
2-58

de árbol. Sugerencia: usar la regla del producto n1n2. (12)
2.41. Un estudio de tráfico vehicular indica que de 3,756 autos que se acercan a la plaza,
857 entran en el aparcamiento. ¿Cuál es la probabilidad de que un auto no entre en el
aparcamiento? (P(857) = 0.23, q = ?)
2.42. En una prueba la primera pregunta es de falso y verdadero y, la segunda pregunta
es de selección múltiple con posibles respuestas de a, b, c, d, e. (a) ¿Cuántas secuencias
de posibles respuestas hay en estas dos preguntas? (b) Usar un diagrama de árbol y
enlistar el espacio muestral. (10)
2.43. En el diseño de un sistema de computadora, si un byte se define como una
secuencia de 8 bits y, cada bit debe ser 0 o 1, ¿cuántos bytes diferentes son posibles?
2.44. Explique en sus propias palabras lo que significan los siguientes términos:
(a) Experimento aleatorio
(b) Espacio muestral
(c) Evento
2.45. Hablando de factoriales, evaluar 50! Sugerencia: usar la aproximación de Sterling:
n! ~ √2πn nn e-n (3.04x1064)
2.46. Se lanza una moneda 3 veces consecutivas. Hacer un diagrama de árbol con los
resultados de soles y águilas y el espacio muestral. Calcular lo siguiente:
(a) Número de soles es cuando menos 2.
(b) Segundo lanzamiento son soles.
(c) El número de soles es exactamente 2.
(d) Segundo lanzamiento son águilas.
(e) Todos los lanzamientos muestran la misma imagen.
(f) El número de soles es menor que 2.
2-59

(g) El segundo lanzamiento no son soles.

(h) El número de soles es de cuando menos 2.
(i) El número de soles es no más de 3.
(j) El número de águilas es a lo más 3.
(k) El número de soles que excedan el número de águilas.
2.47. ¿De cuántas maneras diferentes una sección sindical con 25 miembros puede
elegir un presidente y un vicepresidente? (600)
2.48. Si un dado se lanza 3 veces consecutivas, ¿Cuál es la probabilidad de que salga un

3?
2.49. Se seleccionan 3 cartas, sucesivamente, de un mazo de 52, entonces, encontrar el
número de resultados si:
(a) Hay reemplazo (140,608)
(b) Si no hay reemplazo (132,600)
2.50. ¿De cuántas maneras pueden acomodarse 5 canicas de diferentes colores en una
fila?
2.51. ¿Calcular de cuántas maneras pueden formarse seis personas para subir a un
autobús? (720)
2.52. Un candidato presidencial planea hacer campaña política. Encontrar el número de
permutaciones si:
(a) Planea visitar todos los estados de la República Mexicana.
(b) Planea visitar únicamente los estados que colindan con los Estados Unidos.
2.53. Evaluar los siguientes factoriales:
(a) 7! (5040)
(b) 70!/68! (100)
2-60

(c) 10!/0! (3,628,800)

2.54. Supóngase que hay 50 personas compitiendo por 3 rangos diferentes, primero,
segundo y tercero. ¿Cuál es el número de resultados de las 50 personas, si las tomamos
3 a un tiempo (es decir, de 3 en 3)?
2.55. En cierta compañía, 4 escritorios de secretarias se sitúan en línea contra la pared.
Cada secretaria puede sentarse en cualquier banco de los escritorios. ¿Cuántos arreglos
se pueden hacer para sentar a las secretarias? (24)
2.56. En un almacén hay 5 cajas adyacentes para almacenar 5 objetos diferentes. El
depósito de cada objeto puede almacenarse satisfactoriamente en una caja. ¿De cuántas
maneras pueden asignarse 5 objetos a 5 cajas?
2.57. Supóngase que hay 6 partes diferentes para ser almacenadas, pero solamente, hay
4 cajas disponibles. ¿Cuántas permutaciones son posibles? (360)
2.58. ¿De cuántas maneras diferentes se puede realizar una primera, segunda, tercera
o cuarta selección entre 12 empresas arrendadoras de equipo de control de
contaminación ambiental?
2.59. Contestar lo siguiente.
(a) ¿Cuál es el número de permutaciones de las letras a, b, c, es decir, tomadas dos a un
tiempo? (6)
(b)¿Cuáles son estas letras? (ab, ba, ac, ca, bc, cb)
2.60. Un mecanismo electrónico de control requiere de 5 chips de memoria idénticos.
¿De cuántas maneras puede inhabilitarse este mecanismo colocando los 5 chips en las 5
posibles posiciones dentro del controlador?
2.61. Se requiere sentar a 5 hombres y 4 mujeres en una fila de tal manera que las
mujeres ocupen lugares pares. ¿Cuántos arreglos hay? (2880)
2.62. Un aparato de seguridad de un negocio con 10 botones se inhabilita cuando 3
2-61

botones diferentes se oprimen en la secuencia apropiada (los botones no pueden

oprimirse dos veces). Si el código correcto se olvida, ¿Cuál es la probabilidad de
desarmar el aparato a través de oprimir, aleatoriamente, 3 botones?
2.63. Se sacan 2 boletos de la lotería entre 20 posibles para el primero y segundo
premios. ¿Cuál es la probabilidad de ganar comprando un boleto? (1/380)
2.64. En una carrera de 8 perros se juega un premio de exacta. Si seleccionamos 3
números de perros, ¿cuál es la probabilidad de acertar comprando un solo boleto?
2.65. Considérese una carrera de 10 caballos con un premio de exacta para cualquiera
que pueda seleccionar el orden exacto y de ganar desde el primero hasta el décimo
lugar.
(a) ¿Cuántas permutaciones posibles hay? (3,628,800)
(b) ¿Cuál es la probabilidad de ganar si se compra un solo boleto? (2.7x10-7)
(c) ¿Cuál es la probabilidad de seleccionar los tres primeros lugares? (1/10P3)
2.66. Una prueba se compone de 12 preguntas de falso y verdadero. ¿De cuántas

maneras diferentes un estudiante puede marcar el papel con una respuesta para cada
pregunta?
2.67. ¿De cuántas maneras pueden 3 focos rojos, 4 focos amarillos y 2 focos azules ser
arreglados en un cordón eléctrico con 9 portalámparas? (1260)
2.68. ¿Cuál es el número de permutaciones de la palabra "estadística"?
2.69. Cinco canicas rojas, 2 canicas blancas y 3 azules se arreglan en una fila. Si todas
las canicas son del mismo color, y no se puede distinguir una de la otra, ¿cuántos
arreglos pueden hacerse? (2420)
2.70. ¿De cuantas maneras pueden 7 científicos ser asignados a un cuarto triple y a dos
cuartos dobles? Asumir regla de partición.
2-62

2.71. De un grupo de 4 químicos y 3 físicos, encontrar el número de comités que se

pueden formar consistentes de 2 químicos y 1 físico. Sugerencia: usar un producto de
combinaciones. (18)
2.72. Un equipo de colegio juega 12 juegos durante la temporada. ¿De cuántas maneras
puede el equipo terminar la temporada con 7 juegos ganados y 3 perdidos? Sugerencia
usar la regla de partición de permutaciones.
2.73. Considerar un grupo de 5 personas consistentes de 3 hombres y 2 mujeres, todos
pertenecientes a una organización. Siendo así, contestar lo siguiente:
(a) ¿Cuántos comités de 3 personas pueden formarse de todo el grupo? (10)
(b) ¿De cuántas maneras pueden las 2 posiciones, presidente y vicepresidente ser
formados? (20)
(c) ¿Cuál es la probabilidad de que un comité de 2 personas seleccionadas,
aleatoriamente, consistieran de 1 hombre y 1 mujer? (6/10)
2.74. ¿Cuántas manos de 5 cartas de flor imperial (la flor imperial consiste de sacar 10,
sota, reina, rey, as de un solo palo, es decir, de tréboles, corazones, diamantes y
espadas) son posibles de una mazo de 52 cartas, en las cuales el orden no es de
importancia?
2.75. Si queremos saber la probabilidad de sacar una flor imperial de un mazo de 52
cartas, a sabiendas de que se pueden formar 4 flores imperiales (10, sota, reina, rey, as
de cada una de las cuatro formas, es decir, tréboles, espadas, diamantes, corazones)
entonces, calcular esta probabilidad. (1.54x10-6)
2.76. En la lotería de Texas se juegan 54 números y se seleccionan solamente 6 de ellos.
(a) ¿Cuántas combinaciones se pueden hacer?
(b) ¿Cuál es la probabilidad de acertar comprando un solo boleto?
(c) ¿Cuál es la probabilidad de acertar comprando un millón de boletos?
2-63

2.77. Supongamos que de todos los individuos que compran una computadora personal,
60% incluyen un programa de procesador de palabras en su compra, 40% incluye un
programa de esparcimiento de hojas (LOTUS) y 30% incluye ambos programas.
(a) ¿Cuál es la probabilidad de seleccionar un comprador que incluya un programa de
procesador de palabras, dado que incluya un programa de LOTUS? Usar un diagrama
de Venn. (0.75)
(b) ¿Cuál es la probabilidad de que un comprador incluya un programa de LOTUS,
dado que incluya un programa de procesador de palabras?
(0.5) 2.78. Una revista de publicaciones publica tres columnas intituladas Arte (A),
Libros (B), Cinema (C). La selección aleatoria de un comprador de revistas, con
respecto a estas tres columnas se da abajo (elaboración propia):
Leídas regularmente | A B C A∩B A∩C B∩C A∩B∩C
Probabilidad | .15 .24 .47 .09 .08 .15 .07
Calcular y hacer un diagrama de Venn para:

(a) La probabilidad de que lea la revista Arte (A), dado que leyó la revista Libros (B).
(b) La probabilidad de leer la revista Arte (A), dado que leyó las revistas Libros (B) y
Cinema (C).
(c) La probabilidad de leer la revista Arte (A), dado que haya leído cuando menos una.
2.79. Supongamos que P(A) = .5, P(B) = .4, P(A ∩ B) = .25. Hacer los siguientes
cómputos y usar un diagrama de Venn.
(a) P(B|A) (.5)
(b) P(B’|A) (.5)
2-64

(c) P(A|B) (.625)

(d) P(A’|B) (.375)
(e) P(A ∪ B) (.9)
2.80. Una firma de consultoría ambiental presenta licitaciones para la construcción de
tres proyectos de plantas de tratamiento de aguas residuales. Dejemos A = proyecto i
conferido para i = 1, 2, 3. Supóngase que:
P(A1) = .22
P(A2) = .25
P(A3) = .28
P(A1 ∩ A2) = .11
P(A1 ∩ A3) = .05
P(A2 ∩ A3) = .07
P(A1 ∩ A2 ∩ A3) = .01
Encontrar:
(a) A1 ∪ A2
(b) A’ ∩ A2
Sugerencia: usar A’ ∩ A2 = (A1 ∪ A2)’ = 1 - P(A1 ∪ A2)
(c) A1 ∪ A2 ∪ A3
(d) A1' ∩ A2 ∩ A3
Sugerencia: usar 1 - P(A1 ∩ A2 ∩ A3)
2.81. Considérese un grupo de 5 personas consistentes en 3 hombres y 2 mujeres, todos
los cuales pertenecientes a una organización. Siendo así, encontrar los siguientes
enunciados.
(a) ¿Cuántos comités de 3 personas pueden formarse? (5C3)
(b) Decir de cuantas maneras pueden formarse las posiciones de presidente y
2-65

vicepresidente. (5P2)
(c) Decir la probabilidad de que un comité de 2 personas consistirán de 1 hombre y 1
mujer. ([3C1·2C1]/5C2)
2.82. ¿Cuál es la probabilidad de sacar una flor corrida, es decir, 5 cartas de una sola
denominación, que no incluyan del 10 al as? Ver Figura 2.6.
2.83. En el juego de póquer de 5 cartas, existen un total de 52 cartas que van desde el 2,
3, 4, 5, 6, 7, 8, 9, 10, J, Q, K, As y cada una de estas cartas, tienen 4 figuras, es decir,
tréboles, diamantes, espadas y corazones. Tomando en consideración esto, ¿Cuál es la
probabilidad de sacar una flor imperial, es decir, las cartas 10, J, Q, K, As, de una de las
cuatro figuras, es decir, corazones, diamantes, tréboles o espadas? Para esto, ver Figura
2.6. (624/2,598,960)
2.84. ¿Cuál es la probabilidad de sacar 4 cartas de la misma clase, es decir, un poker?
Esto es, cuatro 2, cuatro 3, cuatro 4,……cuatro J, cuatro K, cuatro As. Para esto ver
Figura 2.6.
2.85. ¿Cuál es la probabilidad de sacar una casa llena (full house), es decir, una tercia y
un par? (.00144)
2.86. En el juego de barajas, ¿Cuál es la probabilidad de sacar una tercia?
2.87. En el juego de naipes, ¿Cuál es la probabilidad de sacar un par de un mazo
ordinario de 52 cartas? Ver Figura 2.6. (0.42)
2.88. En un estudio de higiene industrial y seguridad, un supervisor de un grupo de 20
trabajadores de la industria desea saber la opinión de ellos, (a los que seleccionará
aleatoriamente), sobre cierto reglamento de seguridad relacionado con emisiones de
gases dentro de la fábrica. Si 12 de ellos están a favor del nuevo reglamento y los otros
8 están en contra, ¿Qué probabilidad hay de que dos trabajadores seleccionados, por el
supervisor, se manifiesten en contra del nuevo reglamento de seguridad? Sugerencia:
2-66

usar la regla multiplicativa para eventos independientes, es decir: P(A ∩ B) = P(A)

P(B).
2.89. Cuatro naipes de un monte de 52 cartas (mazo de cartas americano) se sacan en
sucesión (sin reemplazo). Encontrar la probabilidad de que la primera carta sacada sea
un as; la segunda carta sacada sea un 8 de diamantes; la tercera carta sacada sea cuando
menos una reina y la cuarta carta sacada sea un 6 rojo. Sugerencia: Dejar que P(A) sea
la probabilidad de sacar el as, P(B) sea la probabilidad de sacar el 8 de diamantes, P(C)
sea la probabilidad de sacar menos una reina y P(D) sea la probabilidad de sacar el 6
rojo. Usar diagramas de Venn para denotar las probabilidades y las intersecciones de las
cuatro cartas sacadas. Referirse a la Figura 2.6 de abajo.
Figura 2.6. Diagrama esquemático mostrando las 52 cartas de juego de barajas. El

monte de cartas empieza con el 2 hasta el 10, en cada una de sus denominaciones y
termina con cuatro cartas adicionales, que son las sotas, las reinas, los reyes y los ases.
Aquí, nótese que, las figuras de diamantes y de corazones son siempre del color rojo y
las figuras de tréboles y de espadas son siempre de color negro.
2-67

Fuente: http://en.wikipedia.org/wiki/Image:Set_of_playing_cards_52.JPG
Figura 2.7. Diagrama esquemático de las 52 cartas ilustrando la probabilidad de sacar

un As o un Rey. Fuente: Lawrence L. Lapin. Statistics for Modern Business Decision.
(1982).
2-68

CAPITULO 3
Distribuciones Binomial e hipergeométrica
Aplicaciones generales de la distribución binomial.- Relación entre la
distribución normal y la distribución binomial.- Relación entre la distribución
binomial y la distribución de Poisson.- La distribución hipergeométrica.-
Suposiciones y propiedades de la distribución hipergeométrica.-
La distribución binomial es una de las distribuciones de probabilidad discretas más

usadas en estadística. Se puede considerar como un tipo de análisis de lógica
deductiva, porque va del conjunto o total a la parte. Se deriva de un proceso
conocido como ensayos de Bernoulli. Un proceso Bernoulli es un ensayo de algún
proceso o experimento que puede resultar en, solamente, uno de dos resultados
mutuos excluyentes, es decir, binarios, como por ejemplo, “éxito” y “fracaso”,
donde la probabilidad de éxito se denota como p. También el experimento
binomial se puede interpretar como una situación defectuosa o no defectuosa,
correcta o incorrecta, presente o ausente, nacimientos de niños o niñas, caras o
águilas de una moneda, etc. De esta manera, los datos de un proceso binomial
(binario) consiste, únicamente, de dos situaciones o resultados.
Aplicaciones generales de la distribución binomial
Una de las áreas principales de aplicación de la distribución binomial es en los
campos de la ingeniería industrial, es decir, en procesos industriales, donde el
resultado de un proceso es dicótomo (proporciones de un objeto defectuoso o no
defectuoso, de éxito o fracaso, etc.) También se usa en aplicaciones médicas (curar
o no curar) y en aplicaciones militares (pegar o no pegar de un mísil). Igualmente,
3-1
se usa para denotar el número de herramientas defectuosas producidas por una

máquina, etc.
La distribución binomial también se puede aplicar a la ingeniería ambiental.
Como se dijo antes, los datos del proceso binomial consisten de dos resultados
discretos (binarios). Por ejemplo, en un bioensayo, un organismo de prueba está,
ya sea vivo o muerto, es decir, después de ser expuesto a la concentración de algún
desinfectante, en función de la concentración y del tiempo de exposición.
Igualmente, en el caso de una descarga de aguas residuales domésticas o
industriales, ésta puede o no pueda estar dentro de los límites estipulados por las
leyes ambientales. Análogmente, se puede aplicar a la ingeniería ambiental en la
que una industria cumple o no cumple con las regulaciones ambientales del aire,
del agua, de ruido, de contaminación de tierra, etc. También se puede aplicar a la
ingeniería civil en el área de construcción, etc.
Definición: Un ensayo Bernoulli es un experimento aleatorio que tiene solo dos
resultados posibles, es decir, éxito o fracaso, donde la probabilidad de éxito se
denota por p y el fracaso se denota por q = 1 - p. El experimento consiste de n
ensayos repetidos donde los ensayos son independientes. De esta manera, si p es la
probabilidad de que un evento ocurrirá, en un solo ensayo (llamado arbitrariamente
éxito) y, la relación q es la probabilidad de que el evento fallará en cualquier
ensayo, entonces, la distribución de probabilidad de la variable aleatoria binomial
X, es igual al número de ensayos. Es decir, donde el resultado es un éxito con
parámetros p y n = 1, 2, 3, …, n, esto es:
P(X) = b(x;n,p) = nCx px qn-x = n!/x!(n – x)! px (1 – p)n-x (3-1)
Donde:
n = selección del tamaño de la muestra considerada como ensayos independientes
3-2
repetidos de Bernoulli (independientes porque no importa cuantas veces se repita el

experimento las probabilidades de éxito o fracaso permanecen constantes).
x = 0, 1, 2, 3,…., n o sea el número exacto de éxitos posibles en n ensayos
p = probabilidad de éxito
nCx = n!/x!(n – x)! = coeficiente binomial a sea el número de combinaciones de n
objetos tomados a un tiempo r
q = 1 – p = probabilidad de fracaso
Es de verse qué, la probabilidad de no éxito (o fracaso) es qn, por lo tanto, la
probabilidad de cuando menos un éxito es 1 - qn.
La distribución de probabilidad discreta Bernoulli a veces se le llama
distribución binomial porque los valores de la variable aleatoria X pueden ser x =
0, 1, 2, 3,…., n que corresponden a términos sucesivos de la fórmula binomial o
expansión binomial. Esto quiere decir que, la distribución binomial deriva su
nombre del hecho de que los términos n + 1 en la expansión binomial de la función
(q + p)n corresponde a varios valores de b(x;n,p), para x = 0, 1, 2, 3,…., n. Así, la
expansión binomial es:
(q + p)n = qn + nC1 qn-1 p + nC2 qn-2 p2 + .. + pn (3-2)
Donde:
nC1, nC2,… se llaman los coeficientes binomiales
Los coeficientes binomiales se pueden estimar usando el triángulo de Pascal que se
da abajo.
3-3
Figura 3.0. Triángulo de Pascal que se usa para estimar los coeficientes binomiales.
En este triángulo se nota que, el primero y el último número de cada renglón es 1.
Además, cada otro número en cada ordenación puede obtenerse por medio de
sumar los dos números que aparecen directamente arriba. (Elaboración propia)
3-4
Figura 3.1. Gráficas mostrando varias distribuciones binomiales en función de p y

de n. La distribución binomial es realmente una familia de distribuciones. Cada
valor diferente de n o de p especifica una distribución diferente. Las figuras de
arriba muestran, como la distribución binomial varía para diferentes valores de p y
de n (donde p es la probabilidad de éxito y q es la probabilidad de fracaso y, donde
en n repeticiones de un ensayo de Bernoulli, el número de éxitos posibles es 0, 1,
2,…, n). Sin embargo, sin importar el valor de n, la distribución binomial es
simétrica cuando p = 0.5. Pero, cuando p > 0.5, la distribución es asimétrica y el
pico ocurre a la derecha del centro. También, cuando p < 0.5 la distribución es
asimétrica y el pico ocurre a la izquierda del centro. (Elaboración propia)
3-5
TABLA 3.0. Tabla mostrando algunas propiedades de la distribución Binomial.

Promedio µ = np
λ = np
Varianza σ2 = npq
Desviación estándar npq = σ
Relación entre la distribución binomial y la distribución normal

La distribución binomial se puede aproximar por la distribución normal cuando n
es grande y, cuando ni p ni tampoco q están muy cercanas a cero. Esto se debe a
que, el modelo binomial es inapropiado cuando n es extremadamente grande.
Afortunadamente, la aproximación normal es más eficaz a medida que n aumenta.
En la práctica, la aproximación de la distribución binomial usando la distribución
normal es adecuada siempre y cuando np ≥ 10 y nq ≥ 10. Entonces, si np < 10 o
nq < 10, la distribución binomial está demasiado sesgada, para dar aproximaciones
satisfactorias, como con la curva normal que es simétrica. Para hacer las
aproximaciones de la binomial usando la distribución normal es con la variable
aleatoria estandarizada dada abajo.
Z = (X –np) / npq es decir Z = (X – µ) / σ (3-3)
Donde: np = µ y npq = σ2 o sea σ= npq
Relación entre la distribución binomial y la distribución de Poisson

Con la distribución binomial, si n es grande (n ≥ 50 ensayos de Bernoulli) y si el
promedio µ = np < 5 (p cercana a cero y q cercana a 1) en semejantes casos, la
3-6
distribución binomial está muy cercana a la distribución de Poisson.

Ejemplos de problemas relacionados con la distribución binomial o
distribución Bernoulli
Ejemplo #1. Calcular las siguientes probabilidades binomiales directamente de la
fórmula, para b(x;n,p)
(a) B(3;8,.6)*
(b) B(5;8,.6)
(c) P(3 ≤ X ≤ 5) cuando n = 8 y p = .6
(d) P(1 ≤ X) cuando n = 12 y p = .1
(e) b(x;8,0.6)* donde x = 0
*Nótese la diferencia entre el uso de la letra mayúscula B y la minúscula b
Solución:
(a) B(3;8,0.6) dice que queremos X = 3, n = 8, p = .6
P(X = 3) = 8!/3!(8 – 3)! (0.6)3 (1 – 0.6)8-3
= 0.124
Análogamente, usando la tabla binomial de probabilidades individuales: B(3;8,0.6)
= 0.124
Igualmente, usando la fórmula da:
nCx px qn-x = 8C3 (0.6)3 (0.4)8-3
= (56)(0.216)(0.01)
= 0.124
(c) P(3 ≤ X ≤ 5) = B(5;8,0.6) – B(3;8,0.6)
= 0.279 – 0.124
= 0.155
Donde:
3-7
B(5;8,0.6) = 0.279 (usando la tabla binomial de probabilidades individuales)

= nCx px qn-x = 8C5 (0.6)5 (0.4)8-5
= (56)(0.078)(0.064)
= 0.279 (usando la fórmula)
(d) P(X ≥ 1) con n = 12 y p = 0.1. Esto dice que queremos:
P(X ≥ 1) = 1 – P(X < 1) = 1 – P(X = 0)
= 1 – 0.001
= 0.999 (usando la tabla de probabilidades individuales)
P(X ≥ 1) = 1 – P(X = 0) = 1 - nCx px qn-x
= 1 - 8C0 (0.6)0 (0.4)8-0
= 1 - (1)(1)(0.0007)
= 0.9993 (usando la fórmula)
Ejemplo #2. Hacer los mismos problemas del inciso #1 pero ahora usando la tabla
de la distribución binomial. Comparar los resultados. El lector lo deberá hacer.
Ejemplo #3. Usando la tabla de la distribución binomial estimar:
(a) B(4;10,0.3)
(b) B(6;10,0.7)
Solución:
(a) B(4;10,0.3) dice que usamos b(x;n,p), donde x = 4, n = 10 y p = 0.3.
Entonces, P(X = 4) = B(4;10,0.3). Para esto, buscamos en la tabla de la distribución
binomial de probabilidades individuales el valor de n = 10, π = p = .300 y x = a = 4
y nos da 0.200.
Por lo tanto, P(X = 4) = B(4;10,0.3) = 0.200
Nótese que aquí también se puede usar la fórmula binomial (3-1), es decir,
P(X) = b(x;n,p) = nCx px qn-x = n!/x!(n – x)! px (1 – p)n-x y da el mismo resultado.
3-8
(b) Para este inciso se procede en forma similar.

Ejemplo #4. Una moneda honesta se lanza 6 veces (que es lo mismo que lanzar
seis monedas a la vez). Llamemos las caras un éxito. Calcular las siguientes
probabilidades:
(a) La probabilidad de que salgan exactamente 2 caras
(b) La probabilidad de que salgan cuando menos 4 caras
(c) La probabilidad de no caras, es decir, todos fracasos
Solución:
(a) Aquí usamos la fórmula de la distribución binomial:
P(X) = b(x;n,p) = nCx px qn-x
Donde:
nCx = coeficiente binomial = n! / x!(n - x)!
n = número de ensayos
p = probabilidad de que el evento ocurra en un solo ensayo
q = 1 – p = probabilidad de que el evento falle (fracaso)
x = la probabilidad de que el evento ocurra en 0, 1, 2, …, n
número de éxitos posibles
Nótese que la probabilidad de no éxitos es qn, por lo tanto, la probabilidad de
cuando menos un éxito es 1 - qn
Aquí n = 6, p = 0.5, q = 1 - 0.5 = 0.5.
Entonces, la probabilidad de que salgan exactamente 2 caras es:
P(X = 2) = B(2;6,0.5) = 6C2 (0.5)2 (0.5)6-2 = 15/64
(b) La probabilidad de que salgan cuando menos 4 caras (X ≥ 4) es:
P(X = 4 o 5 o 6) = B(4;6,0.5) + B(5;6,0.5) + B(6;6,0.5)
= 6C4(0.5)4 (0.5)6-4 + 6C5 (0.5)5 (0.5)6-5 + 6C6 (0.5)6 (0.5)6-6
3-9
= 11/32
Ejemplo #5. En un estudio de toxicología, la probabilidad de que un enfermo se
recupere de una intoxicación es de 0.4. Si se sabe que una muestra de 15 personas
se ha intoxicado, calcular las siguientes probabilidades:
(a) La probabilidad de cuando menos 10 personas sobrevivan.
(b) La probabilidad de que de 3 a 8 personas (inclusivamente) intoxicadas
sobrevivan.
(c) La probabilidad de que exactamente 5 personas intoxicadas sobrevivan.
Solución:
(a) Dejemos que X sea el número de intoxicados que sobrevivan. Aquí, el término
“cuando menos 10” significa que el valor de la variable aleatoria es X ≥ 10.
También sabemos que la muestra es n = 15. Aquí, pudiéramos usar la expresión
binomial b(x;n,p) = nCx px qn-x y sustituir los valores de x = 10, 11, 12, 13, 14, 15
en la fórmula de abajo, y luego sumar todos los resultados usando la expresión de
abajo.
b(x;15,0.4) = 15Cx (0.4)x (0.6)15-x
Sin embargo, este procedimiento sería muy largo y tedioso. Siendo así, esto se
simplifica mucho si tomamos el complemento de la probabilidad de 1
(acordándose de que la probabilidad no puede ser mayor que 1 o negativa) y
usando la tabla de la distribución binomial.
P(X ≥ 10) = 1 – P(X < 10). Esto dice que x = 0, 1, 2, 3,….., 9
9
= 1 - ∑ b(x;15,0.4) = 1 – 0.9662
x=0
= 0.0338 (usando la tabla de la distribución binomial)

El valor de 0.9662 se saca de la tabla binomial, buscando el valor de n = 15, x = 9
3-10
y p = 0.4. Esto se lee como 0.9662.

(b) Este problema dice que, la probabilidad de que se recuperen entre 3 y 8
intoxicados, inclusivamente, es lo mismo que decir, P(3 ≤ X ≤ 8). Esto quiere
decir que los valores de la variable aleatoria son x = 3, 4, 5, 6, 7, 8. Nuevamente, si
no usamos la tabla binomial, el procedimiento es muy largo. Por esto vamos a
razonar como sigue:
8 2
P(3 ≤ X ≤ 8) = ∑ b(x;15,0.4) - ∑ b(x;15,0.4)
x=0 x=0
= P(X ≤ 8) – P(X ≤ 2)
= 0.9050 – 0.0271
= 0.8779 (usando la tabla de la distribución binomial)
(c) La probabilidad de que exactamente 5 intoxicados sobrevivan es de x = 5, n =
15, p = 0.4. Esto se puede hacer de tres maneras: usando la tabla de las
probabilidades individuales (la forma más sencilla) o la tabla acumulada o, bien, la
fórmula. Usando la tabla binomial individual, buscamos el valor de n = 15 con p =
0.4 y con x = 5 y da 0.186.
5 4
P(X = 5) = B(5;15,0.4) = ∑ b(x;15,0.4) - ∑ b(x;15,0.4)
x=0 x=0
= 0.4032 – 0.2173
= 0.1859
Si usamos la fórmula sería largo y tedioso, como se ve abajo.
P(X = 5) = B(5;15,0.4) = 15C5 (0.4)5 (0.6)15-5
= 15!/5!(15-5)! (0.0041)(0.6)10
= 0.1859
Ejemplo #6. Si el 20% de los tornillos producidos por una máquina son
3-11
defectuosos, determinar la probabilidad que de 4 tornillos seleccionados

aleatoriamente:
(a) Uno estará defectuoso
(b) Ninguno estará defectuoso
(c) A lo más 2 estarán defectuosos
(d) Cuando menos uno estará defectuoso
Solución:
(a) Aquí, x = 1, n = 4, p = 0.20, q = 0.80
P(X = 1) = 4C1 (0.2)1 (0.8)4-1 = 0.4096
(b) P(X = 0) = 4C0 (0.2)0 (0.8)4-0
= 0.4096
(c) Aquí, el término “a lo más 2” significa X ≤ 2, lo cual quiere decir que
queremos encontrar P(X = 0 o 1 o 2). Entonces:
P(X ≤ 2) = P(0) + P(1) + P(2)
= 0.4096 + 0.4096 + 0.1536 (de la tabla de probabilidades binomiales
individuales)
= 0.9728
Aquí, también se puede usar P(X ≤ 2) = .974 (de la tabla acumulada)
(d) El término “cuando menos 1” significa X ≥ 1, lo cual quiere decir que x = 1, 2,
3, 4. Entonces queremos calcular P(3) y P(4) porque ya calculamos P(1) y P(2).
Otro razonamiento sería el de calcular la probabilidad de que X = 4, menos la
probabilidad de X = 0. Para esto, usamos la tabla binomial acumulada buscando n
= 4, p = 0.2 y X = 4 y le restamos n = 4, p = 0.2 y X = 0. Es decir:
P(X = 4) – P(X = 0) = P(X ≤ 4) – P(X ≤ 0)
= 1 – 0.41
3-12
= 0.59
Ejemplos aplicados a la ingeniería ambiental
Ejemplo #7. Supóngase que el 40% de los ríos de cierta región industrial de
México están contaminados con benceno. Si tomamos una muestra aleatoria de
tamaño n = 30, calcular lo siguiente:
(a) Exactamente 15 ríos estarán contaminados con benceno
(b) Cuando menos 15 ríos estarán contaminados con este compuesto
orgánico cancerígeno, de una muestra de n = 25.
(c) No más de 10 ríos, pero cuando menos de 5 ríos estarán contaminados de una
muestra aleatoria de n = 25.
Solución:
Usamos la distribución binomial, porque son dos eventos mutuos excluyentes o
binarios, es decir, están o no están contaminados los ríos. Entonces, llamemos
arbitrariamente, un éxito encontrar un río contaminado y, un fracaso, no encontrar
un río contaminado. Se usa la fórmula binomial expresada como:
b(x;n,p) = nCx px (1 – p)n-x = n! / (n – x)! px qn-x
(a) Aquí, n = 30, x = 15, p = 0.40, q = 0.60. La muestra de 30 se puede interpretar
como 30 ensayos repetidos de Bernoulli. Ahora, sustituyendo los valores en la
fórmula de arriba da:
B(15;30,0.40) = P(X = 15)
= 30! / (30 – 15)! (0.4)15(0.6)30-15
= 0.073
También se pudiera usar la tabla de la distribución binomial de densidad de
probabilidad o de probabilidades individuales, que son más precisas y más fáciles
de usar que la fórmula. Siendo así, con n = 30 y p = 0.4:
3-13
P(X = 15)= 0.0783 ≈ 0.08

El valor de 0.078 ≈ 0.08 dice que hay cerca de 8 posibilidades entre 100 de
seleccionar una muestra de 30 ríos que estén contaminados con benceno. Aquí se
ve que, a medida que aumenta n, la probabilidad de éxito también aumenta.
(b) Cuando menos 15 indica X ≥ 15 y n = 25, p = 0.4 y q = 0.60
Aquí el espacio muestral es de:
x = 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, ……, 24, es decir, de 25
ensayos de Bernoulli.
B(15;25,0.4) = P(X ≥ 15) = 1 – P(X < 15) = 1 – P(X ≤ 14)
14
= 1 - ∑ B(14;25,0.4) = 1 - .966 = 0.034
x=0
(c) Aquí, P(5 ≤ X ≤ 10) = P(X ≤ 10) – P(X ≤ 4)

Ejemplo #8. En un estudio de laboratorio bacteriológico de aguas se afirma que, el
3.0% de las tomas domiciliarias contienen la bacteria E. Coli, en concentraciones
arriba del límite estipulado por las leyes ambientales. Si esta afirmación es
correcta, encontrar la probabilidad de que, el número de bacterias E. coli, en una
muestra aleatoria de 25 tomas domiciliarias, se encontrará:
(a) Ninguna bacteria
(b) Cuando menos 1 bacteria
(c) Entre 1 y 5 incluso
(d) Más de 5 bacterias
(e) Más de 5, pero menos de 10 bacterias
Solución:
Usamos la distribución binomial, porque son dos eventos mutuos excluyentes o
binarios; se contiene la bacteria (llamándola éxito arbitrariamente) o no se contiene
3-14
la bacteria (fracaso).
(a) Aquí, n = 25, p = .03, q = .97, X = 0
El tamaño de muestra n = 25 indica que son 25 ensayos repetidos de Bernoulli, es
decir, que los posibles valores de la variable aleatoria X son de x = 0, 1, 2, 3,
4,……., 24. Entonces,
(b) Cuando menos 1 bacteria indica X ≥ 1 y se expresa como:
P(X ≥ 1) = 1 – P(X = 0) = 1 – P(X < 1)
= 1 – 0.4670
= 0.533
(c) Entre 1 y 5 incluso se expresa como:
5
P(1 ≤ X ≤ 5) = ∑ B(5;25,0.03) – P(X < 1) = 0.9999 – 0.467 = .533
x=0
Ejemplo #9. En un río adyacente a una zona industrial, la probabilidad de cada

muestra de agua sacada del río exceda el límite de cromo de 10 mg/L, es de 0.10.
Si se supone qué, las muestras de agua son independientes con respecto a la
presencia de cromo, entonces:
(a) Encontrar la probabilidad de que en una muestra de tamaño n =
18, exactamente, 2 excedan el límite de 10 mg/L de cromo.
(b) Encontrar la probabilidad de que al menos 4 muestras excedan el límite.
(c) Encontrar la probabilidad de que cuando menos 3 muestras, pero menos de 7
excedan el límite estipulado.
(d) Encontrar la probabilidad de que más de 3 muestras, pero menos de 7 excedan
el límite estipulado de cromo.
Solución:
(a) Dejemos que X = número de muestras de agua que excedan el límite estipulado
3-15
de 10 mg/L del total de las 18 observaciones. Entonces, X es una variable aleatoria

binomial con p = 0.1 y n = 18. Por consiguiente, usando la fórmula binomial
b(x;n,p) = nCx px qn-x y sustituyendo los valores correspondientes da:
B(2;18,0.1) = P(X = 2) = 18! / 2!(18 – 2)! (0.1)2 (0.9)18-2
= (153)(0.01)(0.1853)
= 0.284
(b) P(X ≥ 4) = 18Cx (0.1) x (0.9)18-x
Usando este enfoque, tendríamos que sustituir los valores de x = 4, 5, 6, 7,……, 18
en la fórmula de arriba y luego sumarlos. También pudiéramos usar la tabla
binomial de probabilidades individuales o de probabilidad de función de masa o
función acumulada y, luego, sumar los resultados. (¿Cuál es la diferencia en usar la
tabla acumulada y la individual?).
De cualquier manera, es mucho más fácil usar el evento complementario, ya sea
usando la expresión de abajo o bien, la tabla binomial.
P(X ≥ 4) = 1 – P(X < 4) = 1 – P(X ≤ 3)
3
= 1 - ∑ 18Cx (0.1)x (0.9)18-x
x=0
= 1 – (0.15 + 0.30 + 0.284 + 0.168)

= 1 – 0.902 = 0.098
Ahora, si usamos la tabla binomial acumulada, buscamos el valor de n = 18, con X
= 3 y p = 0.1, para sacar el factor P(X < 4) y da .902. Por lo tanto,
P(X ≥ 4) = 1 - .902 = 0.098
(c) Aquí estamos buscando P(3 ≤ X < 7). Esto nos lleva a:
6
P(3 ≤ X < 7) = ∑ 18Cx (0.1)x (0.9)18-x
x=3
3-16
= 0.168 + 0.07 + 0.022 + 0.005 = 0.265

Otro razonamiento sería como sigue: x = 0, 1, 2, 3, 4, 5, 6…,18
P(X ≤ 6) – P(X ≤ 3), es decir, para los valores de X = 3, 4, 5, 6
Aquí, nuevamente, podemos usar la tabla binomial de probabilidades individuales
y sumar las cuatro probabilidades de x = 3, 4, 5, 6. También se puede usar la tabla
binomial acumulada, es decir, buscando n = 18, p = 0.1, y X = 6 y, luego,
restándole el valor de X = 3.
6
(d) P(3 < X < 7) = ∑ 18Cx (0.1)x (0.9)18-x
x=4
Ejemplo #10. En una investigación de contaminación ambiental se estudiaron

cientos de industrias. Sea X el número de industrias que no cumplen con las
regulaciones ambientales del aire y del agua de una muestra al azar de 10
industrias. Si se sabe que el valor de la probabilidad es de p = 0.5, calcular las
siguientes probabilidades.
(a) La probabilidad de que, exactamente, 5 industrias cumplan con los límites
ambientales.
(b) La probabilidad de que no más de 2, cumplan con el reglamento.
(c) La probabilidad de que cuando menos 9, lo cumplan.
(d) La probabilidad de que menos de 5 industrias cumplan, pero cuando menos 3 si
lo cumplan.
Solución:
(a) P(X = 5) = B(5;10,0.5)
= 0.246 (usando la tabla binomial)
(b) P(X ≤ 2) = 0.055 (usando la tabla binomial)
3-17
(c) P(X ≥ 9) = 1 - .989

= 0.011
(d) P(3 ≤ X < 5) = P(4) + P(3) = .205 + 0.117
= .322 (de la tabla binomial individual)
Ejemplo #11. Este problema ilustra el uso de la distribución binomial y su
aproximación con la distribución normal. Resulta qué, la distribución normal, con
µ = np y σ2 = npq proporciona una buena aproximación a la binomial cuando n →
∞ y, cuando p se aproxima a 0 o a 1. Así, supóngase que n = 15, p = 0.4 y
queremos encontrar P(X = 4). Para esto usar la distribución binomial y la
distribución normal como una aproximación a esta última. Comparar los
resultados.
Solución:
Usando la distribución binomial estimamos el promedio, es decir, µ = np =
(15)(0.4) = 6 y la varianza, σ2 = npq = (15)(0.4)(0.6) = 3.6, la cual da una
desviación estándar de σ = 1.897.
Enseguida, usando la distribución binomial acumulada da:
b(x;n,p) = P(X = 4) = B(4;15,0.4) - B(3;15,0.4)
= P(X ≤ 4) – P(X ≤ 3)
= .217 - .091 = .126
Que es lo mismo que usar la fórmula o la distribución de probabilidades
individuales, es decir:
P(X = 4) = 15C4 (0.4)4 (0.6)15-4 = 0.1258
Aquí, se ve qué, usando la tabla binomial de probabilidades individuales se lee
directamente con n = 15 y p = 0.4 y da 0.126
Ahora bien, usando la distribución normal, como una aproximación, usamos la
3-18
variable aleatoria normal estándar poblacional Z, es decir:

Z = (X – µ) / σ y su estimador muestral z = (X – X ) / s
Sin embargo, la variable aleatoria discreta de X = 4, en forma de variable aleatoria
continua, está entre 3.5 y 4.5. Además, con µ = 6 y σ = 1.897 hacemos la
transformación usando la variable aleatoria normal estándar Z.
Z3.5 = (3.5 – 6) / 1.897 = - 1.32
Z4.5 = (4.5 – 6) / 1.897 = - 0.79
De manera que, P(X = 4) = P(-1.32 < Z < -0.79)
= 0.2148 – 0.0934 (de la tabla de z)
= 0.1214
Finalmente, el valor de 0.1214 está bastante de acuerdo con el valor de 0.1258
obtenido con la distribución binomial.
Ejemplo #12. Supóngase que se tiene una muestra de 20 casos de mediciones de
análisis de demanda bioquímica de oxígeno (DBO5) provenientes de un muestreo
de un río, procedentes de 20 lugares diferentes a lo largo de su trayectoria. Si se
sabe que, la probabilidad de que la concentración de la demanda bioquímica de
oxígeno de 5 (DBO5) días está dentro de los límites estipulados por las leyes
ambientales es de p = 0.6 (éxito), hacer los siguientes cálculos:
(a) Calcular el promedio y la desviación estándar de la variable
aleatoria X binomial.
(b) Usando la distribución binomial calcular la probabilidad de que exactamente 10
casos de DBO estén dentro del límite estipulado.
(c) Hacer los mismo que en el inciso (b) pero usando la distribución normal.
(d) Hacer una tabla de los valores de la variable aleatoria X correspondientes a x =
0, 1, 2, 3, 4,…,19 en función de n = 20 y p = 0.6 usando la fórmula y la tabla
3-19
binomial. Calcular también la probabilidad acumulada.

(e) Hacer un histograma de probabilidades binomiales para el tamaño de la muestra
n = 20 y p = 0.6 con una curva normal sobrepuesta.
(f) Calcular P(X ≤ 5), P(X ≥ 12) y P(X ≤ 12) usando, ambas la distribución
binomial y la distribución normal como aproximación a esta última.
Solución:
(a) El promedio, la varianza y la desviación estándar binomiales son:
Promedio = µ = np = (20)(0.6) = 12
Varianza = σ2 = npq = µ(0.4) = 4.8
Desviación estándar = σ = √σ2 = 2.19
(b) Aquí, la aproximación de la distribución binomial a la distribución normal es
buena, porque np = (20)(0.6) ≥ 10 y nq = (20)(0.4) ≥ 10.
Para calcular la probabilidad de qué, exactamente, 10 casos estén dentro de las
normas estipuladas se hace usando la distribución binomial con los valores n = 20,
p = 0.6 y q = 1 – p = 1 – 0.6 = 0.4. Ahora, sustituyendo los valores en la fórmula
binomial nos da:
b(x;n,p) = nCx px qn-x para x = 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10……, 19
B(10;20,0.6) = 20C10 (0.60)10 (0.4)20-10 = 0.1162
Sin embargo, usando la tabla binomial de probabilidades acumuladas nos da la
probabilidad individual:
P(X = 10) = .2447 - .1275 = .1172
También, usando la tabla binomial de probabilidades de función de masa con n =
20, π = .600 y a = 10 da un valor de 0.117.
Como se ve arriba, el uso de la fórmula binomial es largo y tedioso. Sin
embargo, si usamos la tabla de las probabilidades binomiales individuales o de
3-20
función de masa o, bien, la tabla de probabilidades acumuladas, los cálculos se

simplifican de sobremanera.
(c) Ahora, usando la distribución normal con variables aleatorias continuas, nos da:
(9.5 ≤ X ≤ 10.5) o sea P(-1.14 ≤ Z ≤ -.68). Esto se calcula usando la variable
aleatoria estandarizada Z, es decir,
Z = (X – µ) / σ donde X = 9.5 y 10.5, µ = 12, s = σ = 2.19
Z9.5 = (9.5 – 12) / 2.19 = - 1.14
Z10.5 = (10.5 – 12) / 2.19 = - 0.68
Enseguida, usando la tabla de la distribución normal razonamos como:
P(-1.14 ≤ Z ≤ -.68) = P(Z = -.68) – P(Z = -1.14)
= (0.2483 – 0.1271)
= .1212
Al comparar los dos resultados vemos que la distribución binomial da 0.1172 y la
distribución normal da 0.1212. Esta aproximación sería mejor a medida que n fuera
más grande.
(d) Para hacer una tabla con todas las probabilidades correspondientes a x = 0, 1, 2,
3, 4,…, 19. (Ver TABLA 3.1 de abajo).
3-21
TABLA 3.1. Tabla mostrando las probabilidades individuales y acumuladas con n

igual a 20 y p igual a 0.6. (Elaboración propia)
Valor de la variable P(X) individual P(X) acumulada
aleatoria X
0 0.000 0.000
1 0.000 0.000
2 0.000 0.000
3 0.000 0.000
4 0.000 0.000
5 0.002 0.002
6 0.004 0.006
7 0.015 0.021
8 0.036 0.057
9 0.071 0.128
10 0.117 0.245
11 0.159 0.404
X = µ = 12 (promedio) 0.180 0.584*
14 0.124 0.974
15 0.075 0.949
16 0.035 0.984
18 0.003 0.999
20 0.000 1.000
El asterisco (*) señala la localización del promedio.

(e) Para este inciso la Figura 3.2 e abajo muestra un histograma de probabilidad
3-22
binomial para n = 20, p = 0.6, µ = 12 y σ = 2.19, con curva normal de

aproximación sobrepuesta. Aquí, se ve que, aun cuando el histograma de
probabilidad está un poco sesgado hacia la izquierda, porque p > .6. La curva
normal da muy buena aproximación a la binomial.
Figura 3.2. Gráfica mostrando un histograma de probabilidad binomial para n = 20,

p = 0.6, µ = 12 y σ = 2.19, con curva normal de aproximación sobrepuesta. Aquí,
se ve claramente, qué, aun cuando el histograma de probabilidad está un poco
sesgado hacia la izquierda, (porque p > .6), la curva normal da muy buena
aproximación a la binomial. (Elaboración propia)
(f) Para calcular los valores de abajo usando la distribución binomial y la normal,
se procede como:
1. P(X ≤ 5)
2. P(X ≥ 12)
3. P(X ≤ 12)
Usando la tabla de la distribución binomial con n = 20, p = 0.6 y q = 0.4 da los
siguientes resultados.
3-23
Para: P(X ≤ 5) = .002

Para: P(X ≥ 12) = 1 – P(X < 12)
= 1 - .404
= .596
Nota: Para P(X ≥ 12) ¿porqué el valor obtenido no se aproximó a .5? Para contestar
esta pregunta refiérase a la Figura 3.2 de arriba.
Para: P(X ≤ 12) = 1 – P(X > 12) = .596
Ahora, para calcular los valores de arriba usando la distribución normal,
como una aproximación a la binomial, para cada uno de las preguntas P(X ≤ 5),
P(X ≥ 12) y P(X ≤ 12) necesitamos convertir las variable aleatorias discretas a las
variables aleatorias normales Z usando la variable aleatoria estandarizada Z con µ
= 12 y σ = 2.19 y luego buscar el valor de Z en la tabla de la distribución normal y
calcular la probabilidad correspondiente.
Usando la función Z = (X – µ)/σ y estandarizando nos da:
Z5 = (5 – 12)/2.19 = - 3.197
Ahora usando la tabla de la distribución normal buscamos z = -3.197 y da .0007, o
sea ≈ .001. Similarmente, con P(X ≥ 12) convertimos X = 12 a valores de Z con µ =
12 y σ = 2.19 y da:
Z = (12 – 12)/2.19 = 0
Que corresponde a una probabilidad de .5000. La misma situación ocurriría con
P(X ≤ 12)…… (Que también se puede leer de la gráfica).
Ejemplo #13. Si en la fabricación de accesorios para un sistema de control de
partículas (ciclón) se asocia con un proceso Bernoulli, con un promedio de partes
defectuosas de 0.20, estimar la probabilidad:
(a) De no encontrar partes defectuosas del sistema de control de una muestra
3-24
aleatoria de 10 partes.
(b) De no encontrar partes defectuosas de los ciclones fabricados de una muestra
de 20 partes.
Solución:
(a) Usando la fórmula binomial: b(x;n,p) = nCx px qn-x y sustituyendo X = 0, p = 0.2
y q = 0.8 nos da:
P(X = 0) = B(0;10,0.2) = 10C0 (0.2)0 (0.8)10-0 = 0.107
Este resultado también se puede obtener usando la tabla binomial de
probabilidades individuales o de función de masa, es decir, buscando n = 10, p =
0.2 y X = 0.
(b) Nuevamente usando la fórmula binomial y sustituyendo da:
P(X = 0) = B(0;20,0.2)= 20C0 (0.2)0 (0.8)20-0
= (1)(1)(0.012)
= 0.012
Análogamente, este mismo resultado se puede obtener usando la tabla binomial
acumulada buscando n = 20, p = 0.2 y X = 0 y da 0.012. Aquí, nótese que también
se obtiene el mismo resultado usando la tabla binomial de probabilidades
individuales.
Ejemplo #14. Si tenemos una muestra aleatoria de n = 20 (peces) para varios
valores de p, podemos estimar la probabilidad de X muertes de los organismos
sometiéndolos a ciertas concentraciones tóxicas provenientes de una descarga
industrial de un río. Para esto hacer los siguientes cálculos:
(a) Calcular el promedio µ y la desviación estándar σ, de la muerte de los peces, si
el valor de p = 0.05
(b) La probabilidad de que muera a lo más 1 organismo
3-25
(c) La probabilidad de que no muera ningún organismo

(d) La probabilidad de que mueran cuando menos 3 organismos
(e) La probabilidad de P(X = 10)
Solución:
(a) Promedio = X = µ = np = (20)(.05) = 1.0.
Desviación estándar = σ = npq = (1.0)(.95) = .95
(b) P(X ≤ 1) = .736
(c) P(X = 0) = .358
(d) P(X ≥ 3) = 1 - P(X < 3) = 1 - .9245 = .0755
(e) P(X = 10) = 1.0
Ejemplo #15. La posibilidad de que una muestra de aire contenga un
microorganismo letal es de 10%. Suponiendo que las muestras son independientes,
con respecto a la presencia del microorganismo, encontrar la probabilidad de que:
(a) En las 18 siguientes, exactamente 2 contengan el germen.
(b) Al menos 4 muestras contengan el germen.
(c) La probabilidad de que menos de 7 muestras de aire contengan el germen, pero
cuando menos 3 muestras también lo tengan, e.g., P(3 ≤ X < 7).
Solución:
(a) Sea X el número de muestras de aire que contengan el germen patógeno en las
18 muestras siguientes analizadas. Entonces, X es una variable aleatoria binomial,
con p = 0.1 y n = 18. Por consiguiente:
P(X = 2) = B(2;18,0.1) = 18C2 (0.1)2 (0.9)16 = 0.284
18
(b) P(X ≥ 4) = Σ 18Cx (0.1)x (0.9)18-x, donde 18Cx = 18!/x!(18 – x)!
x=0
Aquí, sin embargo, es más fácil usar el evento complementario.
3-26
P(X ≥ 4) = 1 – P(X < 4)

3
= 1 – Σ 18CX (0.1)x (0.9)18-x
x=0
= 1 – (0.15 + 0.300 + 0.284 + 0.168)

= 0.098
6
(c) P(3 ≤ X < 7) = Σ 18Cx (0.1)x (0.9)18-x
x=3
= 0.168 + 0.07 + 0.022 + 0.005

= 0.265
También, P(X ≤ 6) – P(X ≤ 2) = .9983 - .7338
= .2645
Ejemplo #16. En un estudio de higiene industrial y seguridad llevado a cabo en
muchas maquiladoras industriales, supóngase que hay una población grande de
tomadores de licor y otra población de abstemios. En este caso, la probabilidad de
éxito o de tomadores se asume que es p igual a 0.4 y, la probabilidad de abstemios
(probabilidad de fracaso) es de q igual a 0.6. Si sacamos una muestra al azar de n =
10 operadores de la maquiladora, entonces, el número de la variable aleatoria de X
tomadores de licor es de x = 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, siendo así:
(a) Preparar una tabla mostrando las probabilidades individuales y valores de X.
(b) Preparar una gráfica en función de probabilidades binomiales individuales en la
ordenada y de x en la abscisa, donde las barras indiquen la probabilidad de función
de masa P(X = x).
(c) Calcular el promedio y la varianza de esta distribución.
(d) De la gráfica leer todas las probabilidades P(X = x).
(e) Estimar P(X = 4) e interpretar el resultado
3-27
Solución:
(a) La tabla de probabilidades individuales, con n = 10 y p = 0.4 se da en la
TABLA 3.2 de abajo. Esto se hace con el programa Minitab. El procedimiento
para generar las probabilidades de función de masa P(X=x) es:
Calc → Probability distributions → Binomial
En la ventana de “Binomial Distribution” puntear “Probability” e introducir el
número de ensayos (10) y la probabilidad de éxito (0.4). Además, puntear “Input
column”, introducir los valores de X, y en la ventanilla de “Optional storage” poner
P(X=x) y luego OK. Todas estas ordenes generan la los valores de la TABLA 3.2.
TABLA 3.2. Tabla mostrando las probabilidades
binomiales individuales vs. valores de X.
__________________________________
P(X=x) Variable aleatoria X
__________________________________
0.006047 0
0.040311 1
0.120932 2
0.214991 3
0.250823 4
0.200658 5
0.111477 6
0.042467 7
0.010617 8
0.001573 9
0.000105 10
_________________________________
(b) Para hacer la gráfica de P(X=x) vs. valores de X usar el programa Minitab y
proceder de la siguiente manera: Irse a: Graph → Scatterplot. En la ventana de
“Scatterplot” que aparece, irse a “With Connect Line” e introducir los valores de
P(X=x) y valores de la variable aleatoria X. En la ventana de “Scatterplot Data
3-28
View” puntear “Symbols” y “Project Lines” y OK. Esto genera la gráfica de las
probabilidades binomiales de función de masa P(X=x), en función de los valores de
la variable X mostrada abajo. Siendo así, analizar la configuración de los resultados
de la grafica y decir si es oblicua a la derecha o a la izquierda y explicar porque
ocurre de esa manera. La gráfica se muestra abajo.
Grafica de P(X=x) vs. variable aleatoria X

0 2 4 6 8 10
0.25 0.25
0.20 0.20
0.15 0.15
P(X=x)
0.10 0.10
0.05 0.05
0.00 0.00
0 2 4 6 8 10
Variable aleatoria X
Figura 3.3. Gráfica mostrando P(X = x) en función de X. Aquí, debido a que p =

0.4 < 0.5, la distribución es oblicua hacia la derecha. (Elaboración propia)
(c) El promedio µ, la varianza σ2 y la desviación estándar σ de esta distribución

son: µ = np = (10)(0.4) = 4.0, σ2 = npq = (10)(0.4)(0.6) = 2.4, σ = √2.4 = 1.555
(d) De la Figura 3.3 se pueden leer todas las probabilidades P(X = x) mostradas en
la TABLA 3.3 y también usando la TABLA 3.2.
3-29
TABLA 3.3. Tabla mostrando los valores de la variable aleatoria X para este
problema. (Elaboración propia)
P(X = 0) = 0.0060 P(X = 6) = 0.1115
P(X = 1) = 0.0403 P(X = 7) = 0.0425
P(X = 2) = 0.1209 P(X = 8) = 0.0106
P(X = 3) = 0.2150 P(X = 9) = 0.9916
P(X = 4) = 0.2508 P(X = 10) = 0.0001
P(X = 5) = 0.2006
(e) P(X = 4) = 0.2508 dice qué, si seleccionáramos 100 muestras de tamaño n = 10,
de una población de operadores de la industria maquiladora esperaríamos que 25
de estas muestras tendrían un valor de X = 4 tomadores de licor.
Ejemplo #17. La paraestatal PEMEX de México se avocó a hacer perforaciones en
el sureste de Tabasco. Para ver la factibilidad financiera de que fuera conveniente
hacer las perforaciones, PEMEX contrató los servicios de una firma de estudios
estadísticos. Se sabe que, cada pozo perforado se clasifica como productivo o no
productivo. La experiencia de PEMEX es que, en este tipo de exploraciones, se
sabe por experiencia que, el 15% de los pozos perforados son productivos. Para las
exploraciones petroleras se seleccionaron aleatoriamente 12 sitios. Con esta
información en mente, hacer los siguientes cálculos.
(a) ¿Cuál es la probabilidad de que los 12 pozos que se perforen en cada uno de los
12 sitios, sean productivos?
(b) ¿Cuál es la probabilidad de que ningún pozo perforado sea productivo?
(c) ¿Cuál es la probabilidad de que exactamente un pozo sea productivo?
(d) Para hacer rentable al país, cuando menos tres de los pozos de exploración
deben ser productivos. Siendo así, ¿Cuál es la probabilidad de que el negocio sea
rentable?
3-30
Sugerencia: Usar P(X = 12), P(X = 0), P(X = 1), P(X ≥ 3), etc.
Distribución Hipergeométrica
La función hipergeométrica es una distribución discreta de probabilidad, la cual
está estrechamente ligada a la distribución binomial. La manera más simple de ver
la diferencia entre las dos distribuciones radica en la forma que se hace el
muestreo. La diferencia entre estas dos distribuciones es que, en la distribución
binomial, los intentos son independientes, porque hay reemplazo en la selección de
la muestra. Sin embargo, en el caso de la distribución hipergeométrica, hay
dependencia, porque la selección de la muestra se hace sin reemplazo y la
probabilidad de éxito cambia de un intento a otro.
El modelo hipergeométrico es apropiado, cuando el muestreo es sin
reemplazo de una población finita y, cuando se requiere la probabilidad de un
número específico de éxitos y/o fracasos.
Suposiciones y propiedades de la distribución hipergeométrica
1. Una muestra aleatoria de tamaño n se selecciona sin reemplazo de N ítems.
2. k de los N ítems pueden ser clasificados como éxitos y, N – k es clasificado
como fracasos.
3. La población o conjunto de la muestra consiste de N individuos, objetos o
elementos (una población finita).
4. Cada individuo puede ser caracterizado como un éxito o un fracaso y hay k
éxitos en la población.
5. Una muestra de n individuos se selecciona sin reemplazo (hay dependencia, en
contraste con la binomial en la que hay independencia) en forma aleatoria.
Definición de la distribución hipergeométrica
En la distribución de probabilidad de una variable aleatoria hipergeométrica X, el
3-31
número de éxitos en una muestra aleatoria de tamaño n, seleccionada de N ítems,

de los cuales k se llaman éxitos y N – k se llaman fracasos es:
kCx N-kCn-x
h(X;N,n,k) = ───────── x = 0, 1, 2, 3,..., n (3-4)
NCn
Donde:
k = éxitos en n intentos, es decir, la cantidad de elementos
identificados como éxito en la población
N – k = fracasos
n = tamaño de la muestra aleatoria o cantidad de elementos en la
población
N = número de ítems (tamaño de la población)
Donde x no puede exceder de k y (n – x) no puede exceder de (N – k)
Observaciones:
NCn Representa la cantidad de formas en las que se puede
seleccionar una muestra de tamaño n de una población de
de tamaño N
kCx Representa la cantidad de maneras en las que se puede
seleccionar x éxitos de un total de k éxitos de la
población
N-kCn-x Representa la cantidad de maneras en las que se puede
seleccionar n – x fracasos de un total de N – k fracasos en la población
Aplicaciones de la distribución hipergeométrica
Las aplicaciones de esta distribución se encuentran en las pruebas electrónicas;
aseguranza de calidad; selección de diamantes industriales, algunos de los cuales
3-32
son de calidad superior a los otros; en problemas de muestreos de declaraciones de

impuestos sobre ingresos, donde k entre N declaraciones archivadas contienen
deducciones cuestionables. Igualmene, la distribución hipergeometrica tiene las
mismas aplicaciones a la ingeniería ambiental, que con la binomial, con la
diferencia que con la hipergeométrica el muestreo es sin reemplazo.
Características de la distribución hipergeométrica
Si n es relativamente pequeño con respecto a N, la probabilidad para cada intento
cambia ligeramente, lo que indica que se tiene un experimento binomial. Esta
situación puede aproximarse a la distribución hipergeométrica usando la
distribución binomial con p = k/N. Además, el promedio y la varianza de la
distribución hipergeométrica se pueden aproximar mediante las fórmulas:
µ = np = nk/N (3-5)
σ2 = npq = n(k/N)(1 – k/N) (3.6)
Relación entre la distribución hipergeométrica y la distribución binomial

Hay una relación interesante entre la distribución binomial y la distribución
hipergeométrica. Como se dijo antes, si n es pequeña comparada con N, la
naturaleza de N ítems cambia muy poquito en cada muestreo. Por lo tanto, la
cantidad k/N juega el papel del parámetro p de la distribución binomial. Como
resultado, la distribución binomial puede ser vista como una edición poblacional
grande de la distribución hipergeométrica.
Así, cuando hay un experimento hipergeométrico, en el cual no se da el
valor de k directamente, pero si con valores dados de N y de la probabilidad p (o
en términos de porcentaje), el valor de k se puede calcular usando la relacion p =
k/N.
3-33
Ejemplos usando la distribución hipergeométrica

Ejemplo #18. Un comité de tamaño 5 es seleccionado aleatoriamente, de 3
Químicos y 5 Físicos. Encontrar la distribución de probabilidad para el número de
Químicos en el comité. Hacer una gráfica o histograma que vaya en función de la
variable aleatoria X y de P(X).
Solución:
Aquí, N = 8, n = 5, k = 3. Se usa la fórmula (3-4) de la distribución
hipergeométrica:
kCx N-kCn-x
h(x;N,n,k) = ───────── x = 0,1,2,3….,n

NCn
Sustituyendo los valores en la fórmula de arriba nos da la forma bsica lista para
sustituir los valores de la variable aleatoria X.
3Cx 8-3C5-x
h(x;8,5,3)= ─────────
8C3
Por lo tanto, del espacio muestral x = 0, 1, 2, 3, 4 y sustituyendo estos valores en la

expresión de arriba da los siguientes enunciados:
P(X = 0) = h(0;8,5,3) = 3C0 • 5C5 / 8C5 = (1)(1)/56 = 1/56 = 0.018
P(X = 1) = h(1;8,5,3) = 3C1 • 5C4 / 8C5 = (3)(5)/56 = 15/56 = 0.268
P(X = 2) = h(2;8,5,3) = 3C2 • 5C3 / 8C5 = (3)(10)/56 = 30/56 = 0.536
P(X = 3) = h(3;8,5,3) = 3C3 • 5C2 / 8C5 = (1)(10)/56 = 10/56 = 0.179
P(X = 4) = h(4;8,5,3) = 3C4 • 5C1 / 8C5 = (0)(5)/56 = 0
3-34
TABLA 3.4. Tabla mostrando la tabulación de la distribución hipergeométrica.

Variable aleatoria X | 0 1 2 3 4
h(x;8,5,3) | 1/56 15/56 30/56 10/56 0
Para hacer el histograma, únicamente se grafican los valores de la variable

aleatoria x = 0, 1, 2, 3, 4 en la abscisa y los valores de h(x;8,5,3) en la ordenada.
Ejemplo #19. Refiriéndose al problema anterior, calcular las siguientes
probabilidades:
(a) La probabilidad de qué, exactamente, 1 Químico sea seleccionado.
(b) La probabilidad de qué, cuando menos 1 Químico sea seleccionado
(c) La probabilidad de qué, entre 1 y 3 (incluso) Químicos sean seleccionados.
Solución:
(a) Sustituyendo los valores de N = 8, n = 5, k = 3 en la fórmula hipergeométrica:
P(X = x) = h(x;N,n,k) = kCx • N-kCn-x / NCn
P(X = 1) = h(1;8,5,3) = 3C1 • 5C4 / 8C5
= (3)(5) / 56 = 0.268
(b) P(X ≥ 1) = 1 – P(X = 0) = 1 – [(3C0 • 5C5)/8C5]
= 1 – (1)(1) / 56
= 1 – 0.018 = 0.982
(c) P(1 ≤ X ≤ 3) = P(X ≤ 3) – P(X = 0)
= P(X = 1) + P(X = 2) + P(X = 3)
= H(1;8,5,3) + H(2;8,5,3) + H(3,8,5,3)
= (3C1•5C4)/56) + (3C2•5C3)/56) + (3C3•5C2)/56)
= ((3)(5)/56) + ((3)(10)/56) + ((1)(10)/56)
= (0.268) + (0.536) + (0.179) = 0.983
3-35
Ejemplo #20. Un embarque de 20 computadoras contiene 5 que están defectuosas.

Si 10 de estas computadoras se seleccionan aleatoriamente, para su inspección,
¿Cuál es la probabilidad de que 2 de las 10 estén defectuosas?
Solución:
Aquí, X = 2, n = 10, k = 5 y N = 20. Ahora sustituyendo estos valores en la
fórmula hipergeométrica da:
P(X = 2) = H(2;20,10,5) = 5C2 • 15C8 / 20C10 = (10)(6435)/184756
= 0.348
Nótese la diferencia entre el uso de la letra mayúscula H y la letra minúscula h.
Ejemplo #21. Repitamos el ejemplo anterior, pero ahora con un lotes de 100
computadoras, 25 de las cuales están defectuosas, de la siguiente manera.
(a) Usando la fórmula hipergeométrica
(b) Usando la fórmula binomial como una aproximación a la distribución
hipergeométrica.
Solución:
(a) Sustituyendo x = 2, n = 10, k = 25, N = 100 en la fórmula da:
P(X = 2) = H(2;100,10,25) = 25C2 • 75C8 / 100C10
= (300)(1.687x1010) / 1.731x1013
= 0.292
Aquí vemos que los datos son muy largos y tediosos. Sin embargo, usando la
distribución binomial, como una aproximación, basándonos en el hecho de que el
valor de N = 100 es grande con relación a n = 10, entonces, podemos usar la
binomial como una aproximación a la hipergeométrica y da:
Usando x = 2, n = 10, p = k/N = 25/100 = .25. Por lo tanto,
Usando la formula binomial, b(x,n,p) = nCx px qn-x /x!
3-36
P(X = 2) = B(2,10,0.25) = 10C2 (0.25)2 (0.75)8

= (45)(0.0625)(0.100) = 0.2813
Nota. Obsérvese que la diferencia entre los dos valores es de solo .01. En general,
es posible demostrar que la distribución hipergeométrica, h(x;N,n,k) se aproxima a
la distribución binomial, b(x;n,p), con p = k/N. Por regla general, puede usarse la
distribución binomial como una aproximación a la distribución hipergeométrica, si
n < N/10.
Más ejemplos de problemas de la distribución binomial usando el programa
de computadora Minitab
Abrir el programa Minitab e irse a:
Calc → Probability Distributions → Binomial…
Esto hace que aparezca la ventana de “Binomial Distributions”. En esta ventana
puntear “Probability”. En la ventanilla de “Number of Trials” poner el valor de n
seleccionado (tamaño de la muestra). Asimismo, en la ventanilla de “Probability of
Success” poner la probabilidad o el porcentaje (en forma decimal) deseado. En la
ventanilla de “Input Columns” poner la columna C1 o sea la columna con los datos
que se quieran evaluar. En la ventanilla de “Optional Storage” se pondrán los datos
generales que se almacenaran. Luego poner “OK”. Enseguida, para generar las
probabilidades acumuladas dentro de la misma ventana de “Binomial
Distributions” puntear la “Cummulative Probability” y proceder análogamente,
como arriba.
Análogamente, para hacer gráficas irse a:
Graph → Scatterplot → With Connect line, etc.
En la ventana de “Scatterplots With Connect Line”, poner C2 o C3 en Y y, C1 en
X. (Siempre que se tenga alguna duda, consultar la ventanilla de “Help”.)
3-37
Ejemplo #22. Un fabricante de precipitadores electrostáticos afirma qué, el 6% de

este equipo para controlar las partículas contaminantes del aire, está defectuoso. Si
esta afirmación es correcta, encontrar las probabilidades de que el número de
aparatos defectuosos sacados de una muestra de 10 estén en mal estado.
(a) Exactamente dos aparatos estarán defectuosos
(b) Cuando menos dos aparatos estarán defectuosos
(c) Menos que un aparato estará defectuoso
(d) Entre 2 y 5 incluso y excluso
(e) P(S)
(f) Hacer gráficas de probabilidad de función de masa P(X=x) y de probabilidad
acumulada, P(X ≤ x)
Solución:
Para obtener los resultados apetecidos usar la tabla generada, que incluye la
variable aleatoria X (en la columna C1) y las probabilidades binomiales
individuales y las probabilidades binomiales acumuladas (en las columnas C2 y
C3).
(a) P(X = 2) = 0.0988 (de la columna C2)
(b) P(X ≥ 2) = 1 – P(X < 2)
(c) P(X < 1) = P(X = 0) = 0.5386
(d) P(2 ≤ X ≤ 5) = P(X ≤ 5) – P(X ≤ 1)
= P(X = 2) + P(X = 3) + P(X = 4) + P(X = 5)
= 0.1176
P(2 < X < 5) = P(X = 4) + P(X = 3) (de la columna C2)
= 0.0168 + 0.0019
= 0.0187
3-38
(e) P(S) = 1 (Este valor se obtiene de la sumatoria de todas las probabilidades de

función de masa o probabilidades binomiales individuales), esto es:
P(S) = (0.538615 + 0.343797 + 0.098750 + 0.0116809 + 0.001878 + 0.000144 +
0.000008) ≈ 1
(f) Las Figuras 3.4 (a) y (b) muestran los gráficos de las probabilidades binomiales
individuales, en función de la variable aleatoria X y, las probabilidades binomiales
acumuladas, en función de la variable aleatoria X, respectivamente.
TABLA 3.5. Tabla mostrando los valores de la variable aleatoria x (columna C1),
la probabilidades binomiales individuales P(X=x) y la probabilidades binomiales
acumuladas P(X ≤ x) (columna C3).
(a) (b)
Figura mostrando la grafica de P(X=x) versus variable aleatoria x Grafica mostrando la probabilidad P(X<=x) vs. variable aleatoria X
1.0 0 1 2 3 4 5 6
0.6 0.6
Probabilidades acumuladas
0.9 0.5 0.5
0.4 0.4
0.8
P(X=x)
0.3 0.3
0.7
0.2 0.2
0.6 0.1 0.1
0.0 0.0
0.5
0 1 2 3 4 5 6 0 1 2 3 4 5 6
Variable aleatoria x Variable aleatoria X
Figura 3.4. Esquemas mostrando los resultados de este ejemplo. La figura (a)
muestra la gráfica de P(X=x) vs. variable aleatoria X y, la figura (b), muestra la
gráfica de P(X <= x). (Elaboración propia)
3-39
Ejemplos aplicados a la distribución hipergeométrica usando el programa de

computadora Minitab
Abrir el programa Minitab e irse a:
Calc → Probability Distributions → Hypergeometric
Esta maniobra abre la ventana “Hypergeometric Distribution”. En esta ventana
puntear “Probability”. Para calcular las probabilidades hypergeométricas de
función de masa en la ventanilla de “Population size (N)” poner el valor de la
población muestreada (N). En la ventanilla de “Success in Population (M)” poner
el número de éxitos (k). En la ventanilla de “Simple Size (n)” poner la muestra
seleccionada (n). En la ventanilla de “Input columns” poner los valores que se
vayan a evaluar (x). En la ventanilla de “Optional Storage” introducir la columna
donde se vayan a almacenar los valores generados.
Ejemplo #23. Asúmase que una población de 10 medidores de pH (que miden la
acidez y la alcalinidad de soluciones químicas) contiene 4 unidades defectuosas
(éxitos arbitrariamente). Si una muestra de 3 medidores se selecciona al azar, sin
reemplazo, encontrar las siguientes probabilidades:
(a) Exactamente 1 aparato de pH estará defectuoso
(b) Dos aparatos estarán defectuosos
(c) Tres aparatos de pH resultaran defectuosos de la muestra seleccionada
(d) A lo más 2 aparatos estarán defectuosos
(e) Hacer gráficas para P(X = x) y P(X ≤ x)
Solución:
1. Primero se introducen los valores de la variable aleatoria (x) en la columna C1
2. Enseguida, tenemos que identificar las variables que se introducirán en el
modelo hipergeométrico. Aquí, k = 4, N = 10, n = 3, x = 0, 1, 2, 3, 4.
3-40
3. Ahora, introducir los valores de N, n y k, como se indicó arriba y el programa

Minitab genera la TABLA 3.5 de abajo.
TABLA 3.5. Tabla mostrando los valores de las distribuciones hipergeometricas

individuales y acumuladas en función de la variable aleatoria X.
4. Para resolver los incisos (a)-(e), esto se puede hacer usando el modelo
hipergeométrico, h(x:N,n,k) = kCx • N-kCn-x / NCn, los datos de la TABLA 3.5 o las
gráficas. Por ejemplo si se usa la fórmula se sustituyen los valores de k, N y n y
luego se sustituyen los valores de x en la fórmula hipergeométrica:
h(x;10, 3,4) = 4Cx • 10-4C3-x / 10C3
Una vez hecho esto se sustituye los valores de x = 0, 1, 2, 3, 4. Este procedimiento,
sin embargo, es muy largo y tedioso. Pero si usamos los valores de la TABLA 3.5
esto se simplifica de sobremanera.
4. Las soluciones son:
(a) P(X = 1) = 4C1 • 6C2 / 10C3 = 0.500 (o de la columna C2)
(b) P(X = 2) = 4C2 • 6C1 / 10C3 = 0.300 (o de la columna C2)
(c) P(X = 3) = 4C3 • 6C0 / 10C3 = 0.033 (o de la columna C2)
2
(d) P(X ≤ 2) = Σ h(x;10,3,4) = 0.5000 + 0.1667 + 0.3000 = 0.9667 (o de C3)

x=0
3-41
(e) En cuanto a la generación de las figuras requeridas por el problema, siguiendo

las instrucciones anteriores se generan las Figuras 3.5 (a) y (b) señaladas abajo.
(a) (b)
Figura mostrando la grafica de P(X=x) vs. variable aleatoria x Figura mostrando la grafica de P(X<=x) vs. variable aleatoria x
0.5 1.0
0.9
0.4
0.8
0.7
P(X =< x)
0.3
P(X = x)
0.6
0.5
0.2
0.4
0.1 0.3
0.2
0.0 0.1
0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0
Variable aletoria x Variable aletoria x
Figura 3.5. La figura (a) muestra la distribución hipergeométrica de variables

individuales P(X=x) vs. variable aleatoria x y la figura (b) muestra las variables
acumuladas de la distribución hipergeométrica P(X ≤ x) vs. variable aleatoria X.
(Elaboración propia).
Ejemplo #24. En una encuesta universitaria hecha a 24 estudiantes del ultimo año
revela que casi el 50% de esa población de estudiantes recomienda tomarse cuando
menos una o dos cervezas diariamente, para estudiar mejor. Si se seleccionan
aleatoriamente 11 de estos estudiantes y se les pregunta que opinan de esto, estimar
lo siguiente:
(a) La probabilidad de que, solamente, 4 estudiantes sean de este parecer.
Solución:
Usando la distribución hipergeométrica con N = 24, n = 11, k = Np = (0.50)(24) =
12 y X = 4 y sustituyendo los valores en la formula hipergeométrica:
h(x;N,n,k) = kCx • N-kCn-x / NCn,
3-42
nos da: H(4;24,11,12) = 12C4 • 24-12C11-4 / 24C11

= (495)(792)/2,496,144
= 0.26
Nota: Hay métodos para generar tablas de distribuciones binomiales
(acumuladas e individuales) usando el programa computarizado Minitab
Existen métodos para generar tablas binomiales acumuladas o tablas binomiales
individuales para cualquier tamaňo de n y de probabilidades p. Esto se hace,
porque es impráctico poner todos los valores de n y de p en las tablas de las
diferentes distribuciones. Usando el Minitab, se pueden generar tablas de
probabilidades binomiales acumuladas para cualquier tamaňo de n y de p. Para
esto, proceder como:
Calculator → Probability Distributions → Binomial…
En la ventana de “Binomial Distribution” que aparece puntear “Cummulative
probability”. (Esto se hace después de introducir los valores de la variable aleatoria
X en la columna C1). En las ventanillas de “Number of trials” y “Probability of
success” poner el tamaňo de n y el valor de p, respectivamente. Esto generará las
probabilidades binomiales acumuladas, mismas que se almacenerán en “Optional
storage” o en la columna C2.
Análogamente, se puede generar una tabla de probabilidades binomiales
individuales para cualquier tamaño de n o de p. Para esto proceder como:
Calculator → Probability Distributions → Binomial…
En la ventana de “Binomial Distribution” que aparece, puntear “Probability”. (Esto
se hace después de introducir los valores de la variable aleatoria X en la columna
C1). En las ventanillas de “Number of trials” y “Probability of success” poner el
tamaño deseado de n y de p, respectivamente. Esto generará las probabilidades
3-43
binomiales individuales, mismas que se almacenerán en “Optional storage” o en la

columna C3, esto es, si ya se usó la columna C2 para el almacenaje de las
probabilidades binomiales acumuladas.
Ejemplo #25. Teóricamente, cierta forma de desnutrición ocurre en el 15% de
personas sin que se den cuenta de eso. Esta forma de desnutrición no se debe a que
no se coma lo suficiente, sino a situaciones en que el cuerpo no asimila los
nutrienties, sin importar cuanto o como se coma. Esto es debido a la alteración
química de la sangre por vida antinatural. Siendo así determinar las siguientes
probabilidades para una muestra de 5 personas.
(a) Ninguna persona lo tiene
(b) Cuando menos 2 personas lo tienen
(c) Entre 2 y 4 lo tienen, inclusivamente
Solución:
Usando el Minitab se genera la tabla de abajo.
TABLA 3.6. Tabla mostrando las probabilidades acumuladas e individuales.
__________________________________________________________________
Variable aleatoria X Probabilidades binomiales acumuladas Probabilidades binomiales individuales.
0 0.59049 0.59049
1 0.91854 0.32805
2 0.99144 0.07290
3 0.99954 0.00810
4 0.99999 0.00045
5 1.00000 0.00001
___________________________________________________________________________________________
(a) P(X = 0) = 0.59049

(b) P(X ≥ 2) = 1 – 0.91854 = 0.0815
(c) P(2 ≤ X ≤ 4) = 0.9999 - 0.91854 = 0.0815
3-44
3.1. Si la variable aleatoria X tiene una distribución binomial con n = 10 y p = 0.5,
calcular las siguientes probabilidades:
(a) P(X = 5) (0.246)
(b) P(X ≤ 2) (0.055)
(c) P(X ≥ 9) (0.011)
(d) P(3 ≤ X < 5) (0.549)
3.2. La variable aleatoria X tiene una distribución binomial con un tamaño de 10 y
con p = 0.01. Calcular lo siguiente:
(a) P(X = 5)
(b) P(X ≤ 2)
(c) P(X ≥ 9)
(d) P(3 ≤ X ≤ 5)
3.3. Supongamos que 20% de todos los sensores de alto volumen fallen en una
prueba de muestreo de partículas con filtros de cierta porosidad. Sea X el número
de entre 15 sensores seleccionados al azar que fallen la prueba. Entonces, si X tiene
una distribución binomial, con n = 15 y p = 0.2, determinar lo siguiente:
(a) La probabilidad de que a lo sumo 9 muestreadores fallen la prueba. (.999)
(b) La probabilidad de que exactamente 8 fallen. (.003)
(c) La probabilidad de cuando menos 8 muestreadores fallen. (.004)
(d) La probabilidad de que fallen entre 4 y 7 excluso. (.143)
3.4. De acuerdo con la Chemical Engineering Progress (Noviembre de 1990),
aproximadamente, el 30% de todas las fallas de operación de tuberías en plantas
químicas son ocasionadas por errores del operador. Siendo así, calcular:
3-45
(a) La probabilidad de que de las siguientes 20 fallas al menos 10 fallas se deban al

error del operador.
(b) La probabilidad de qué, no más de 4 de 20 fallas se deban a error del operador.
3.5. De acuerdo con un reporte publicado en la revista Parade, una encuesta a nivel
nacional de la Universidad de Michigan a estudiantes universitarios del último año,
revela que casi el 50% fuman marihuana. Si se seleccionan 12 estudiantes
aleatoriamente y se les pide su opinión al respecto, encontrar la probabilidad de
que el número que fuman marihuana todos los días sea:
(a) Entre 7 y 9 incluso (0.368)
(b) A lo más 5 (0.3872)
(c) No menos de 8 (1 - P(X ≤ 7))
3.6. En un estudio de higiene industrial y seguridad, se sabe que la probabilidad de
que un operador de las plantas de reactores nucleares sea adicto a las drogas
heroicas es de 0.05. ¿Cuál es la probabilidad de que exactamente 5 de los
siguientes 100 operadores sean adictos a los narcóticos? Usar la distribución
binomial y la normal para resolver este importante y delicado problema.
3.7. Un estudio de higiene industrial examinó las actitudes de los trabajadores
industriales acerca de los antidepresivos. Esta investigación reveló que,
aproximadamente, el 70% de los trabajadores entrevistados creen que los
antidepresivos, en realidad, no curan nada, sino que solo encubren el problema real
y no ayudan a resolver los problemas de trabajo. De acuerdo a esta investigación,
¿Cuál es la probabilidad de que al menos 3 de los siguientes 5 trabajadores
seleccionados, aleatoriamente, sean de esta opinión? (.837)
3.8. Con respecto al problema anterior 3.7, si X representa el número de
trabajadores de la industria que cree que los antidepresivos no ayudan a resolver
3-46
los problemas emocionales del trabajo, sino que dan solamente una solución
paliativa al problema de las depresiones emocionales; siendo así, entonces,
encontrar el promedio y la varianza, cuando se seleccionan aleatoriamente 5
personas de una muestra de 20.
3.9. En una investigación de higiene industrial y seguridad, el ingeniero encargado
del departamento de seguridad afirma que, solo el 40% de todos los trabajadores
usan cascos de seguridad cuando almuerzan en el lugar del trabajo. Suponiendo
que esta afirmación sea correcta, encontrar la probabilidad de que 4 de los
siguientes 6 trabajadores de la industria, elegidos, aleatoriamente, usen los cascos
de seguridad, mientras comen en el lugar del trabajo. (0.138)
3.10. Una compañía constructora de precipitadores electrostáticos sabe que, en
promedio, el 29% de este equipo de control de partículas requerirán de
reparaciones después de un año de usarse. Si se seleccionan, aleatoriamente, 20
precipitadores electrostáticos, de la producción total, encontrar la probabilidad que:
(a) Al menos 5 precipitadores requieran de reparaciones después de un año.
(b) Exactamente 5 de estas unidades de control de la contaminación atmosférica
requieran reparación después de un año.
3.11. En un estudio de ahorro de energía, se argumenta que, en el 40% de las
calefacciones activadas con energía solar, la cuenta por servicio baja
considerablemente. De acuerdo a este argumento, ¿Cuál es la probabilidad de que
la cuenta de servicio baje, en cuando menos 5 de una muestra de 50 calefacciones?
Hacer este problema usando la distribución binomial y después la distribución
normal. Comparar los resultados. (Binomial = 0.998, normal = 0.9987)
3.12. Hacer el mismo problema (3.11) pero usando 50% con n = 25 y P(X ≥ 5).
3.13. Se dan los siguientes datos: n = 15, p = 0.4. Calcular la probabilidad de que el
3-47
valor de la variable aleatoria X sea exactamente igual a 4. Hacer esto:

(a) Usando la distribución binomial. (0.1268)
(b) Usando la distribución normal como aproximación. (0.1214)
3.14. Se argumenta que en el 60% de las instalaciones de calefacción solar la
cuenta por concepto de servicio se reduce en al menos un tercio. En consonancia
con esto, ¿Cuáles son las probabilidades de que la cuenta de servicio se reduzca en
al menos un tercio en?:
(a) Cuatro de cinco instalaciones.
(b) Al menos cuatro de cinco instalaciones.
3.15. En estudios de ingeniería civil, si la probabilidad de que cierta columna de
ala ancha caiga bajo una carga axial dada es de 0.05, calcular la probabilidad hay
de que entre 16 columnas de ese tipo:
(a) ¿Caigan cuando más dos? (0.9571)
(b) ¿Caigan al menos cuatro? (.0070)
3.16. La probabilidad de que cierta clase de componente resista una prueba de
choque es de 0.55. Encontrar la probabilidad de que sobrevivan, exactamente, 2 de
los siguientes 4 componentes que se prueben.
3.17. La probabilidad de que un paciente se recupere de un problema cardiaco es
de 0.4. Si se selecciona aleatoriamente una muestra de 15 pacientes con síntomas
de problemas cardíacos, ¿Cuál es la probabilidad de:
(a) P(X ≥ 10) (0.0338)
(b) P(3 ≤ X ≤ 8) (0.1859)
(c) P(X = 5) (0.1859)
(d) P(3 < X < 8) (0.6964)
3-48
3.18. La producción diaria de 850 partes fabricadas contiene 50 partes que no

cumplen con los requerimientos del cliente. Del lote se escogen 2 partes,
aleatoriamente, sin reemplazo. Sea X el número de partes de la muestra que no
cumplen con los requerimientos. Siendo así, ¿Cuál es la función de la distribución
acumulada de X ?
3.19. La etapa de una tercera alerta de smog en la ciudad de Mexico ha sido dada,
en la cual se involucra a 50 industrias contaminantes. Un inspector de PROFEPA
visitará 10 industrias seleccionadas aleatoariamente, para inspeccionarlas por las
violaciones a las legislaciones ambientales, que las industrias pudieran estar
cometiendo. ¿Cuál es la probabilidad de que 15 de las industrias involucradas estén
violando, cuando menos, una legislación ambiental? (25CX· • 50-25C10-X / 50C10)
3.20. Un fabricante de llantas para autos reporta que entre un cargamento de 6,000
llantas de la marca Goodyear remitidas a un distribuidor local, 120 llantas de esta
marca están un poco defectuosas. Si un motorista compra, al azar, 10 de estas
llantas, ¿Cuál es la probabilidad de que 4 de estas llantas estén un poco dañadas?
Hacer este problema usando la distribución hipergeométrica y la binomial.
3.21. Un fabricante de aparatos de monitoreo ambiental (CO) contiende que solo el
10% de estos aparatos requieren de reparación dentro del periodo de garantía de un
año. Si se saca una muestra al azar de 10 de estos aparatos, entonces, siendo así,
calcular los siguientes enunciados:
(a) La probabilidad de que cuando menos 3 de los 10 aparatos requieran de
reparación dentro del periodo de garantía. (0.0702)
(b) Si 5 de los 10 aparatos requirieron de reparación en el primer año, ¿apoyaría
esto o refutaría la contención del fabricante? ¿Qué significado tiene la probabilidad
calculada, (en cuanto a la contención del fabricante de que solo el 10% de los
3-49
aparatos requieren de reparación dentro de un año), cuando la probabilidad de que

cualquiera de los aparatos requiera de reparación en el periodo de garantía, es de
0.10? (El resultado es igual a 0.0016 y dado que la probabilidad es muy
pequeña se rechaza la contención del fabricante)
3.22. Este es un ejemplo teórico de un problema de desnutrición, que sufrirían
muchas personas enfermas, sin darse cuenta que están desnutridas. Aquí, sin
embargo, el autor de este ejemplo se refiere a un tipo de nutrición defectuosa que
no está relacionado con la desnutrición tradicional debido a la falta de alimentos.
En este contexto, el autor se refiere a un tipo de desnutrición poco conocido por la
medicina tradicional (sino por la naturopatía), como en el caso del cáncer genérico,
en el cual la persona afectada está desnutrida, no por no comer, sino porque el
organismo no puede asimilar los alimentos, sin importar cuanto o como se coma.
(Esto tal vez se deba a que las personas que sufren de los síntomas del cáncer
siempre están cansadas). De acuerdo a la naturopatía, esto ocurre como resultado
de la alteración química de la sangre, ocasionado por vida antinatural. Siendo así,
en este ejemplo vamos a considerar un caso hipotético de desnutrición no
tradicional, relacionado con personas que sufren enfermedades genéricas, y que en
este problema, este tipo de desnutrición es del 90%. Siendo así determinar las
probabilidades para los siguientes casos de desnutrición, para un tamaňo aleatorio
de 30 personas, si:
(a) Todas las personas enfermas tienen problemas de desnutrición.
(b) Cuando menos 27 personas enfermas están desnutridas.
(c) Bajo estas condiciones ninguna persona está desnutrida.
3-50
Sugerencia: Para resolver este problema, generar una tabla de probabilidades

acumuladas e individuales, puesto que los valores de n y de p, de este ejemplo, son
grandes, y no aparecen en las tablas binomiales dadas por los textos de estadística.
3.23. Una encuesta a cierta universidad, de un país del hemisferio norte hecha a 20
estudiantes del último año revela que, casi el 40% de esa población de estudiantes
aprueba el consumo diario de la marihuana. Si se seleccionan al azar 10 de estos
estudiantes y se les pide su opinión al respecto, calcular lo siguiente:
(a) ¿Cuál es la probabilidad de qué, solamente, 3 de los estudiantes sean de esta
opinión? (0.24)
(b) ¿Cuál es la probabilidad de que cuando menos 1, pero menos de 3 estudiantes
sean de esta opinión? (0.075)
3-51
CAPITULO 4
Distribución de Poisson
Aplicaciones de la distribución de Poisson.- Condiciones que se requieren para

aplicar la distribución de Poisson.- Funciones probabilísticas de la función de
Poisson.- Aplicación de la distribución de Poisson dentro de sus propios
términos y como una aproximación a la distribución binomial.- Propiedades
de la distribución de Poisson.- Problemas de la distribución de Poisson usando
el programa Minitab.
La distribución Poisson es una distribución de probabilidad discreta, porque se

forma contando algo. La distribución de Poisson fue desarrollada por el francés
Simeon Denis Poisson, quién la describió en 1837.
La distribución de Poisson se puede considerar como una lógica de
probabilidad deductiva, en forma análoga a la distribución binomial, porque en el
cálculo de las probabilidades se va del total a la parte. Esto es, porque siempre
conocemos la probabilidad del espacio muestral, la cual siempre es igual a 1 (el
total o conjunto).
La distribución de Poisson también puede ser enfocada como una forma
limitante de la distribución binomial, es decir, como una aproximación de la
binomial, esto es, cuando los cálculos binomiales son muy largos y tediosos. Pero,
más importante todavía, la distribución de Poisson, también puede ser enfocada
dentro de sus propios términos o derechos.
La distribución de Poisson tiene aplicaciones a una gran variedad de
procesos físicos; como resultado de esto, en la misma forma que la distribución
4-1
normal y la binomial, la distribución de Poisson es una de las distribuciones más

usadas. La distribución de Poisson aplica a la ocurrencia de algún evento aleatorio
X, sobre un intervalo especificado, donde el intervalo puede ser tiempo, distancia,
área, volumen, etc.
En cuanto a las diferencias entre la distribución de Poisson y la distribución
binomial, la distribución binomial es afectada por el tamaño de la muestra n y la
probabilidad p, mientras que, la distribución de Poisson es afectada por el
promedio µ. Además, la distribución binomial tiene valores posibles de x = 0, 1, 2,
3,..., n, mientras que la Poisson tiene valores posibles de x = 0, 1, 2, 3,....ad
infinitum, es decir sin ningún límite superior. La Figura 4.0 de abajo muestra la
distribución de Poisson.
Figura 4.0. Gráfica mostrando la distribución de Poisson. (Elaboración propia)
4-2
Aplicaciones de la distribución de Poisson
1. Las aplicaciones de la distribución pueden ser enfocadas a estudiar el número de

tóxicos encontrados en un volumen de aire emitido por una industria
(contaminación del aire). Otras aplicaciones son en la meteorología, para encontrar
la frecuencia imprevista de tempestades, ciclones, tornados, granizadas,
inundaciones, fuegos forestales, etc., en ciertas regiones del mundo.
2. También se usa en biología para contar el número de bacterias en un plato de
prueba. Se usa también en la física para contar el número de partículas emitidas de
una sustancia radiactiva, como por ejemplo, cuando una sustancia radiactiva emite
partículas alfa, beta o gamma. Aquí las partículas son emitidas, al azar, sobre un
largo periodo de tiempo, y la ocurrencia de una emisión es independiente de otras
emisiones.
3. Igualmente, la distribución Poisson se usa para el control estadístico de calidad o
para contar el número de ítems defectuosos (cuando es difícil usar la distribución
binomial).
4. Otras aplicaciones importantes de la distribución de Poisson son para encontrar
el número de accidentes, entre los trabajadores, como por ejemplo, en una
industria, en estudios de higiene industrial y seguridad.
5. Además, otras aplicaciones son las probabilidades de las demandas de un
producto y demandas de servicios. La distribución de Poisson también se usa para
encontrar la probabilidad de que habrá un número específico de reclamos de
accidentes de autos, en una compañía de seguros durante un periodo de tiempo.
Esta distribución es igualmente útil para encontrar la probabilidad de un número
específico de ocurrencias que toman lugar por un tiempo dado o en una región
específica.
4-3
6. Análogamente, un proceso de producción continua, que fabrica un cierto objeto

en grandes cantidades, donde un objeto defectuoso ocurre, aleatoriamente, con
probabilidad pequeña e independiente, también puede ser considerado un proceso
Poisson.
7. Los accidentes en una fábrica grande pueden ocurrir, al azar, con una pequeña
probabilidad y ser independientes de cada uno de los otros sobre un tiempo
continuo, en cuyo caso, este proceso sigue a la distribución Poisson. Además, esta
distribución aplica para encontrar el número de accidentes en un determinado
tramo carretero durante un periodo digamos de 3 meses.
8. Asimismo, la distribución de Poisson se usa para saber el patrón de llegadas de
aviones a un aeropuerto; el número de defectos sobre la superficie de una mesa; el
número de errores de imprenta de un libro, etc.
Condiciones que se requieren para aplicar la distribución de Poisson
1. Un experimento consiste en contar el número de veces de que un cierto evento
ocurra (x), durante una unidad de tiempo o espacio.
2. La probabilidad de que un evento ocurra es la misma para cada unidad de
tiempo o espacio.
3. El número de eventos que ocurran en una unidad de tiempo o espacio es
independiente del número de eventos que ocurren en las otras susodichas unidades.
4. Teóricamente, un número infinito de ocurrencias del evento deben ser posibles
en el intervalo.
Funciones probabilísticas de la distribución Poisson
Cuando la distribución de Poisson es apropiada, la probabilidad de observar

exactamente x número de ocurrencias por unidad de medición (horas, minutos,
centímetros cúbicos, páginas, etc.), es decir, el número de resultados que ocurren
4-4
en un intervalo de tiempo dado o en una región específica, se encuentra usando las

ecuaciones de abajo:
P(X) = f(x) = µx e-µ/x! (4-1)
Donde:
µ = promedio de ocurrencias por intervalo
= np
Donde: n = tamaño de la muestra
p = la probabilidad
e = 2.71828... (Base de los logaritmos Neperianos)
x = 0, 1, 2,....., ∞, es decir, los valores de la variable aleatoria X, esto es, el número
de resultados que ocurren en un intervalo de tiempo.
De acuerdo a la fórmula de arriba, la distribución de Poisson tiene un solo
parámetro simbolizado por la letra griega µ. Si conocemos este valor del promedio
µ podemos escribir la distribución de probabilidad completa. Este parámetro µ
puede ser interpretado como el promedio de las ocurrencias, por intervalo de
tiempo o espacio que caracteriza el proceso generado por la distribución de
Poisson.
Otra manera de ver la distribución de Poisson es usando la función dada
abajo:
(λ)x e-λ
p(x;λ) = ──────── (4-2)
x!
Donde:
λ = np es una constante dada. Es el número promedio de
4-5
resultados por unidad de tiempo o región. Aquí, debido a que λ es positiva para
todos los posibles valores de X, entonces:
∞
Σ p(x; λ) = 1, lo cual es la consecuencia del desarrollo de eλ en la serie infinita de
x=0
Maclaurin dada en todos los textos de cálculo, la cual se expresa como:

∞
eλ = 1 + λ + λ2/2! + λ3/3! + … + = Σ λx/x! (4-2a)
x=0
Esta ecuación demuestra que la función p(x;λ) satisface la segunda condición

necesaria para especificar una función de probabilidad de masa (pmf).
µ = np la cual se puede interpretar como el número promedio de éxitos por el
tamaño de la muestra n.
e = 2.71828...
x = número de resultados que ocurren en un intervalo de tiempo (0, 1, 2, 3....ad
infinitum)
Aplicación de la distribución de Poisson dentro de sus propios términos y
como una aproximación a la distribución binomial
Como se mencionó al principio, la distribución de Poisson puede explicarse desde
dos ángulos: dentro de sus propios derechos y como una aproximación de la
distribución bionomial. Esto ocurre, porque muchas veces si se aplica la
distribución binomial a ciertos problemas, los cálculos son muy extensos, en cuyo
caso se puede aplicar la distribución de Poisson, la cual da los mismos resultados,
pero mucho más fácil de calcularlos. Por ejemplo, cuando la distribución de
Poisson se usa como una aproximación a la distribución binomial, esto es
aplicable, cuando n es grande y la probabilidad, p es pequeña. (Recordando qué,
con la distribución binomial, la distribución de Poisson se usa como una
aproximación a la distribución normal cuando n es grande y cuando p o q están
4-6
cercanas a 0). La aproximación de la distribución de Poisson a la distribución

binomial es apropiada cuando p ≤ 0.05 y n ≥ 20. En verdad, el porcentaje de error
de los resultados obtenidos usando la distribución de Poisson, como una
aproximación a la distribución binomial, es de 1 en 270 o cerca de 0.4%. La
TABLA 1.0 muestra las comparaciones de la distribución binomial y la Poisson.
TABLA 1.0. Tabla mostrando las comparaciones de resultados de ejemplos
aleatorios usando la distribución binomial y la distribución de Poisson.
__________________________________________________________________
Distribución Binomial Distribución Poisson
P(X ≥ 1) = 1 – F(0) P(X ≥ 1) = 1 – F(0)

= 1 – 0.1216 = 0.8784 = 1 – 0.135 = 0.865
P(X ≤ 2) = F(2) = 0.6769 P(X ≤ 2) = F(2) = 0.677
P(X ≥ 3) = 1 – F(2) P(X ≥ 3) = 1 – F(2)
= 1 – 0.6769 = 1 – 0.677
= 0.3231 = 0.323
Por otra parte, cuando la distribución de Poisson es explicada dentro de sus

propios méritos, esta distribución resulta de las ocurrencias que pueden ser
descritas por una variable aleatoria discreta. Esta variable denotada por X, puede
tomar valores de x = 0, 1, 2, ... (Donde los puntos suspensivos denotan ad
infinitum), esto, en contraste con la distribución binomial donde los valores de x
son de 0, 1, 2, 3,...., n.
Ejemplos de la aplicación de la distribución de Poisson dentro de sus propios
términos o derechos y como aproximación a la distribución binomial
Ejemplo #1. Asúmase que una distribución de Poisson se da por la función de
abajo:
4-7
p(x) = [(0.72)x e-0.72] / x!

Encontrar:
(a) p(0)
(b) p(1)
(c) p(2)
(d) p(3)
Solución:
(a) p(0) = [(0.72)0 e-0.72] / 0! = 0.4868
(b) p(1) = [(.72)1 e-0.72] / 1! = 0.3505
(c) p(2) = [(.72)2 e-0.72] / 2! = 0.1262
(d) p(3) = [(0.72)3 (0.4868] / 3! = 0.030
Ejemplo #2. Un estudio de higiene industrial y seguridad hecho a largo plazo de
los accidentes en una fábrica, llevó a la gerencia a concluir que el número de
accidentes por trabajador, durante un año (X) sigue a una distribución Poisson. Si
el número promedio de accidentes por trabajador por año fue de 0.3, estimar lo
siguiente:
(a) ¿Cuál es la probabilidad de que un trabajador seleccionado, aleatoriamente, no
tendrá un accidente durante el año siguiente?
(b) ¿Cuál es la probabilidad de que un empleado seleccionado, aleatoriamente,
tendrá cuando menos 1 accidente durante el siguiente año?
(c) ¿Cuál es la probabilidad de que un trabajador tendrá, exactamente, 1 accidente?
(d) ¿Cuál es la probabilidad de que un trabajador seleccionado al azar de la fábrica
tendrá entre 2 y 4 accidentes, inclusivamente, el próximo año?
Solución:
Este problema se puede resolver usando la ecuación de Poisson y también usando
4-8
la tabla de la distribución Poisson.

Aquí, λ = 0.3, X = 0
Usando la ecuación (4-2), p(x;λ) = λx e-λ / x! y sustituyendo valores da:
(a) p(X) = P(X = 0) = (0.3)0 e-0.3 / 0! = 0.741
Esto dice que, el año siguiente, de cada 100 trabajadores, 74 no tendrán ningún
accidente y 26 si lo pudieran tener.
Como se dijo anteriormente, este problema también se puede resolver
usando la tabla de la distribución de Poisson. Para esto, buscamos en la tabla de
probabilidades acumuladas o individuales con λ = 0.3 y con x = 0 y da .740
(b) La probabilidad de que un trabajador tenga cuando menos un accidente se
puede hacer usando las tablas de Poisson.
P(X ≥ 1) = 1 - P(X = 0) = 1 - 0.741 = 0.259
(c) La probabilidad de que, el trabajador tenga exactamente, un accidente se puede
hacer usando la fórmula o las tablas de probabilidades individuales o acumuladas.
Usando la fórmula da (4-1), P(X) = f (x) = µx e-µ / x!, con µ = 0.3 y X = 1
f(1) = (0.3)1 e-0.3/1!
= 0.2222
Usando la tabla de la distribución de Poisson de probabilidades individuales nos a:
P(X = 1) = P(X ≥ 1) - P(X = 0) = 0.963 - 0.741 = 0.222
(d) La probabilidad de que un trabajador tenga entre 2 y 4 accidentes, incluso, es:
P(2 ≤ X ≤ 4) = P(2) + p(3) + P(4)
= 0.0333 + .0033 + 0.0002
= 0.0368 (usando las probabilidades individuales
de la distribución de Poisson)
Ejemplo #3. Para este problema usar la distribución de Poisson y la binomial.
4-9
Siendo así, si el número de defectos, por pie cuadrado de la tela de un equipo de

control (filtros) manufacturado por cierta industria sigue a un proceso Poisson, con
λ = 0.08, entonces, si un pie cuadrado de la tela es inspeccionado de una muestra
aleatoria de 50, ¿cuál es la probabilidad de que el número de defectos observados
sea?:
(a) Ningún defecto
(b) Cuando menos 1 defecto
(c) Exactamente, 2 defectos
Solución:
Primeramente, vamos a usar la distribución de Poisson, como una aproximación a
la binomial.
(a) Probabilidad de ningún defecto.
Usando la fórmula (4-2), con µ = λ = .08:
P(X = 0) = λx e-λ / x!
= (.08)0 (e-.08) / 0!
= .923
Alternativamente, podemos sacar el mismo resultado usando la tabla de Poisson
acumulada. Esto se hace buscando el valor de λ = .08 con X = 0 y da .923
(b) Cuando menos un defecto. Aquí, usando, nuevamente, la fórmula (4-2) de
Poisson con λ = .08 y substituyendo da:
P(X ≥ 1) = 1 – P(X = 0) = 1 - .923 = .077
(c) Exactamente 2 defectos.
P(X = 2) = (.08)2 e-.08 / 2!
= (0.0064) (0.92) / 2
= 0.00295
4-10
Ahora, bien, si se usará la distribución binomial, esto sería largo y tedioso, porque
n es grande. Sin embargo, para usar la relación b(x;n,p) = n!/x!(n – x)! px qn-x,
necesitamos calcular el valor p, es decir, usando µ = λ = np. Con λ = .08 y n = 50
da: .08 = (50)(p) y p = .0016 ~ .002.
(a) Usando la fórmula binomial b(x;n,p) = n!/x!(n – x)! px qn-x y sustituyendo los
valores da:
b(x;50,.08) = 50!/x!(50 – 0)! (.002)x (.998)50-x
B(0;50,.08) = 50!/0!(50 – 0)! (.002)0 (.998)50-0
= (1) (1) (0.905) = 0.905
B(1;50,.08) = 50!/1!(50 – 1)! (.002)1 (0.998)50-1
= 49(.002)(0.907) = .098
B(2;50,0.08) = 50!/2!(50 – 2)! (.002)2 (.998)50-2
= 1225 (.000004)(0.908) = 0.0045
(b) Cuando menos un defecto es:
P(X ≥ 1) = 1 – P(X = 0) = 1 - 0.905
= 0.095
(c) Exactamente, 2 defectos.
Esto nos lleva a P(X = 2) = B(2;50,0.08)
= 50C2(.002)2(.998)50-2
= (1225) (.000004)(0.91)
= 0.0045
Como se ve arriba, al usar la distribución binomial, el proceso es largo y
complicado, por lo que es mejor usar la distribución de Poisson como una
aproximación a la binomial. En este instante, el lector deberá usar la distribución
Poisson y comparar los resultados obtenidos.
4-11
Ejemplo #4. En un estudio de higiene industrial y seguridad, una población de

trabajadores de un grupo de industrias que manejan procesos, donde hay ruido, el
5% sufren de problemas emocionales que interfieren con su trabajo. Si se saca una
muestra aleatoria de 60 trabajadores, ¿Cuál es la probabilidad del número de
trabajadores, quienes sufren disturbios emocionales? Hacer este problema con la
distribución binomial y, luego, con la distribución Poisson como una aproximación
a la binomial, y comparar resultados.
(a) Más de 2 trabajadores sufran de disturbios emocionales
(b) Cuando menos 4
(c) 5 o más
Solución:
Usando la distribución binomial con p = .05, n = 60, X > 2
b(x;60,.05) = 60Cx (.05)x (.95)60-x
B(0;60,.05) = 60C0 (.05)0 (.95)60-0
= (1) (1) (0.046)
= 0.0461
B(1;60,.05) = 60C1 (.05)1 (.95)60-1
= 60 (.05)(0.049)
= 0.1455
B(2;60,.05) = 60C2 (.05)2 (0.95)60-2
= (60)(59)/2 (.0025)(0.051)
= 0.2259
B(3;60,.05) = 60C3 (.05)3 (.95)60-3
= (60)(59)(58)/6 (.00013)(.053)
= 0.2298
4-12
B(4;60,.05) = 60C4 (.05)4 (.95)60-4

= (60)(59)(58)(57)/24 (.0000063)(0.057)
= 0.1724
Nótese que todos estos valores también se pueden sacar usando la tabla de Poisson
de probabilidades individuales, es decir, buscando λ = 0.05 y X = 0, 1, 2, 3, 4.
(a) Más de dos trabajadores sufran de disturbios emocionales
P(X > 2) = 1 – P(X ≤ 2) = 1 – P(0) + P(1) + P(2)
= 1 – (0.0461 + 0.1455 + 0.2259)
= 0.5825
(b) Cuando menos 4 dice:
P(X ≥ 4) = 1 – P(X < 4) = 1 – P(0) + P(1) + P(2) + P(3)
= 1 - .6535
= 0.3465
(c) 5 o más dice:
P(X ≥ 5) = 1 – P(X ≤ 4) = 1 – P(0) + P(1) + P(2) + P(3) + P(4)

= 1 - .8285
= 0.1715
Ahora, usando la distribución de Poisson dentro de sus propios derechos

necesitamos calcular λ, es decir, µ = np = (60)(.05) = 3.0, pero primero vamos a
calcular las probabilidades para x = 0, 1, 2, 3, 4 antes de calcular el inciso (a).
Usando la función (4-1), P(X) = f(x) = µx e-µ/x! y sustituyendo los valores da:
P(X = 0) = 3.00 (e-3.0) / 0! = 0.0498
P(X = 1) = 3.01.0 (0.0498)/1! = 0.1494
P(X = 2) = 3.02.0 (0.0498)/2! = 0.2240
4-13
P(X = 3) = 3.03.0 (0.0498)/3! = 0.2240
P(X = 4) = 3.04.0 (0.0498)/4! = 0.1680
(a) Más de 2 trabajadores sufran disturbios emocionales

P(x) = P(X > 2) = 1 – P(X ≤ 2) = 1 – P(x = 0, 1, 2)
= 1 – 0.423
= 0.5770
(b) Cuando menos 4 trabajadores
P(X ≥ 4) = 1 – P(X ≤ 3) = 1 – 0.6472
= 0.3528
(c) 5 o más trabajadores
P(X ≥ 5) = 1 – P(X ≤ 4) = 1 – 0.8152
= 0.1848
Ejemplo #5. De los ítems producidos por una factoría, el 3% están defectuosos.
Una muestra de 25 ítems se selecciona para una inspección. Usar la distribución
binomial y la Poisson y comparar los resultados de los siguientes:
(a) Exactamente 4 ítems estarán defectuosos
(b) 3 o más objetos estarán defectuosos
Solución:
Usando la distribución binomial:
(a) 0.0054
(b) 0.038
Usando la distribución de Poisson:
(a) 0.006
(b) 0.041
4-14
Ejemplo #6. Un promedio de 3 autos arriban a la caseta de cobro de una carretera

cada minuto. Si esta tasa es aproximada por un proceso Poisson, ¿cuál es la
probabilidad de qué, exactamente, 5 autos arribarán en un periodo de un minuto?
Solución:
Aquí, λ = µ = 3, x = 5
Usando la ecuación f(x) = µx e-µ / x! y sustituyendo los valores obtenemos:
P(X = 5) = (3)5 (e)-3 / 5! = [(243)(.0498)] / 120 = .1008
El valor de .1008 es la probabilidad de que 5 autos arriben en un minuto
Nótese que este problema también se puede resolver usando la tabla de
probabilidades de Poisson, es decir, para valores específicos de µ y de x que dan
una solución más fácil y precisa. Para esto, buscamos el valor de µ = 3 con x = 5 y
da 0.9161, pero como la tabla da las sumatorias acumuladas, le restamos 1. Por lo
tanto, P(X = 5) = 1 - 0.9161 = .08 ~ .1 (Ver tabla de valores selectos de la
distribución acumulada de Poisson)
Ejemplo #7. El 10% de las herramientas producidas en cierto proceso de
manufactura son defectuosas. Encontrar la probabilidad de qué, en una muestra de
10 herramientas seleccionadas, aleatoriamente, exactamente, 2 herramientas sean
defectuosas. Hacer esto usando:
(a) La distribución de Poisson
(b) La distribución binomial.
Solución:
Aquí ponemos n = 10 herramientas. Entonces, probabilidad de una herramienta
defectuosa es, p = 10% = 0.10 y np = (10)(0.10) = 1.0, x = 2
(a) Usando la ecuación de Poisson:
p(x) = (µx e-µ) / x! o bien P(x) = µx e-µ / x!
4-15
Donde: p = 0.1, µ = np = (10)(0.1) = 1.0

Pr{de 2 herramientas defectuosas en 10} = (1.0)2 (e-1) / 2!
= 1/2e = 0.1839
(b) Usando la ecuación de Bernoulli
P(X = 2) = nCx px qn-x
Donde: n = 10
X=2
p = 0.1
q = 1 - p = 1 - 0.1 = 0.9
P(X = 2) = 10C2 (0.1)2 (0.9)10-2 = 10! / [2!(10-2)!] = 0.19
Ejemplo #8. En este problema aplicar la función estadística más apropiada. Siendo
así, si el 3.0% de los focos eléctricos manufacturados por una compañía están
defectuosos, entonces, encontrar la probabilidad de qué, en una muestra de 100
focos:
(a) Ningún foco esté defectuoso
(b) 1 foco esté defectuoso
(c) 2 focos estén defectuosos
(d) 3 focos estén defectuosos
(e) 4 focos estén defectuosos
(f) 5 focos estén defectuosos
Solución:
Aquí es más apropiado usar la distribución de Poisson, porque n es grande. Siendo
así, p = 0.03, n = 100, µ = np = (100)(0.03) = 3.0, x = 0, 1, 2, 3, 4, 5
(a) Usando la fórmula Poisson p(x,µ) = µx e-µ / x!, con e-3 = 0.04979
p(x,µ) = µx e-µ / x!
4-16
p(0,3) = (3.0)0 (e)-3.0 / 0! = (1)( 0.04979) = 0.04979

(b) P(1,3) = (3)1 (e)-3.0 / 1! = (3)(0.04979)/1 = 0.1494
(c) P(2,3) = (3)2 (e)-3.0 / 2! = (9)(0.04979) / 2 = 0.44811
(d) P(3,3) = (3)3 (e)-3.0 / 3! = (27)(0.04979) / 6 = 0.2241
(e) P(4,3) = (3)4 (e)-3.0 / 4! = (81)(0.04979) / 24 = 0.1680
(f) P(5,3) = (3)5 (e)-3.0 / 5! = (243)(0.04979) / 120 = 0.1008
Propiedades de la distribución de Poisson
TABLA 4.1. Tabla mostrando algunas propiedades de la distribución de Poisson.
________________________________________________________________
Promedio µ=λ
Varianza σ2 = λ
Desviación estándar σ=√λ
Momento del coeficiente del sesgo α3 = 1/√ λ
Momento del coeficiente de kurtosis α4 = 3 + 1/λ
________________________________________________________________
(Fuente: Spiegel, 1961)
Ejemplo #9. La probabilidad de que una persona muera de un arresto cardiaco, por
fumar en exceso, es de 0.002. Encontrar la probabilidad de que menos de 5
personas, de las siguientes 2,000, morirán de un síntoma del corazón. Encontrar,
también, el promedio y la varianza.
Solución:
Primero calculamos el promedio y la varianza. Las fórmulas para esto son:
µ = np = (2000)(0.002) = 4.0
σ2 = npq = (2,000)(0.002)(0.998) = 3.992
4-17
Usando la tabla de Poisson y siguiendo este razonamiento da:

P(X < 5) = P(X ≤ 4)
= 0.6288 (de la tabla de Poisson)
Ejemplos ilustrando como graficar los datos de la variable aleatoria X
Ejemplo #10. Supóngase que en un estudio de contaminación ambiental se instala
una red de 3,840 sensores de alto volumen para medir las concentraciones de
partículas atmosféricas, menores que 10 micras. Si la probabilidad de que
cualesquiera de estos muestreadores falle es de .00083 durante un año, entonces,
determinar las probabilidades de que 0, 1, 2, 3, 4,… de los muestreadores fallen
durante el año en cuestión. Hacer una gráfica usando papel semilogaritmo.
Solución:
Aquí se pudiera usar la distribución binomial, porque habla de una situación
binaria, es decir, fallar o no fallar. Sin embargo, debido a que n es muy grande y p
es pequeña, la distribución Poisson es aplicable. Siendo así, primero calculamos el
valor de λ.
λ = np = (3840)(0.00083) = 3.2
Enseguida, establecemos nuestro punto de partida con la variable aleatoria X, como
variable independiente.
f(x) = p(x;3.2) = (3.2)x e-3.2 / x!
Luego sustituimos los valores de la variable aleatoria X en la fórmula de arriba
p(0;3.2) = 3.20 (0.041)/0! = 0.041
p(1;3.2) = 3.21 (0.041)/1! = 0.130
p(2;3.2) = 3.22 (0.041)/2! = 0.209
p(3;3.2) = 3.23 (0.041)/3! = 0.223
p(4;3.2) = 3.24 (0.041)/4! = 0.178
4-18
p(5;3.2) = 3.25 (0.041)/5! = 0.114

p(6;3.2) = 3.26 (0.041)/6! = 0.061
p(7;3.2) = 3.27 (0.041)/7! = 0.028
p(8;3.2) = 3.28 (0.041)/8! = 0.011
p(9;3.2) = 3.29 (0.041)/9! = 0.00397
p(10;3.2) = 3.210 (0.041)/10! = 0.0013
Para graficar los datos de la variable aleatoria X (abscisa) y de la
probabilidad f(x) = p(x;µ) (ordenada), se usa papel semilogarítmico. Por ejemplo,
la Figura 4.1 muestra el uso de papel semilogarítmico usado para graficar los
valores de la variable aleatoria X (en la abscisa) y de la probabilidad f(x) = p(x;µ).
La gráfica con estos valores se muestra abajo. De la Figura 4.1 estimar las
siguientes probabilidades. (El estudiante lo deberá hacer).
(a) La probabilidad de que fallen (inclusivamente), entre 3 y 9 muestreadores
(b) La probabilidad de que fallen más de 8 muestreadores
(c) La probabilidad de que fallen (exclusivamente), entre 4 y 6 muestreadores
(d) La probabilidad de que fallen más de 10 muestreadores
(e) La probabilidad de que fallen todos los muestreadores
(f) La probabilidad de que no falle ningún muestreador
4-19
Figura 4.1. Figura mostrando el uso del papel semilogaritmo graficando los valores
de la variable aleatoria X (en la abscisa) y de p(x;µ) en la ordenada. (Elaboración
propia)
4-20
Problemas de la distribución de Poisson usando el programa de computadora

Minitab
Ejemplo #11.Supóngase que el número X de huracanes observados en la región del

Caribe, durante los últimos 3 años tiene una distribución de Poisson con un
promedio de λ = µ = 8. Calcular las siguientes probabilidades:
(a) La probabilidad de que ocurran a lo más 8 huracanes.
(b) La probabilidad de que ocurran exactamente 8 huracanes.
(c) La probabilidad de que ocurran cuando menos 9 huracanes.
(d) La probabilidad de que ocurran entre 5 y 8 huracanes incluso.
(e) La probabilidad de que ocurran entre 5 y 8 huracanes excluso.
(f) La probabilidad de que ocurran a lo más 8 huracanes, pero más de 5.
(g) La probabilidad de que ocurran más de 2 huracanes.
(h) Hacer gráficas de P(X = x) y P(X ≤ x) en función de x.
Solucion:
Procedimiento: Primeramente, usando el programa Minitab buscamos las
ventanillas señaladas abajo, es decir procediendo como:
Calc > Probability distribution > Poisson..
En la ventana de “Poisson distribution” para la primera corrida punteamos en
“Probabability” y, para la segunda corrida ponemos el punto en “Cummulative
Probability”. En la ventana de “Mean” ponemos el valor del promedio λ o µ igual a
8. En la ventana de “Input column” ponemos C1 (los valores de la variable
aleatoria x = 0, 1, 2,...n). Aquí, es conveniente instruir al programa de que ponga
los valores de las probabilidades de función de masa (probabilidades individuales
P(X = x) en la columna C2. Asimismo, se instruye al programa que ponga las
probabilidades acumuladas P(X ≤ x) en la columna C3. Una vez, que se corre el
4-21
programa, se genera la tabla de abajo que muestra los resultados.
TABLA 4.2. Tabla mostrando la variable aleatoria x en función de la probabilidad,

P(X=x) y de la probabilidad acumulada, P(X≤ x).
Solución:
(a) P(X ≤ 8). Aquí, este problema se puede hacer de dos maneras. Primero, se
puede hacer sumando las probabilidades de función de masa P(X = x), es decir, de
P(X = 0) hasta P(X = 8) de los valores de la columna C2 de la tabla. No obstante,
este procedimiento es muy largo e impráctico. Sin embargo, si usamos las
probabilidades acumuladas de la columna C3 o de la Figura 4.3, el resultado es
precisamente 0.59255.
(b) P(X = 8). Este cálculo lo hacemos leyendo x = 8 en la columna C2 de la tabla y
da 0.1396.
(c) P(X ≥ 9). Este cálculo se hace tomando el complemento. Es decir,
P(X ≥ 9) = 1 – P(X < 9) = 1 – 0.5925 = 0.4075.
(d) P(5 ≤ X ≤ 8) = 0.492
(e) P(5 < X < 8) = 0.251
4-22
(f) P(5 < X ≤ 8) = P(X = 6) + P(X = 7) + P(X = 8) = 0.3159 (de C2)

(g) 1 – P(X ≤ 2) = 0.9863
(h) Ver Figura 4.2 de abajo. Para esto, usar Graph > plot. En la ventana de “Graph
variables” poner C3 en Y y C1 en X. En “Edit attributable” poner dash y, luego,
dash en “Line type”, etc.
S c a tte r plot of P (X = x) v s X
0.14
0.12
0.10
0.08
P(X=x)
0.06
0.04
0.02
0.00
0 2 4 6 8 10 12 14 16
X
Figura 4.2. Gráfica mostrando la probabilidad, P(X = x) en función de la variable

aleatoria x.
Scatterplot of P(X<=x) vs X
1.0
0.8
0.6
P(X<=x)
0.4
0.2
0.0
0 2 4 6 8 10 12 14 16
X
Figura 4.3. Gráfica mostrando la probabilidad acumulada, P(x ≤ X) en función de

la variable aleatoria x.
4-23
4.1. Supóngase que X tiene una distribución Poisson con promedio de 4. Calcular
a. P(X = 0) (0.0183)
b. P(X ≤ 2) (0.2379)
c. P(X = 4) (0.1953)
d. P(X = 8) (0.1953)
e. P(X ≥ 2) (0.9987)
4.2. Si la probabilidad de que un cheque sea devuelto por el banco es de 0.0003 y
10,500 cheques se cambian, entonces, ¿cuál es el número promedio (λ o µ) de
cheques fraudulentos?
4.3. La probabilidad de que un individuo sufra de una mala reacción de una
inyección es de .001. Determinar la probabilidad que de 2,000 individuos,
exactamente 3 sufran una mala reacción. Hacer este problema usando la
distribución binomial y la Poisson. (Usando la distribución de Poisson = 0.1893;
usando la distribución binomial = 0.181)
4.4. El número promedio (λt) de partículas radiactivas que pasan a través de un
contador, durante un milisegundo, en un experimento de laboratorio es de 3. ¿Cuál
es la probabilidad de que entren 6 partículas en un milisegundo determinado?
Sugerencia: usar p(x;λt) = e-λt (λt)x/x!
4.5. Un estudio en una fábrica de aparatos electrónicos llevó al gerente a concluir
que el número de accidentes, por persona, durante cierto año sigue a la distribución
Poisson. La experiencia demostró que el número promedio de accidentes por
persona fue de 0.3. ¿Cuál es la probabilidad de que un empleado no tendrá un
accidente durante el siguiente año? (0.7410)
4-24
4.6. Con referencia al problema 4.5, ¿Cuál es la probabilidad de que, un empleado

seleccionado, aleatoriamente, tendrá cuando menos 1 accidente (X ≥ 1) en el
siguiente año?
4.7. Refiriéndose al problema 4.5:
(a) ¿Cual es la probabilidad de que un empleado tendrá, exactamente, un
accidente? (0.2270)
(b) Estimar la probabilidad de que un empleado tendrá a lo más un accidente.
4.8. Asumir que el número de autos que arriban a la caseta de cierta autopista sigue
a una distribución de Poisson. Si el número promedio de autos que arriban en 1
hora es de 6, ¿cuál es la probabilidad de que en 1 hora dada, no llegue ningún auto?
4.9. Refiriéndose al problema anterior, ¿Cuál es la probabilidad de que,
exactamente, 5 carros lleguen en 1 hora? (0.1760)
4.10. Refiriéndose al problema anterior, ¿Cual es la probabilidad de que más de 5
carros (X > 5) arriben en 1 hora?
4.11. En un estudio de contaminación del aire, en las terminales camiones de carga,
se sabe que el número promedio de camiones que llegan diariamente, a una
terminal de camiones de carga es de 3. Para que los complejos habitacionales no se
contaminen con los humos de los camiones, se restringe el número de camiones
que arriban y se establece un límite de no más de 8 por día. Hacer una gráfica con
los resultados y calcular lo siguiente:
(a) La probabilidad de que se les niegue la entrada a los camiones cuando el
número exceda 8. (0.39)
(b) La probabilidad de que arriben entre 2 y 4 camiones, incluso. (.0012)
(c) La probabilidad de que no arribe ningún camión. (0.050)
(d) P(X = 0, 1, 2, 3,....., ∞) (1.000)
4-25
(e) Asumiendo que este estudio se hiciera en la época calurosa, ¿cuál sería la
diferencia en los resultados, si el estudio se hiciera en invierno: aumentaría o
disminuiría la probabilidad?
4.12. Suponiendo que la probabilidad de que cierto tipo de semilla no germine sea
de .04. Si se plantan 25 semillas, ¿Cuál es la probabilidad de que 5 o menos
semillas no germinen?
4.13. Asumir que el número de autobuses que llegan a una terminal siga a un
proceso Poisson. Si el promedio de autobuses que llegan durante una hora es de 5,
calcular los siguientes enunciados:
(a) La probabilidad de que en 1 hora dada no llegue ningún autobús. (0.007)
(b) La probabilidad de que exactamente 5 llegarán en 1 hora. (0.176)
(c) La probabilidad de qué más de 5 autobuses llegarán en una hora. (0.384)
4.14. El número promedio de carros tanque que arriban cada día a cierto puerto
marítimo es de 9. Las facilidades portuarias pueden manejar a lo más 15 carros
tanques (X ≤ 15) por día. ¿Cuál es la probabilidad de que en un día dado tengan
que ser regresado los carros tanques cuando el número exceda 15?
4.15. En la manufactura de un alambre de cobre, supóngase que el número de fallas
sigue a una distribución Poisson, con un promedio de 2.3 fallas por milímetro.
Calcular la probabilidad de:
(a) Tener exactamente 2 fallas en un milímetro del alambre de cobre. (0.2650)
(b) Tener 10 fallas en cinco milímetros de alambre. (0.113)
(c) La probabilidad de tener al menos una falla en dos milímetros. (.899)
4.16. En un estudio de higiene industrial y seguridad estatal, el número de baches
en una sección de una carretera interestatal que requieren de reparación urgente,
4-26
para evitar accidentes, puede modelarse con una distribución Poisson. Si la

carretera tiene un promedio de 2 baches por milla, entonces:
(a) ¿Cuál es la probabilidad de que no haya baches que reparar en un tramo de 5
millas?
(b) ¿Cuál es la probabilidad de que sea necesario reparar al menos 1 bache en un
tramo de media milla?
4.17. La probabilidad de que un paciente se recupere de una rara enfermedad es de
0.4. Si se sabe que 15 personas han contraído la enfermedad y asumiendo una
distribución binomial, ¿Cuál es la probabilidad de que?:
(a) Cuando menos 10 pacientes sobrevivan P(X ≥ 10). (0.3380)
(b) De 3 a 8 pacientes sobrevivan P(3 ≤ X ≤ 8)
(c) Exactamente 5 pacientes sobrevivan P(X = 5) (0.1859)
4.18. Si el número de llamadas telefónicas que un operador recibe en un intervalo
de 10 minutos sigue a una distribución Poisson, con λ = µ = 1 (un promedio de de
una llamada cada 10 minutos). (Pfaffenberger, et al. 1987). Hacer lo siguiente:
(a) ¿Cuál es la probabilidad de que la operadora no recibirá ninguna llamada en el
intervalo de 10 minutos?
(b) ¿Cuál es la probabilidad de que recibirá menos de 4 llamadas?
(c) ¿Cuál es el número más probable de llamadas que la operadora recibirá?
4.19. Suponiendo que tenemos un proceso de producción de equipo de control de
ciclones que deben de tener una eficiencia de recolección del 75% y sabemos que
la probabilidad de que no cumplan con esta eficiencia es de p = 0.01. Una muestra
aleatoria de 100 ciclones se selecciona. ¿Cuál es la probabilidad de que haya n
ciclones que no cumplan con el 75% de eficiencia en esta muestra? Usar la
distribución binomial y la distribución de Poisson como una aproximación. Hacer
4-27
una tabla con los resultados de las dos distribuciones y luego hacer una grafica y
comparar los resultados.
Tabla mostrando los resultados usando la distribución binomial y la distribución de
Poisson. (Elaboración propia)
Distribución binomial Distribución de Poisson
n b(x;100,0.01) p(x;1)
0 0.366 0.032 0.367 0.879
1 0.369 0.730 0.367 0.879
2 0.184 0.865 0.183 0.940
3 0.060 0.999 0.061 0.313
4 0.014 0.942 0.015 0.328
5 0.002 0.898 0.003 0.066
6 0.000 0.463 0.000 0.511
7 0.000 0.063 0.000 0.073
8 0.000 0.007 0.000 0.009
9 0.000 0.001 0.000 0.001
4.20. Considérese la producción de hacer cojinetes de rodamiento (elementos que

sirven para soportar y guiar un eje o árbol de transmisión del vehiculo), si la
probabilidad de uno de éstos, de ser defectuoso, es de 0.01. Si tenemos una
muestra de 1000 cojinetes, calcular la probabilidad que haya: (Taro Yamane, 1961)
(a) x cojinetes defectuosos
(b) 4 cojinetes defectuosos
(c) cuando menos 3 cojinetes defectuosos.
4.21. El periódico USA Today (noviembre 15, 1993), reportó que Parkfield,
California, está considerada como la capital del mundo, en cuanto a temblores de
tierra debido a que está situada encima de la falla de San Andrés. Desde 1857,
Parkfield ha tenido temblores de tierra con un promedio de uno cada 22 años.
(Brase, et al. 1995).
4-28
(a) Explicar porque la distribución de Poisson sería una buena selección para r =
número de terremotos en un intervalo de tiempo dado
(b) Calcular la probabilidad de que cuando menos un terremoto, de grandes
magnitudes, ocurra en los siguientes 22 años. Redondear λ a las centésimas. (.63)
(c) Calcular la probabilidad de que no habrá un terremoto de grandes magnitudes
en los siguientes 22 años. Redondear λ a las centésimas. (0.37)
(d) Calcular la probabilidad de que ocurra cuando menos un gran terremoto en los
siguientes 50 años. (1.0)
(e) Calcular la probabilidad de que no ocurra un gran terremoto dentro los
siguientes 50 años. (0.980)
4.22. En un estudio de higiene industrial y seguridad se sabe que el número de
accidentes que pasan en la línea de ensamblaje tiene un promedio semanal de 3.
Encontrar lo siguiente:
(a) La probabilidad de que una semana, la línea de ensamblaje no tendrá ningún
accidente.
(b) La probabilidad de que, cuando menos 3 accidentes ocurrirán en una semana.
(c) La probabilidad de que ocurran entre 2 y 6 accidentes excluso.
4.23. En una investigación relacionada con el ahorro de combustible, en el 40% de
los coches no americanos de 4 cilindros, el consumo de gasolina se reduce
considerablemente (con relación a los coches americanos de 6 u 8 cilindros). Si se
saca una muestra aleatoria de 15 coches de 4 cilindros, calcular la probabilidad que
4 de estos autos de 4 cilindros sean eficientes en el ahorro de gasolina. Hacer este
problema usando la distribución binomial y la distribución normal como
aproximación. (B(4;15,0.04) = 0.1268); P(Z < -.7))
4-29
4.24. En un estudio de higiene industrial y seguridad, es decir, en una fábrica de

ensamblamientos de carburadores en la fabricación de autos, el número de
accidentes en esta planta de ensambles tiene un promedio de 5.0 accidentes por
mes. Siendo así, estimar los siguientes enunciados:
(a) ¿Cuál es la probabilidad de que ocurran 10 accidentes en un mes dado?
(b) ¿Cuál es la probabilidad de que ocurran cuando menos 2 accidentes?
(c) ¿Cuál es la probabilidad de que no habrán más de 25 accidentes en un año?
4.25. Usando los datos de la tabla de Molina de abajo, para varios valores de X y
de λ mostrar qué, a medida que el valor de λ (o µ) aumenta, las distribuciones de
Poisson se aproximan a la distribución normal. Para esto, hacer una gráfica
sobrepuesta usando los valores de la tabla de Molina dada abajo.
Tabla de Molina mostrando los datos de este problema.
__________________________________________________________________
Variable aleatoria X Valores de Lambda (λ)
__________________________________
0.8 1.0 2.0 3.0 7.0
__________________________________________________________________
0 0.45 0.37 0.14 0.05 0.00
1 0.36 0.37 0.27 0.15 0.01
2 0.14 0.18 0.27 0.22 0.02
3 0.04 0.06 0.18 0.22 0.05
4 0.01 0.02 0.09 0.17 0.10
5 0.04 0.10 0.13
6 0.01 0.05 0.15
7 0.02 0.15
8 0.01 0.15
9 0.10
10 0.07
11 0.05
12 0.03
13 0.01
14 0.01
15 0.00
___________________________________________________________________
Fuente: Taro Yamane. Statistics, An Introductory Analysis (1964)
4-30
CAPITULO 5
Distribuciones de probabilidad continua.- Función de densidad de probabilidad

de la variable aleatoria continua X.- Fórmula fundamental del cálculo.-
Distribución normal y sus características.- Relación entre la curva normal y la
binomial.- Áreas bajo la curva normal.- Distribución exponencial.- Distribución
Gamma.- Distribución Weibull.- Intervalos de confianza para µ.- Estadística de
inferencia: teoría de decisión estadística y pruebas de hipótesis.- Pruebas de
hipótesis estadísticas. Hipótesis nula (Ho:) e hipótesis alternativas (H1:, H2:, H3:).-
Tipos de errores I (alfa) y II (beta).- Pruebas de hipótesis no tradicionales
usando el valor de la probabilidad p.- Pruebas de hipótesis para uno y dos
promedios poblacionales (µ1, y µ2).- Pruebas de hipótesis para las diferencias de
dos promedios poblacionales (µ1 – µ2), para muestras grandes (n ≥ 30) usando la
distribución normal, con varianzas conocidas e iguales (σ21 = σ22).- Intervalos de
confianza para dos promedios poblacionales.- Pruebas de hipótesis e intervalos
de confianza para proporciones.
Definición de variable aleatoria continua

Una variable aleatoria X se dice que es continua si, su conjunto de valores posibles es
un intervalo completo de números, esto es, si por a < b cualquier número X entre a y b
es posible. En términos simples, la variable aleatoria X se define, como la variable
aleatoria que contiene un intervalo finito o infinito de números reales. De esta manera,
una variable que, teóricamente, pueda asumir cualesquier valor entre dos valores
dados, es continua; de otra manera es discreta. En general, mediciones dan lugar a
datos continuos, mientras que enumeraciones o conteo da lugar a datos discretos. Por
5-1
ejemplo, el número de niños en una familia pueden tener valores de 0, 1, 3, 4,… pero
no pueden tener valores de 2.5, o 3.842. Por otro lado, ejemplos de variables
continuas son las alturas de un grupo de personas que se pueden expresar como 62,
63.8 pulgadas, 65.83412 pulgadas, etc. Por ejemplo, decir cuales de los siguientes
términos representan datos discretos o continuos.
(a) Número de acciones bursátiles vendidos cada día en el mercado bursátil.
Solución: Aquí la variable es aleatoria discreta.
(b) Las temperaturas registradas cada media hora en la oficina de meteorología.
Solución: Aquí la variable es aleatoria discreta.
(c) Las longitudes de 1000 tornillos producidos por una fábrica.
Solución: Aquí la variable es continua.
Función de densidad de probabilidad de la variable aleatoria continua X
Una función f(x) es una función de densidad de probabilidad de la variable aleatoria
contٌ
inua X para el conjunto de posibles valores de X están en cualquier intervalo de
números reales [x1, x2]. Esta función llena lo siguiente: (Montgomery et al. 1996)
1. fx (x) ≥ 0 (5-1)
∞
2. ∫ -∞ f(x )dx = 1 (5-2)
x2
3. P (x1 ≤ X ≤ x2) = ∫ x1 fx(u) du (5-3)
Definición: Dejemos que X sea una variable aleatoria continua, entonces la

distribución de probabilidad o función de densidad de probabilidad de X es una
función f(x) de tal manera que, para cualesquier dos números a y b con a ≤ b,
entonces:
5-2
b
P(a ≤ X ≤ b) = ∫ a f(x) dx (5-4)
Para que la función de densidad de probabilidad sea válida debe de satisfacer las
siguientes dos condiciones:
1. f (x) ≥ 0 para todas las x’s (5-5)
∞
2. ∫ -∞ f (x) dx = área bajo la gráfica completa de f (x) = 1 (5-6)
Fórmula fundamental del cálculo
Dejemos que f sea una función que se define en el intervalo cerrado de [a, b],
b
entonces, el integral definido de f de a a b, denotado por ∫ a f(x) dx se da por:

b
∫ a f (x) dx = lim Σf (wi) ∆xi (5-7)
i
||P||→0
Cualquier antiderivada de f(x) puede ser usada para evaluar el integral (5-7).
Entonces, si F es una antiderivada de f, usamos la fórmula de abajo:
b
∫ a f (x) dx = F(b) – F(a) (5-8)
Para computar la función de arriba F(b) – F(a) introducimos la relación:
b b
∫ a f (x) dx = F (x) │ a = F (b) – F (a) (5-9)
Ejemplo #1. Si una variable aleatoria tiene la densidad de probabilidad de:
F (x) {e-2x para x > 0, o para x ≤ 0}
5-3
Determinar las probabilidades de que la variable aleatoria X adopte un valor de:

(a) Entre 1 y 3
(b) Mayor que 0.5
(c) A lo más 3
Solución:
b
Usando P(a ≤ X ≤ b) = ∫ a f(x) dx Intervalo [1, 3]
3
(a) ∫ 1 e-2x dx = (-0.5) [e-2 – e-6] = 0.067
∞
(b) ∫ 0.5 e-2x dx Intervalo [0.5, ∞]
3
(c) ∫ 0 e-2x dx = (-0.5) [e-6 – 1] = 0.5 Intervalo [0, 3]
Ejemplo #2. Simbolizar con X la cantidad de tiempo de incubación de bacterias en un
plato de prueba durante 2 horas. Supóngase que la variable aleatoria X tiene función
de densidad de f (x) = 0.5x, para el conjunto posible de valores de X en el intervalo (0
≤ X ≤ 2). Siendo así, calcular las siguientes probabilidades:
(a) P (X ≤ 1)
(b P (.5 ≤ X ≤ 1.5)
(c) P (1.5 < X)
Solución:
5-4
1 1
(a) ∫ 0
2
0.5x dx = 0.5 (x /2)│0 = 0.5 (0.5 – 0/2) = 0.25
1.5 1.5
(b) ∫ 0.5
2
0.5 x dx = 0.5 (x /2)│0.5 = (0.5)(1.125 - .125) = 0.5
2.0 2.0
(c) ∫ 1.5
2
0.5 x dx = 0.5(x /2) │1.5 = 0.5(2.0 – 1.125) = 0.44
Ejemplo #3. Supóngase que el error en la reacción de temperatura, en oC, de una

incubadora de un laboratorio de bacteriología, para la incubación de un plato de agar,
es una variable X continua que tiene una densidad de probabilidad de f(x) = x2/3,
donde X puede asumir valores de entre (-1 < X ≤ 2). Encontrar la probabilidad de
densidad de que la temperatura esté entre 0 oC y 1 oC.
Solución:
Aquí queremos encontrar P(0 < X ≤ 1) en el intervalo [0,1]. Entonces…

1 1
P(0 < X ≤ 1) = ∫ 0
2 3
x /3 dx = x /9 │ 0 = 1/9
Ejemplo #4. La proporción de industrias que responden a cierto cuestionario

ecológico (voluntario, pero que, actualmente, va a ser obligatorio) es una variable
aleatoria continua X cuya función de densidad es f(x) = 2(x + 2)/5. Esta función tiene
una variable aleatoria X puede asumir valores de 0 < X < 1. Hacer lo siguiente:
(a) Mostrar que P(0 < X < 1) = 1
(b) Encontrar la probabilidad de que más de 25%, pero menos que 50% de las
industrias contactadas responderán voluntariamente a esta solicitación.
Solución:
5-5
(a) Usando la relación matemática de f(x) y g(x) cuyas funciones son continuas y
tienen una antiderivada en el intervalo [a, b], siendo así, entonces, usamos la función
(5-10) de abajo y sustituyendo da:
b b b
∫ a [f(x) + g(x)] dx = ∫ a f(x) dx + ∫ a g(x) dx (5-10)
1 1 1
∫ 0 (2x/5 + 4/5) dx = ∫ 0 2x/5 dx + ∫ 0 4/5 dx = 2x2/(2)(5) + 4x/5
1 1
= x2/5│0 + 4x/5 │0 = [1/5 – 0] + [4/5 – 0]
=1
(b) Aquí el intervalo es [0.25 < X < .50]. Esto dice que, a = 0.25 y b = 0.50
.50 .50 .50
Por lo tanto: ∫ .25 (2x/5
2
+ 4/5) dx = x /5│ .25 + 4x/5 │ .25
= [(0.5)2 /5 – (0.25)2/5] + [4(0.5)/5 – 4(0.25)/5]

= 19/80
La distribución normal
La distribución normal es el ejemplo más importante de una distribución de

probabilidad continua. Abraham De Moivre (1667-1754) la inició en 1733.
Desafortunadamente, su trabajo se perdió y, casi 100 años después, Karl Gauss (1777-
1855) y Pierre Simon, Marques de Laplace desarrollaron, de manera independiente, la
distribución normal. Por esta razón, a la distribución normal también se le llama
distribución Gaussiana.
Características de la distribución normal
1. Es simétrica alrededor de su promedio µ y en forma de campana.
5-6
2. El promedio, la mediana y la moda son iguales.

3. El área total bajo la curva es igual a uno. El 50% de las observaciones están a la
derecha del promedio y el otro 50% de las observaciones están a la izquierda del
promedio.
4. La distribución normal se determina completamente por sus parámetros µ y σ.
Cuando µ = 0 y σ = 1 la distribución normal está en su forma estandarizada.
La distribución normal es realmente una familia de distribuciones distinguida
una de la otra por los valores de µ y de σ. Sin embargo, el miembro más importante de
esta familia de distribuciones es la que tiene un promedio de 0 y una desviación
estándar de 1. La ecuación de la distribución normal estándar se escribe como:
f (z) = 1/√ 2π exp -0.5 z 2 -∞<z<+∞ (5-11)
Usualmente, se usa la letra minúscula z por la variable aleatoria que resulta.
Áreas bajo la curva normal
La curva de cualquier distribución continua de probabilidad o función de densidad se

constituye de tal modo que, el área está limitada por los dos puntos x = xi y x = x2 y es
igual a la probabilidad de que la variable aleatoria X asuma un valor entre x = xi y x =
x2. Entonces, el área para la curva normal se da por la función (Walpole et al. 1992):
X2
P(x1 < X < x2) = ∫ x1 n (x;µ,σ) dx (5-12)

x2
= 1/√ 2π σ ∫ x1 exp-(0.5)[(x-µ)/σ]2 dx (5-12a)
Sin embargo, es difícil resolver las integrales de las funciones de densidad normal,
debido a que no se pueden integrar en forma cerrada, entre cada par de límites de a y
b. Debido a esta situación se hace necesario la tabulación de las áreas de la curva
5-7
normal. De cualquier manera, la tabla de la distribución normal estándar con µ = 0 y σ

= 1 y sus entradas son los valores de:
z
F(z) = 1/√ 2π ∫ ∞ exp [-0.5 t2] dt (5-13)
Además, sería muy difícil hacer una tabla por separado para cada valor de µ y
σ. Afortunadamente, es posible transformar todas las observaciones de cualquier
variable aleatoria normal X a nuevo conjunto de observaciones de una variable
aleatoria normal z con promedio de 0 y varianza de 1. Las transformaciones se hacen
usando la fórmula de la variable aleatoria normal estandarizada z que se usa para
transformar cualquier variable aleatoria normal X con promedio µ y desviación
estándar σ a la distribución normal estandarizada. Esta fórmula para calcular las
probabilidades de cualquier distribución normal (no estandarizada) se da como:
X–µ
Z = ———— (5-14)
σ
Su estimador de la muestra es:
z = (X – X ) / s (5-15)
Como se dijo arriba, hay tablas que dan los resultados de la integración, por lo
tanto, no tenemos que hacer la integración para calcular las probabilidades. En cuanto
a las propiedades de la distribución normal, éstas se dan en la TABLA 5.0 de abajo.
5-8
TABLA 5.0. Tabla mostrando las propiedades de la curva normal o Gaussiana.

_________________________________________________________________
Promedio aritmético µ
Varianza σ2
Desviación estándar σ
Momento del coeficiente del sesgo α3 = 0
Momento del coeficiente de kurtosis α4 = 3
Desviación del promedio aritmético σ√ 2/π = 0.7979 σ
_________________________________________________________________
(Fuente: Spiegel, 1961)
La gráfica de la curva normal se muestra en la figura de abajo. De la gráfica puede

verse que, la curva es en forma de campana, es simétrica con respecto a la línea
dibujada perpendicularmente, al eje horizontal en el promedio µ. La gráfica va en
función de la frecuencia relativa y las desviaciones estándares. La desviación estándar
determina el esparcimiento de la curva. A medida que hay más variación en una
muestra o en una población, la curva se hace más achatada. El área total bajo la curva
es de 100%. Las gráficas de abajo muestran la distribución normal en diferentes
formas.
Figura 5.1. Esquema mostrando las áreas bajo la curva normal. (Brase et al. 1995)
De la Figura 5.1, se ve que, aproximadamente, el 68.27% de los valores de los datos
5-9
están dentro de una desviación estándar a cada lado del promedio; aproximadamente,
el 95.45% de los valores están dentro de dos desviaciones estándar en cada lado del
promedio; y aproximadamente, el 99.73% de las observaciones están dentro de tres
desviaciones estándar del promedio.
Figura 5.2 . Esta figura muestra las áreas correspondientes a valores de z = ±1, z = ±2
y z = ±3, correspondientes a las probabilidades de 68.27%, 95.45% y 99.73%,
respectivamente. (Elaboración propia).
De la Figura 5.2, nótese que, en términos de frecuencia relativa, la probabilidad entre z = 0 y z = +1,
es igual a .3413; la probabilidad entre z = +1 y z = 2 es igual a .1359 y, la probabilidad entre z = +2
y z = +3 es igual a .0228. Por simetría el área total es ≈ 1.
Distribución normal estándar
Como se dijo anteriormente, la distribución de una variable aleatoria normal, con

promedio igual a 0 y varianza igual a 1, se llama distribución normal estándar y se
denota con la variable aleatoria normal estandarizada Z = (X – µ)/σ. Sin embargo,
cuando se conoce el promedio y la desviación estándar, se llama distribución normal
no estandarizada. Aquí, es importante distinguir las diferencias entre la curva normal
estándar y la no estándar.
Ejemplo #5. Dada una distribución normal estándar, encontrar el área bajo la curva
5-10
que esté entre z = -1.97 y z = 0.86.

Solución:
El área entre z = -1.97 y z = 0.86 se denota como:
P(-1.97 < z < 0.86) = P(z < 0.86) – P(z < -1.97)
= 0.8051 – 0.0244 = 0.7807 (de la tabla de la distribución normal)
Los valores de la probabilidad que corresponden a la variable estandarizada z son de z

= 0.86 y z = -1.97 y se encuentran el la tabla de la distribución normal.
Ejemplo #6. Dada una distribución normal, con µ = 50 y σ = 10. Encontrar la
probabilidad de que X esté entre 45 y 62.
Solución:
Primeramente, aquí estamos hablando de todo el conjunto, no de una muestra. Para
esto transformamos los valores de X a valores de Z usando la fórmula de la variable
aleatoria estandarizada (5-14), Z = (X – µ) / σ. Los valores de Z correspondientes a X
= 45 y X = 62 se hacen usando esta fórmula. Sustituyendo los valores da:
Z45 = (45 – 50)/10 = -0.5
Y Z62 = (62 – 50)/10 = 1.2
Por lo tanto: P(45 < X < 62) = P(-0.5 < Z < 1.2)
= P(Z < 1.2) - P(Z < -0.5)
= 0.8849 – 0.3085
= 0.5764
Ejemplo #7. Se saca una muestra aleatoria de una distribución normal poblacional y
se calcula un promedio de X = 300 y una desviación estándar de 50. Encontrar la
probabilidad de que X asuma un valor mayor que 362.
Solución:
5-11
Primeramente, aquí se nota qué, ya no estamos hablando de una población usando µ,

como el promedio y σ como la desviación estándar. Ahora usamos la variable normal
estandarizada de la muestra de z = (X – X )/s, la cual es el estimador de la variable Z =
(X – µ)/σ. Siendo así, primero transformamos X = 362 al valor correspondiente de z
usando la fórmula anterior. (Nótese que en este caso usamos la fórmula de la variable
estandarizada z como el estimador de la variable Z poblacional, esto es, z = (X –
X )/s).
z362 = (362 – 300)/50 = 1.24
Por lo tanto, P(X > 362) = P(z > 1.24) = 1 – P(z < 1.24)
= 1 – 0.8925 = 0.1075
La distribución normal es una distribución de probabilidad continua (en

contraste con la Poisson, binomial, hipergeométrica, geométrica, etc., que son
distribuciones de probabilidad discretas). Esto quiere decir que, los resultados de un
experimento de probabilidad consisten de un innumerable e infinito conteo de
valores. Así, una distribución de probabilidad continua nos permite medir nuestra
variable a cualquier grado de precisión requerida y está asociada con variables
aleatorias continuas. En contraste, las distribuciones de probabilidad discreta son
como la distribución binomial o de Bernoulli y la Poisson, las cuales están asociadas
con variables aleatorias discretas.
Las variables discretas son mediciones precisas. Ejemplos de variables
discretas son el tamaño de una familia o el número de autos que se tienen, o el
número de estudiantes de una clase. Todas estas son variables discretas. Esto quiere
decir que, cuando algo se puede medir con precisión, entonces, es una variable
discreta. En contraste, las variables continuas no se pueden medir, precisamente,
5-12
cuando incrementamos la precisión de la medición sacamos un sistema de conteo más

fino. Una variable continua no viene en paquetes de unidad, sino que mide o
representa un grado de precisión arbitrario, es decir, redondeado. Ejemplos de
variables continuas son los pesos, la temperatura, la altura, las densidades, etc.
Relación entre la curva normal y la binomial
Si n es grande y, si ni p ni tampoco q están cercanas a cero, la distribución binomial
puede aproximarse a la normal, con la variable estandarizada dada por la función
estadística z = (x – np)/ √ npq.
La aproximación normal a la distribución binomial es buena si n es bastante
grande con respecto a p. En particular, esto es cierto cuando np > 10 y n(1 - P) > 10.
Para hacer las aproximaciones binomiales usando la distribución normal, se usa la
variable aleatoria estandarizada z. (¿Cuál versión de la variable aleatoria de z se
usaría: la variable aleatoria estandarizada de z poblacional o la variable aleatoria
estandarizada de z muestral?).
Por otra parte, Lapin (1982) recapitula el hecho de que la gráfica de la
distribución binomial tiende a la distribución normal a medida que n aumenta. Esto
sugiere qué, para muestras de tamaños grandes, la distribución binomial se aproxima
a la normal. Lapin da las guías aceptadas para usar las aproximaciones normales, de
acuerdo a la regla popular de que la aproximación normal a la distribución binomial
es adecuada, siempre y cuando, np ≥ 5 y n(1 – p) ≥ 5. La TABLA 5.1 muestra las
guías comúnmente aceptadas para usar la aproximación normal a la distribución
binomial. Sin embargo, se argumenta que algunos estadísticos insisten de que
tamaños de muestras más grandes que los dados en la TABLA 5.1 deben ser usados
antes de que la aproximación sea aceptable. Esto se debe a que, el sesgo de la
distribución binomial es tan pronunciado para tamaños de p grandes o pequeños de tal
5-13
manera que, la forma de campana se asume por la distribución binomial, solamente,

para un tamaño de n muy grande.
TABLA 5.1. Tabla mostrando las guías más comúnmente aceptadas para usar la
aproximación normal a la distribución binomial.
___________________________________________________________________
Siempre que p iguale a: Usar la aproximación normal, solamente,
si n no es más pequeña que:
___________________________________________________________________
.5 10
.40 o .60 13
.30 o .70 17
.20 o .80 25
.10 o .90 50
.05 o .95 100
.01 o .99 500
.005 o .995 1,000
.001 o .999 5,000
__________________________________________________________________
Fuente: Statistics for Modern Business Decision. Lawrece L. Lapin (1981).
Los siguientes ejemplos calculan las probabilidades para la distribución normal

estandarizada
Ejemplo #8. ¿Cuál es el área, la probabilidad, proporción o el porcentaje de encontrar

un valor de z bajo la curva o distribución normal entre los valores de z = -1.73 y z =
+2.45? Dibujar la gráfica.
Solución:
Delinear el intervalo de la variable aleatoria z, esto es, (-1.73 ≤ z ≤ 2.45) razonando
de la siguiente manera:
P(-1.73 ≤ z ≤ 2.45) = P(z ≤ 2.45) – P(z ≤ -1.73)
Buscando z = 2.45 en la tabla de la distribución normal da una probabilidad de .9929.
5-14
Enseguida, se hace lo mismo con el valor de z = -1.73 y da una probabilidad de .0418.

Por lo tanto:
P(-1.73 ≤ z ≤ 2.45) = P(z ≤ 2.45) – P(z ≤ -1.73)
= .9929 - .0418
= .9511
Figura 5.3. Gráfica de la curva normal para el Ejemplo #8. (Elaboración propia)
Ejemplo #9. ¿Cuál es la probabilidad, en la curva normal entre un valor de z = -1.54 y

un valor de z = -.76?
Solución:
P(-1.54 ≤ z ≤ -.76) = P(z ≤ -.76) – P(z ≤ -1.54)
= .2236 - .0618 = .1618 (de la tabla de z)
Ejemplo #10. ¿Cuál es el área bajo la curva normal a la izquierda de z = -1.96?
Solución:
En la tabla de la distribución normal se busca el valor de la variable aleatoria z = -1.96
y da .025 es decir,
P(z < -1.96) = .0250
Ejemplo #11. ¿Cuál es el área bajo la curva normal a la izquierda de un valor de z =
1.42?
5-15
Solución:
Se busca el valor de z = 1.42 en la tabla de z y da .9222. Esto es lo mismo que, área
requerida de .5000 + .4222 = .9222.
Ejemplo #12. Encontrar la probabilidad de que la variable Z esté entre -05 y 1.25.
Solución:
P(-0.5 < Z < 1.25) = 1.0 – 0.3085 – 0.1056 = 0.5859
La Figura 5.4 muestra esquemáticamente esta situación.
Figura 5.4. Figura mostrando la probabilidad de P(-05 < Z < 1.25). (Elaboración
propia)
Los siguientes problemas calculan las probabilidades para cualquier variable

normal distribuida usando la variable estandarizada Z = (X - µ)/σ y/o su
estimador estadístico correspondiente, z = (X - X )/s.
Ejemplo #13. Si X es una variable normalmente distribuida, con un promedio
aritmético de X = 24 y una desviación estándar de 3, ¿cuál es el valor de la variable
normal estandarizada (tipificada), z que corresponde a un valor de X = 19?
Solución:
Primero transformamos (estandarizamos) el valor de X = 19 a valores de z, es decir:
z19 = (X - X )/s = (19 - 24)/3 = -1.67
Aquí, se nota que, el valor de X = 19 está 1.67 desviaciones estándar abajo del
promedio de 24.
5-16
Ejemplo #14. Si X es una variable normalmente distribuida, con un promedio

aritmético de 150 y una desviación estándar de 24, ¿cuál es el valor de z
correspondiente a un valor de X = 182?
Solución:
z182 = (182 - 150)/24
= 1.33
Este valor de 182 está a 1.33 desviaciones estándar arriba del promedio de X = 150.
Ejemplo #15. Si X es una variable normalmente distribuida, con un promedio de 100
y una desviación estándar de 15, calcular la probabilidad de: P(70 < X < 130).
Solución:
Primero transformamos (estandarizamos) los valores de X = 70 y X = 130 a valores de
la variable aleatoria z. Esto es:
z70 = (70 - 100)/15 = -2.00
z130 = (130 - 100)/15 = 2.00
El valor de z correspondiente al intervalo (70 < X < 130) es de (-2.00 < z < +2.00) y
la probabilidad es:
P(70 ≤ X ≤ 130) = P(-2.0 ≤ z ≤ 2.0)
= P(z ≤ 2.0) – P(z ≤ -2.0)
= .9772 - .0228
= 0.9544
Aquí, se puede ver qué, sin consultar la tabla de la z, ya sabemos que, a 2.0 unidades
de z arriba del promedio están comprendidas el 97.72% de las observaciones.
Similarmente, a -2.0 unidades abajo del promedio están comprendidas el 2.28% de las
observaciones; por lo tanto, .9772 - .0228 = 0.9544. La Figura 5.5 muestra esto.
5-17
Figura 5.5. Gráfica mostrando la curva normal para este problema. (Elaboración
propia).
Ejemplo #16. En una investigación de higiene industrial y seguridad, relacionada con
un proceso industrial, se requiere una aptitud mental muy alta. Para esto, los
trabajadores se sometieron a una prueba del coeficiente de intelecto (IQ). Si se saca
una muestra al azar que da X = 120 puntos y s = 20 puntos, ¿Cuál es la probabilidad
de que un trabajador seleccionado tendrá un valor de coeficiente de intelecto que esté
entre 80 y 140 puntos?
Solución:
Aquí estamos buscando la probabilidad de P(80 < X < 140) = P(-2.00 < z < +1.00).
Por lo tanto, el área total o la probabilidad requerida es igual a 0.8185. Esto dice que,
cerca del 82% de la población tiene un IQ de esta prueba del intelecto que está entre
80 y 140 puntos.
Ejemplo #17. Si una muestra aleatoria de una población normal de intensidades de
viento, en m/segundo, tiene un promedio de 10 m/seg y una varianza de 4:
(a) ¿Qué porcentaje y/o probabilidad de las intensidades del viento caen entre 9 y 14
m/seg.?
(b) ¿Entre 13 y 15?
Solución:
5-18
(a) % = (Área de -∞ a 2) - (área de -∞ a -.5) = .9772 - .3085

O sea: P(9 ≤ X ≤ 14) = P(-0.5 ≤ z ≤ 2) = 0.9772 - 0.3085
= 0.6687 = 66.87%
Aquí, se nota que, si el valor de s es igual a 2, por lo tanto, hay 2 unidades de
desviación estándar para los valores de X = 14 y X = 9, es decir, a la derecha e
izquierda del promedio.
(b) Aquí estamos diciendo que 13 está a 1.5 unidades abajo del promedio y 15 está a
2.5 unidades arriba del promedio. Esto es:
P(13 ≤ X ≤ 15) = P(1.5 ≤ z ≤ 2.5) = .9938 – .9332 = 0.06 = 6%
Encontrando los valores de z dando las probabilidades
Ejemplo #18. Un área de .4370 está bajo la curva normal entre el promedio y un valor
positivo de z. ¿Cuál es el valor de z?
Solución:
Buscando el valor de 0.4370 en la tabla de la z vemos que corresponde a z = +1.53.
Ejemplo #19. Un área de .4808 está bajo la curva normal entre el promedio y un valor
de z negativo. ¿Cuál es el valor de z?
Solución:
Buscamos el valor de .4808 en la tabla y da z = -2.07.
Ejemplo #20. El 90% de la distribución de partículas atmosféricas de una curva
normal está a la izquierda de un valor de z en particular. ¿Cuál es el valor de z?
Solución:
El valor de z debe de estar a la derecha del promedio, porque el 50% de la
distribución está a la izquierda del promedio. Eso deja 0.400 de la curva entre el
promedio y el valor requerido de z. De manera que, ahora tenemos que encontrar el
valor de z que corresponde a una área de .400 en la tabla de la curva normal (.900 -
5-19
.500). Sin embargo, aquí vemos que no hay entrada de 0.4000, no obstante, lo más
cercano es .3997 que corresponde al valor de z = 1.28.
Encontrando los valores z del punto de expansión para variables normalmente
distribuidas
Ejemplo #21. Calcular dentro de que rango estarán comprendidas el 95% de las
observaciones centrales o de en medio, si el promedio es de 10 y la desviación
estándar es de 2. Hacer una gráfica.
Solución:
Aquí, vamos a usar la relación: X = X ± z (s), con X = 10.0 y s = 2.0, es decir:
10 ± 1.96 (2) = 10 ± 3.92 para dar (6.08 ≤ X ≤ 13.92). La figura de abajo muestra
esta situación.
Figura 5.6. Grafica mostrando los resultados de este problema. (Elaboración propia)
Ejemplo #22. Si X = 10 y s = 2, ¿Dentro de que rango están comprendidas el 99% de
las observaciones de en medio de la curva normal?
(b) ¿El 90%?
Solución:
Usando la relación X = X ± z.01 (s) y sustituyendo da:
(a) X = X ± z.01(s) = 10 ± 2.57(2)

= (4.85 ≤ X ≤ 15.15)
5-20
Figura 5.7. Gráfica mostrando los resultados del ejemplo #22.
Ejemplo #23. Si X = 20 y s2 = 9, dentro de que rango están comprendidas:

(a) ¿El 99% de las observaciones de en medio de la curva normal?
(b) ¿El 90%?
(c) ¿El 80%?
Solución:
Usando la relación X = X ± z.01 (s) y sustituyendo da:
(a) X = X ± z.01(s) = 20 ± 2.57(3)

= 20 ± 7.41
= (12.29 ≤ X ≤ 27.31)
(b) Usando la relación X = X ± z0.1(s) y sustituyendo da:
X = X ± z0.1(s) = 20 ± 1.645(3)
= 20 ± 4.935
= (21.96 ≤ X ≤ 24.94)
(c) Usando la relación X = X ± z0.05 (s) y sustituyendo da:
X = X ± z0.20 (s) = 20 ± 1.28 (3)
5-21
= 20 ± 3.84
= (16.16 ≤ X ≤ 23.84)
Problemas ilustrando las aproximaciones normales a la distribución binomial
Ejemplo #24. Una máquina produce tornillos de los cuales 10% son defectuosos.
Encontrar la probabilidad de que, en una muestra aleatoria de 400 tornillos
producidos por esta máquina:
(a) A lo más 30 tornillos estarán defectuosos
(b) Entre 30 y 50 estarán defectuosos
(c) Entre 35 y 45 estarán defectuosos
(e) 55 o más tornillos estarán defectuosos
Solución:
Primero se calcula el promedio y la desviación estándar:
µ = np = (400)(0.1) = 40 y σ = npq = [(400)(0.1)(.90)]0.5 = 6.0
Enseguida, se calcula el valor de la variable aleatoria Z usando la relación:
Z = (X – µ) / σ.
(a) P(X ≤ 30). Para calcular esto, primero se transforma el valor de 30, a valores de Z
usando la función de arriba, es decir,
Z30 = (30 – 40)/6.0 = -1.67
Por lo tanto:
P(X ≤ 30) = P(Z ≤ -1.59) = 0.0559
(b) P(30 ≤ X ≤ 50). Para calcular esto, primero transformamos los valores de 30 y
50 a valores de Z, es decir,
Z30 = (30 – 40) / 6.0 = -1.67; Z50 = (50 – 40) / 6.0 = 1.67
5-22
Por lo tanto,
P(30 ≤ X ≤ 50) = P(X ≤ 50) – P(X ≤ 30)
= P(Z ≤ 1.59) - (Z ≤ -1.59)
= .9441 - 0.0559
= .8882
(c) La probabilidad de qué, entre 35 y 45 tornillos estén defectuosos, es, P(35 ≤ X ≤
45). Para esto, primero transformamos los valores de X a valores de Z.
Z35 = (35 – 40)/6.0 = -0.83 y Z45 = (45 – 40)/6.0 = 0.83.
Por lo tanto, P(35 ≤ X ≤ 40) = P(-1.59 ≤ Z ≤ 0.79)

= .7852 - .0559
= 0.7293
(e) Primero estandarizamos el valor de X = 55 a valores de Z.
z55 = (55 – 40) / 6.0 = 2.50 que corresponde a una probabilidad de .9938. Por lo tanto:
P(X ≥ 55) = 1 – P(X ≤ 55) = 1 - .9938 = .0062
Ejemplo #25. La probabilidad de que X asuma un valor exacto de 4 se da abajo, esto

es, usando la distribución binomial.
P(X = 4) = B(4;15,0.4) = 0.1268
Siendo así usar la distribución normal como una aproximación:
Solución:
Primero se calcula el valor del promedio, µ = np y da µ = (15)(0.4) = 6. La desviación
estándar es σ = npq = (15)(0.4)(0.6) = 1.897. Además, X = 4 puede asumir valores
de 3.5 y 4.5. Enseguida, transformando los valores usando la variable aleatoria normal
Z da:
5-23
Z3.5 = (3.5 – 6) / 1.9 = -1.32 y Z4.5 = (4.5 – 6) / 1.9 = -0.79

Si X es una variable aleatoria binomial y Z es una variable normal, entonces:
P(X = 4) = B(4;15,0.4) ≈ P(-1.32 < Z < -0.79)
= P(Z < -0.79) – P(Z < -1.32)
= 0.2148 – 0.0934 = 0.1214
Este valor sacado usando la distribución normal como una aproximación a la
distribución binomial está muy cercano al de 0.1268 calculado por la distribución
binomial.
Distribución exponencial
La distribución exponencial es una distribución continua de probabilidad para
describir el tiempo que se tarda en realizar una actividad. Esta distribución es un caso
especial de la distribución gamma. Esta función se usa para modelar las vidas de las
baterías, de transistores, de valeros, etc. También se usa para modelar la distancia
entre los principales defectos en una carretera, etc. A pesar de que la distribución
exponencial es continua, esta distribución está cercanamente relacionada con la
distribución de Poisson, que es discreta. Esto ocurre en el sentido que, una variable
aleatoria Poisson cuenta el número de ocurrencias de un evento durante un intervalo
de tiempo dado. En contraste la variable aleatoria exponencial X que puede ser usada
para medir el tiempo que transcurre antes de la primera ocurrencia de un evento,
donde las ocurrencias del evento siguen a una distribución Poisson.
Equivalentemente, una variable aleatoria exponencial puede ser usada para medir el
tiempo que transcurre entre las ocurrencias de un evento
Las aplicaciones de la distribución exponencial, a la ingeniería ambiental son
varias. Por ejemplo, se puede usar para modelar el tiempo que se tardan los pesticidas
en degradarse en la tierra o para medir el tiempo en que se toma en degradarse una
5-24
sustancia radiactiva. Igualmente, es útil para medir la cinética de la demanda

bioquímica de oxígeno (DBO5). Análogamente, se puede usar para medir el tiempo
que tardan las partículas atmosféricas en caer a la superficie de la tierra.
Una variable aleatoria continua X se dice que está exponencialmente
distribuida si su función de densidad es:
f (x) = λ e-λx para X ≥ 0, λ ≥ 0 (5-16)
Donde: λ es un parámetro de la distribución, y e una constante igual a 2.71828

2 2
X y s de la variable aleatoria exponencial X son E(X) = 1/λ y V(X) = 1/λ ,
respectivamente. Se puede demostrar que el promedio y la desviación estándar de una
distribución exponencial son iguales el uno al otro, esto es: µ = σ = 1/λ.
Por otro lado, Keller et al. (1990) afirma que, en el caso de una variable
aleatoria exponencial X, se puede demostrarse que la probabilidad de que X pueda
tomar un valor más grande que un número especificado no negativo a, es e-λa. Esto se
puede expresar usando cálculo integral, es decir:
∞ ∞
P(X ≥ a) = ∫ a λe
-λx -λx
dx = -e | a = e-λa (5-16a)
El cálculo de las funciones exponenciales involucra la evaluación de integrales

de probabilidad entre los límites de a y b. Para esto, se da una tabla de probabilidades
exponenciales. Las siguientes fórmulas se usan con esa tabla.
P(a ≤ X ≤ b) = e-λa – e-λb (5-17a)
P(X ≤ a) = 1 – e-λa (5-17b)
P(X ≥ a) = e-λa (5-17c)
La distribución exponencial es una familia de distribuciones modificadas por
un solo parámetro, λ, las cuales se muestran en la Figura 5.8.
5-25
Figura 5.8. Gráficas de tres distribuciones exponenciales. Fuente: Devore (2000)

Ejemplo #26. Supongamos que el tiempo promedio que se tarda una sustancia
radiactiva en degradarse es de µ = 15 y su función de densidad es f(x) = 1/15 e-x/15. Si
los valores de la variable aleatoria x son 5, 15, 25, 35, y 45, calcular las siguientes
probabilidades:
(a) A lo más 6 años
(b) Entre 6 y 18 años
Solución:
(a) Usando (5-17b) con µ = 1/λ, es decir, λ = 1/15 y a = x = 6 y sustituyendo en la
función P(X ≤ a) = 1 – e-λa, da:
P(X ≤ 6) = 1 – e-(6/15) = 0.3297
(b) Usando la función (5-17a) y sustituyendo da:
P(Tiempo de caída 6 ≤ X ≤ 18 años) = .6988 - .3297 = .3691
Ejemplo #27. Refiriéndose al Ejemplo #26, ¿Cuál es la probabilidad de que la

degradación de la sustancia radiactiva dure cuando menos 10 años.
Solución:
Usando la función (5-17c), es decir: P(X ≥ a) = e-10/15 = 0.51
5-26
Figura 5.9. Gráficas mostrando los resultados para (a) y (b), del ejemplo #26.
Ejemplo #28. El tiempo requerido para que ocurra una reacción química está
exponencialmente distribuida con un tiempo esperado de 5 minutos. (a) ¿Qué
proporción de la sustancia se formará dentro de 1 minuto? (b) ¿En 5 minutos? (c)
¿Entre 4 y 8 minutos? (d) Si la cantidad de la sustancia química es de 5.00 gramos,
¿cuánto es lo que se va formando en cada uno de los intervalos? (El lector lo hará)
Solución:
Usaremos intervalos de 1 minuto para calcular la probabilidad. Por lo tanto, debido
a que la reacción se hace en 5 minutos en promedio (pensamos de esto
produciéndose en 5 intervalos continuos de un minuto) el número esperado de
producción en un minuto es 1/5 = .20 = λ (o sea el número esperado de ocurrencias
en 1 minuto). La variable aleatoria X se define como el tiempo, en minutos,
requerido para completar la reacción. Por lo tanto:
(a) P[X ≤ 1] = 1 – e-(0.20(1) = 0.8187 = 81.87% (Usando la fórmula 5-17b)
(b) P[X ≤ 5] = 1 – e-(0.20)(5) = 0.3679 = 36.87% (usando la fórmula 5-17b)
(c) P[4 < X < 8] = e-(0.20)(4) – e-(0.20)(8) = 0.2474 (usando la fórmula 5-17a)
(d) 4.09 g., 1.84 y 1.23 g, respectivamente.
5-27
Distribución gamma continua

A pesar de que la distribución normal puede resolver muchos problemas en
ingeniería, hay otras situaciones que requieren de diferentes tipos de funciones de
densidad. Funciones como éstas son la exponencial, la gamma, la Weibull, la beta,
etc. Hay muchas situaciones en que la variable de interés, para el experimentador,
pueda tener una distribución oblicua. Siendo así, entonces, una familia de
funciones de probabilidad de densidad (pdf) que dan una amplia variedad de
distribuciones sesgadas es la familia de distribuciones gamma.
Como se dijo antes, la distribución gamma es un caso especial de la
distribución exponencial. Las funciones exponenciales y la función gamma juegan
un papel muy importante en la teoría de filas que esperan el orden de su llegada.
La distribución gamma puede ser vista como una distribución gamma
estandariza o como una distribución gamma no estandarizada.
Si una variable aleatoria continua x tiene una distribución gamma, con
parámetros α y β, entonces, para cualquier x > 0 la distribución acumulada de
frecuencia (cdf) de x está dada por:
P(X ≤ x) = F(x;α,β) = F(x/β;α) (5-18)
Donde:
α es el primer parámetro de forma que define la distribución gamma
β es el parámetro de escala que define la distribución gamma (porque valores
mayores que la comprimen o estiran la función de probabilidad de densidad (pdf)
en la dirección de x); F(x/β;α) es una función de gamma incompleta.
En la familia de distribuciones gamma una variable aleatoria continua X se
dice que tiene una distribución gamma no estandarizada si la pdf de X es:
f(x;α,β) = {1/βα Г(α) xα-1 e-x/β x≥ 0 (5-19)
5-28
o de otra manera
Donde los parámetros α y β satisfacen α > 0 y β > 0
Si se pone β = 1 la expresión (5-19) se reduce a la forma de de la distribución
gamma estándar descrita abajo.
x
f (x;α) = ∫ 0 xα-1 e-x / Г(α) dx x > 0 (5-20)
La función (5-20) se llama función de gamma incompleta, cuando no tiene el

denominador con Г(α) en el integrador.
Cuando se usan las funciones (5-19) y (5-20) la tarea se facilita usando la
tabla de la distribución gamma, con valores de α = 1, 2, 3,…,10 y de x = 1, 2,…,15.
El promedio y la varianza de la distribución gamma son, respectivamente:
E(X) = µ = αβ (5-21)
y V(X) = σ2 = αβ2 (5-21a)
Figura 5.10. Gráficas con distribuciones gamma de densidad con diferentes valores
de α y β y curvas de densidad gamma estándar. Nótese que cuando β = 1, es la
curva exponencial. (Devore 2000).
Ejemplo #29. Supóngase que se tiene una distribución gamma estándar con
parámetro α = 3, calcular:
5-29
(a) La probabilidad de que X esté entre 4 y 5.

(b) La probabilidad de que X sea mayor que 4
Solución:
Debido a que P(a ≤ X ≤ b) = F(b) – F(a) cuando X es continua, por lo tanto:
(a) P(4 ≤ X ≤ 5) = F(5;3) – F(4;3)
= 0.875 – 0.762 = 0.113
(b) P(X > 4) = 1 – P(X ≤ 4) = 1 – F(4,3)
= 1 - .762
= 0.238
Ejemplo #30. Este problema involucra un experimento con conejillos de India
seleccionados al azar. Este es un estudio relacionado con el tiempo X de
supervivencia, en semanas. Los animales fueron expuestos a una radiación de 400
rads (dosis de radiación absorbida), es decir, de radiación gamma (energía
radiante). Se asume que esta situación sigue a una distribución gamma con
parámetros de escala de α = 10 y β = 20. Siendo así, hacer los siguientes cálculos:
(a) Calcular la media de supervivencia y la varianza.
(b) Calcular la probabilidad de que un conejillo sobreviva entre 80 y 120 días.
(c) La probabilidad de que un animal sobreviva, cuando menos 20 días.
Solución:
Aquí usamos la distribución gamma no estandarizada.
(a) El promedio es: E(X) = µ = αβ = (10)(20) = 200 días.
La varianza es: V(X) = σ2 = αβ2 = (10)(20)2 = 4000 días.
(b) P(80 ≤ X ≤ 120) = F(120/20;10) – F(80/20;10)
= F(6;10) – F(4;10)
= 0.084 - 0.008 (de la tabla de la distribución de gamma)
5-30
= 0.076
Esto dice que el valor de 0.076 es la probabilidad de que un conejillo sobreviva
entre 80 y 120 días.
(c) P(X ≥ 20) = 1 - P(X < 20)
= 1 - F(20/20;10)
= 0.000 (de la tabla de la distribución gamma)
Distribución Weibull
La distribución Weibull fue introducida por el físico sueco Waloddi Weibull en
1939. En forma análoga a las distribuciones gamma y exponencial la distribución
de Weibull tiene aplicaciones relacionadas con tiempo de falla o longitud de vida.
Es decir, para medir la confiabilidad de un componente o producto, como la
probabilidad de que si funcionará apropiadamente, por cuando menos un tiempo
especificado bajo condiciones experimentales especificadas. Esta función,
igualmente, se usa en el diseño de sistemas complicados, cuya operación o
seguridad depende de los varios componentes involucrados en el sistema. Por
ejemplo, una columna de acero puede vencerse. Otra aplicación es el modelado de
algún aparato sensible al calor que pueda fallar. Otra aplicación sería el estudio de
componentes idénticos sujetos a condiciones ambientales idénticas, que puedan
fallar a tiempos diferentes e impredecibles.
La función de probabilidad de densidad (pdf) de la distribución Weibull es:
f (x) = α xα-1 exp-(x/β)2 / βα , x > 0 (5-22)
Donde α y β son los parámetros condicionados a α > 0 y β > 0
5-31
Figura 5.11. Gráfica mostrando la curva de densidad de Weibull. Nótese que cuando
α = 1 y β = 1, la curva se torna exponencial. (Devore, 2000)
Proposición: La función de distribución acumulada (cdf) de una variable aleatoria

que tiene parámetros α y β es:
F(x;α,β) = {1 – exp-(x/β)α x ≥ 0 (5-22a)
Ejemplo #31. Supóngase que X tiene una distribución de Weibull con parámetros α =
20 y β = 100 (Devore, 2000). Entonces, calcular:
(a) P(X ≤ 105)
(b) P(98 ≤ X ≤ 102)
Solución:
(a) P(X ≤ 105) = F(105;20,100) = 1 – exp-(105/100)20
= 1 - .070 = .930
(b) P(98 ≤ X ≤ 102) = F(102;20,100) – F(98;20,100)
= exp-(.98)20 – exp-(1.02)20
= .513 - .226 = .287
Intervalos de confianza para µ con σ2 conocida
Se sabe que la estadística Z = ( X - µ) / σ/√ n sigue a la distribución normal, con µ = 0
5-32
y σ = 1. Si todas las muestras posibles de un tamaño n son sacadas de una población y

el valor de Z se calcula para cada muestra, el 95% o 99% de los valores de Z caerán
entre –zα/2 y zα/2. Sabemos que la probabilidad de que z esté entre –zα/2 y zα/2 es 1 – α.
Esto se puede expresar como:
P(-zα/2 < Z < zα/2) = 1 – α. (5-23)
Para esto se sustituye el valor de Z y se multiplica cada elemento de (5-23) por σ/√ n
y luego se le resta X de cada término. Después de esto, se multiplica por -1
(reversando el sentido de las desigualdades) y nos da la función de abajo:
P( X - zα/2 σ/ n < µ < X + zα/2 σ/ n ) = 1 – α (5-24)
Donde:
La probabilidad 1 – α se llama el nivel de confianza

X – zα/2 σ/ n se llama el límite de confianza inferior
X + zα/2 σ/ n se llama el límite de confianza superior
TABLA 5.2. Tabla mostrando los niveles de confianza más comunes (Elaboración
propia)
___________________________________________________________________
Nivel de confianza 1 – α α α/2 zα/2
_________________________________________________________________
.95 .05 .025 1.96
.99 .01 .005 2.58
.90 .10 .05 1.645
Ejemplo #32. En una muestra aleatoria de 100 observaciones de concentraciones de

óxidos de nitrógeno (NO) atmosférico sacada de una población normal tiene σ = 25 y
X = 20, con un tamaño de muestra de n = 100. Encontrar el intervalo de confianza
5-33
estimado del 95% para el promedio poblacional µ.

Solución:
Usando la ecuación (5-24), con σ = 25, X = 20 y n = 100, α = 0.05 y con regiones
críticas de ±1.96 da:
P(20 – 1.96 (25)/ 100 < µ < 20 + 1.96 (25)/ 100 ) = 1 - α
15.1 < µ < 24.9
Estadística inferencial. Teoría de decisión estadística. Pruebas de hipótesis
En la práctica es necesario hacer decisiones acerca de problemas basándose en

muestras estadísticas. Semejantes decisiones se llaman decisiones estadísticas. Las
pruebas de hipótesis se pueden hacer con la distribución normal para estimar los
parámetros de población µ, σ2, σ, ρ, β, etc., si el tamaño de la muestra es n ≥ 30
observaciones. Sin embargo, si el tamaño de la muestra es n < 30 casos, entonces, se
puede usar lo que se llama teoría de muestreo pequeño, usando la distribución de t de
Estudiante.
En este renglón, para hacer pruebas de hipótesis e intervalos de confianza,
también se puede usar la distribución de la JI cuadrada (χ2), para estimar los
parámetros poblacionales σ2 y σ. Además, se puede usar la distribución F, es decir,
haciendo tablas de análisis de varianzas, etc.
Pruebas de Hipótesis estadísticas. Hipótesis nula (Ho:) e hipótesis alternativas
Para problemas de pruebas de hipótesis clásicas (se dice que son clásicas, porque se
diseñaron el siglo antepasado) se contrastan con el nuevo enfoque moderno del
cálculo de la probabilidad, p de programas de computadora de la era cibernética.
Al tratar de alcanzar decisiones estadísticas, es necesario asumir situaciones
acerca de las poblaciones involucradas en trabajos de investigación. Semejantes
5-34
suposiciones, que pueden o no ser verdaderas, se llaman hipótesis nulas. En muchas

ocasiones formulamos una hipótesis estadística, con el propósito de rechazarla o,
cuando menos, de no aceptarla en base de la evidencia obtenida.
Con la investigación científica la idea detrás de hacer pruebas de hipótesis es la
de tratar de producir evidencia para rechazar la hipótesis. Esto se debe a que, el
rechazo de una hipótesis, en trabajos de investigación denota diseños experimentales
fuertes, precisos y concisos. Además, con la ingeniería de manufactura, el propósito
de hacer pruebas de hipótesis es con el objeto de verificar el control de calidad de los
productos producidos por la industria manufacturera. No obstante, si la hipótesis no
se puede rechazar pueda deberse a que la evidencia que pudiera rechazar la hipótesis,
no se puede producir. Esto puede resultar de una muestra pequeña o de un error
experimental excesivo (donde hay mucha variación).
La manera de producir evidencia para rechazar la hipótesis es analizando el
error estándar del promedio, el cual prueba que ambos errores, I (alfa) y II (beta)
pueden ser reducidos aumentando el tamaño de la muestra o disminuyendo la
desviación estándar. Esto lo podemos demostrar analizando el error estándar de la
muestra. Esto es:
σX =σ/ N (5-25)
o su estimador s=s/ n (5-25a)
Aquí, sin embargo, cabe notar que existen varios errores estándares de las
distribuciones estadísticas. Esta información se da en la tabla de abajo.
5-35
TABLA 5.3. Errores estándares de distribuciones estadísticas. (Elaboración propia)

___________________________________________________________________
Estadística Error estándar Observaciones especiales
___________________________________________________________________
Promedios σx = σ / n Esto es verdadero para muestras pequeñas o
grandes. La distribución de la muestra es
normal para n ≥30, aun si la población no es
normal.
Desviaciones σs = σ / 2 N (1)
estándares σs = µ4- µ2/4Nµ2 (2)
Para N ≥ 100 casos, la distribución de s es

normal. σs se da en (1), solamente si hay
normalidad. No obstante, si la población no
es normal, la ecuación (2) se puede usar.
Nótese que (2) se reduce a (1) cuando µ 2=
σ2 y µ4 = 3σ4, para poblaciones normales.
Para n ≥ 30s = σ
Varianzas σ2s = σ2 2 / N (3)
σs2 = µ4 - µ22 / N (4)
Las observaciones hechas para la desviación estándar aplican aquí también. Nótese
que (2) da (1) en el caso de una población normal.
___________________________________________________________________
5-36
Tipos de errores I (alfa) y II (beta)
Cualesquiera de las hipótesis que sea correcta, siempre hay la posibilidad de que un
error de muestreo nos incline a cometer lo que se llaman errores I o II. Así, podemos
rechazar una hipótesis nula Ho: que es verdadera o podemos aceptar una hipótesis
nula que es falsa. Si se rechaza una hipótesis, cuando debió ser aceptada, se dice que
se cometió el error I. En contraste, si se acepta una hipótesis falsa, cuando debió ser
rechazada, se dice que se cometió el error II. Como se verá, estos dos errores se
pueden evitar aumentando el tamaño de la muestra estadística y/o reduciendo la
desviación estándar (esto se puede probar a través del error estándar del promedio,
que es igual a s/ n ).
De cualquier manera, como se asentó antes, la idea de una prueba de hipótesis
es tratar de producir evidencia para rechazar la hipótesis nula, Ho: Si no se puede
rechazar la hipótesis nula, esta falta de evidencia puede resultar, ya sea a través de una
muestra insuficientemente grande o a través de un error de laboratorio excesivamente
grande (que se refleja en la desviación estándar, σ). También, la aceptación de una
hipótesis falsa puede deberse a una variación inherente de la población que estamos
muestreando (como en el caso de las temperaturas a nivel mundial cuyos registros se
están rompiendo cada año, por el calentamiento global debido a las emisiones de
bióxido de carbono). De cualquier manera de estas tres variables, σ es la más sensible.
5-37
Figura. 5.12. Distribución de los promedios de dos muestras de las curvas A y B

ilustrando el tipo de error II o beta con µ = 50 (en curva A) y σ = 10, con un nivel de
significancia de α = 0.05 y con un tamaño de muestra de n = 16. (Li 1964)
Figura 5.13. Gráficas mostrando como se reduce la probabilidad de cometer los

errores I y II, al aumentar el tamaño de n. (Li 1964).
Niveles de significancia
En la prueba de una hipótesis, la máxima probabilidad con la cual pudiéramos
arriesgar el tipo de error I se llama el nivel de significancia de la prueba. Este nivel se
5-38
especifica antes de que se saquen las muestras y se haga la prueba de hipótesis, para
que no haya influencia sobre los resultados obtenidos.
La prueba de significancia es cuando se especifica la probabilidad con la cual
estamos dispuestos a arriesgar el rechazo de la hipótesis, acerca del promedio
poblacional, aun cuando es verdadero. Los niveles de significancia más usados en las
pruebas de hipótesis son el de α = 0.05 y α = 0.01. Estos valores corresponden a
niveles críticos de 1.96 y 2.58, cuando se usa la distribución normal z. Por ejemplo,
en pruebas de hipótesis bilaterales, con α = 0.05, si la z calculada es z < -1.96 o z >
1.96, se rechaza la hipótesis. Igualmente ocurre si el nivel de significancia es α = 0.01,
es decir, cuando z < -2.58 y z > 2.58, entonces, se rechaza la hipótesis. De otra
manera se retiene o se dice que no hubo suficiente evidencia para rechazar Ho: Esta
prueba de significancia nos ayuda a decidir si la diferencia entre el promedio de la
muestra estadística y el promedio poblacional asumido, se atribuye a la casualidad o
si es estadísticamente significante, esto es, si es muy grande para ser atribuido a la
casualidad. La TABLA 5.4 da los valores críticos más comunes.
TABLA 5.4. Tabla mostrando las regiones críticas que se definen de acuerdo al valor
del nivel de significancia usado, es decir, si la prueba de hipótesis es bilateral,
unilateral derecha o unilateral izquierda. (Elaboración propia)
Nivel de significancia α 0.10 0.05 0.01 0.005 0.002

Valores críticos de z
para pruebas unilaterales ±1.28 ±1.645 ±2.33 ±2.58 ±2.88
(derecha o izquierda)
Valores críticos de z para ±1.645 ±1.96 ±2.58 ±2.81 ±3.08
pruebas bilaterales
Por ejemplo si usamos un nivel de confianza de 95%, es decir, un nivel de
5-39
significancia de α = 0.05, para una prueba de hipótesis unilateral izquierda, entonces,

bajo estas condiciones, el valor crítico de z es -1.28. Similarmente, si se usa el nivel
de significancia de α = 0.10, para una prueba de hipótesis unilateral derecha,
entonces, el valor crítico de z es de +1.28.
Cabe notar qué, para las pruebas de hipótesis, los valores de los niveles de
significancia más comunes son los de α = 0.05 y de α = 0.01. Por ejemplo, para una
prueba bilateral con α = 0.05, los valores críticos de z son de ±1.96. No obstante, para
una prueba unilateral izquierda con α = 0.05, el valor crítico de z sería de de -1.645 y
así sucesivamente.
¿Cuál es la diferencia en la decisión de aceptar o de rechazar una hipótesis nula?
Para ver esta situación, supongamos que el valor de la hipótesis nula es igual a un
valor esperado de µo = 10, esto es, Ho:µ = 10. Además, supongamos que X = 12, σ =
4.5 y n = 25 y, si después de sustituir los valores en la variable aleatoria normal
calculada por zcalc. = ( X - µo) / σ/√ n, con α = 0.05 con sus valores críticos de ±1.96,
entonces, zcalc. = 2.22, y, por lo tanto, 2.22 > 1.96 y se rechaza Ho: Aquí, la
confiabilidad es dictada por el valor de la probabilidad p, esto es, p = 1 - .9861 =
.0139. Esto dice que, la probabilidad de haber hecho una decisión equivocada en
rechazar una hipótesis verdadera es de, aproximadamente, 1 en 100.
Ahora, supongamos que zcalc. = 1.2, con σ = 8.333 y con las demás variables
constantes. Bajo estas condiciones, 1.2 < 1.96 y, se acepta Ho: con un valor de
probabilidad de p = 1 - .8849 = .12. Aquí, el valor de p dice que, la probabilidad de
haber hecho una decisión errónea, en haber aceptado una hipótesis falsa es de 1
posibilidad en 10. Entonces, de acuerdo al razonamiento expuesto anteriormente, ¿en
cuál de las dos situaciones hay más confiabilidad, es decir, más certeza en nuestras
decisiones?
5-40
Con la ingeniería de manufactura, un rechazo de hipótesis (especialmente, si el

valor de la probabilidad p es mucho muy significante, e.g., p = .001) sugiere que la
línea de producción de la fábrica o de la manufactura industrial de herramientas,
artículos, refacciones, etc., está trabajando en forma óptima. En forma análoga, con la
investigación científica, un rechazo de hipótesis, de una muestra de los resultados
obtenidos de laboratorio, indica un diseño experimental conciso y preciso. No
obstante, una aceptación de hipótesis sugiere que deben de refinarse las técnicas de
laboratorio o de la producción. También se puede hacer seleccionando tamaños de
muestras más grandes (aunque esto es más costoso).
Componentes de la prueba de hipótesis formal
1. Pruebas de hipótesis clásicas. Estas pruebas tradicionales se diseñaron el siglo 19.
Estas pruebas de hipótesis nulas se denotan por Ho: y es una afirmación acerca del
valor del parámetro de población, µ. Esta prueba de hipótesis nula (Ho:) se denota
usando desigualdades algebraicas, las cuales se describen con los símbolos =, ≤ , ≥ .
Esto quiere decir que, la prueba de hipótesis nula y, las hipótesis alternativas tienen
tres formas posibles:
(a) Ho: µ = µo (5-26)
Esta relación quiere decir que es "igual" al valor esperado de µo.
(b) Ho: µ ≥ µo (5-26a)
Esta relación con la desigualdad ≥ quiere decir "cuando menos" que o "igual o mayor
que" el valor esperado de µo)
(c) Ho: µ ≤ µo (5-26b)
En esta relación la desigualdad ≤ quiere decir "a lo menos", "nomás que" o "igual o
menor que" el valor esperado de µo
2. Pruebas alternativas. Estas pruebas se denotan por los símbolos H1:, H2: o H3:.
5-41
Estas pruebas alternativas no deben de contener igualdades, como en el caso de usar

los símbolos =, ≥ , o ≤ , que denotan las hipótesis nulas, sino que deben de tener
desigualdades como > o <. De manera que, para denotar las hipótesis alternativas,
generalmente, existen tres maneras de expresarlas, esto es:
H1: µ ≠ µo, si Ho:µ = µo (5-26c)
H1: µ < µo, si Ho:µ ≥ µo (5-26d)
H1: µ > µo, si Ho:µ ≤ µo (5-26e)
Por ejemplo, si se prueba la hipótesis nula de que el valor esperado poblacional es µo
= 50.0, entonces, la prueba de hipótesis nula es Ho:µ = 50.0, y las hipótesis
alternativas son Ho:µ ≠ 50.0, H1:µ > 50 y H2:µ < 50. Además, si estuviéramos
probando las hipótesis nulas de Ho:µ ≥ 50.0, entonces, la hipótesis alternativa es H1:µ
< 50. De igual manera, si estuviéramos probando la hipótesis nula de que Ho:µ ≤ 50,
entonces la hipótesis alternativa debe ser H1:µ > 50.0
Nota 1. Si estamos haciendo nuestras propias pruebas, deberíamos arreglar las
hipótesis nulas y las alternativas de tal manera que, el error más serio fuera el rechazo
de una prueba de hipótesis verdadera (error I). Aquí, en este texto, estamos asumiendo
que estamos haciendo las pruebas hechas por alguien más. Idealmente, deberíamos
hacer todas las pruebas y reclamos de tal manera que todas fueran hipótesis nulas.
Estas líneas fueron escritas con el entendimiento de que, no todos los reclamos son
como deberían de ser, porque algunos ejercicios involucran reclamos que son pruebas
de hipótesis nulas y otros que involucran hipótesis alternativas. Por ejemplo, si
queremos decidir si un procedimiento es mejor que otro, formulamos la hipótesis de
que no hay diferencias entre los procedimientos. Semejantes hipótesis se denominan
hipótesis nulas y se denotan por Ho. También podemos empezar con hipótesis
alternativas (o hipótesis de investigación) que difieren de una hipótesis nula
5-42
sustentada. En el establecimiento de las hipótesis, esto, sin embargo, debe estar

basado en hechos, pero no en prejuicios. De cualquier manera, si se rechaza la
hipótesis nula, (Ho:) nos inclinamos por la hipótesis alternativa (H1:).
El criterio para rechazar o aceptar Ho: siguiendo el método clásico, es de que si
el valor de la z calculada, es decir, usando la estadística z = ( X - µ) / σ/ n , es mayor
que la z tabulada (zα), con su correspondiente valor crítico de α, entonces se rechaza
Ho: y se inclina por la hipótesis alternativa H1:. De otra manera, no se rechaza Ho: o se
pospone la decisión.
3. Pruebas de hipótesis no tradicionales. Esta pruebas involucran los cálculos de la
probabilidad, p. Estas pruebas son formas no clásicas de hacer pruebas de hipótesis
nulas, Ho: Estas pruebas vienen en todos los programas de computadora y se pueden
hacer con la distribución de z, con la distribución de t de Estudiante, con la JI
cuadrada o la distribución F.
Identificando las pruebas de estadística de inferencia bilaterales de (con la cola
derecha o con la izquierda) y pruebas bilaterales (con dos colas de las
distribuciones probadas)
Cuando estamos haciendo pruebas de hipótesis, algunas veces es necesario hacer estas
pruebas en forma bilateral o unilateral (unilateral derecha o izquierda). Esto se hace
usando la distribución normal, la t de Estudiante, la JI cuadrada, la distribución de
Fisher, etc.
Cuando hacemos nuestras propias pruebas de hipótesis, y sabemos por
experiencia que los valores esperados de µo van a ser mayores de ciertos valores (o
cuando decimos que H1:µ > µo), entonces usamos el extremo derecho de la
distribución y ponemos el nivel de significancia de α = 0.05 o 0.01, con Ho: = a cierto
valor. En forma análoga, si los valores esperados van a ser menores de ciertos valores
5-43
(o H1:µ < que cierto valor), usamos el extremo izquierdo de la distribución y ponemos
el nivel de significancia de α = 0.05 o 0.01. Finalmente, si esperamos que los valores
vayan a ser menores o mayores de ciertas cantidades (Ho:µ = a un determinado valor),
entonces usamos los dos extremos de la distribución y dividimos α, igualmente, entre
dos, para que nos dé, α = 0.05/2 o α = 0.01/2, etc.
Si hacemos las pruebas de otros, por medio del examen de la hipótesis nula,
Ho: podemos deducir si la prueba es de dos colas o de una cola (derecha o izquierda).
Por ejemplo, si Ho:µ = 98.6, entonces H1:µ ≠ 98.6 y se dice que las pruebas
alternativas son de H1:µ > 98.6 y H1:µ < 98.6. No obstante, si la prueba de hipótesis
nula es de Ho:µ ≥ 98.6, entonces, la cola de la hipótesis alternativa (que es lo
contrario de la hipótesis nula Ho:) apunta a la izquierda (como µ < 98.6), y la prueba
es de la cola izquierda (unilateral izquierda). Sin embargo, si Ho:µ ≤ 98.6, entonces la
prueba es de que µ > 98.6, y la prueba es de la cola derecha (unilateral derecha).
Resumen en el establecimiento de las pruebas de hipótesis bilaterales (dos colas)
o unilaterales (de la cola derecha o de la izquierda):
Si la prueba de hipótesis nula es Ho:µ = µo, entonces, la prueba es bilateral y las
hipótesis alternativas son: H1:µ ≠ µo. H2:µ > µo y H3:µ < µo, donde µo es el valor
esperado.
Si la prueba de hipótesis nula es Ho:µ ≥ µo, entonces, la prueba es unilateral izquierda
y la hipótesis alternativa es H1:µ < µo.
Si la prueba de hipótesis nula es Ho:µ ≥ µo, entonces, la prueba es unilateral derecha y
la hipótesis alternativa es H1:µ > µo.
Definiendo los pasos clásicos en el procedimiento para hacer pruebas de
hipótesis
1. Establecer la prueba de hipótesis nula (Ho:) y el promedio esperado µo y las pruebas
5-44
de hipótesis alternativas (H1, H2:, H3:). En este renglón, si se usa la distribución

normal, también es necesario hacer ciertas suposiciones de que la muestra es aleatoria,
de que la población muestreada es normal y, de que la desviación estándar
poblacional, σ es conocida.
2. Seleccionar el nivel de significancia de α deseado (0.05, 0.01, etc., e. g. del 95%,
del 99%, etc.). Aquí, para la prueba de dos colas, es zα/2 y para las colas derecha o
izquierda, simplemente α.
3. Determinar la prueba estadística que se va a usar para el promedio, la varianza, las
proporciones, etc., que se van a probar, es decir, usando las distribuciones z, t, χ2, F,
etc. De esta manera, si n ≥ 30 casos se usa la distribución de z para el promedio. De
otra manera, si n < 30 se usa lo que se llama teoría de muestreo pequeño, como la t de
estudiante, la JI cuadrada, etc.
4. Definir las regiones críticas, es decir, de una cola (izquierda o derecha) o de dos
colas. (Ver resumen de pruebas para dos colas, para la derecha o para la izquierda).
Por ejemplo, si H1:µ > un valor, se usa la cola derecha. Si µ < que un valor, se usa la
cola izquierda, pero si µ es desigual a un valor dado se usan dos colas. Aquí, sin
embargo, es de notarse que estas circunstancias dependen del diseño experimental que
se quiera hacer.
5. Definir la regla de decisión, es decir, de rechazar o de retener o aceptar la hipótesis
nula, Ho: y/o de inclinarse por las hipótesis alternativas, H1:, H2:, etc.
6. Hacer los cálculos necesarios de los datos de la muestra y calcular el valor de la
función estadística de las distribuciones de z, de t, de χ2, etc., que se vayan a usar. Por
ejemplo, si usamos la distribución normal de z o la de t de estudiante para el promedio
aritmético, usamos:
z = ( X - µ) / σ/ n o bien t = ( X - µ) / s/ n
5-45
Nótese que la única diferencia entre la z y la t es de que en la z se usa σ y en la t se usa

s para la desviación estándar.
7. Comparar el valor de la función usada con la regla de decisión establecida, y hacer
la decisión estadística clásica o tradicional (que se diseñó en el siglo antepasado)
acerca de la hipótesis nula. Aquí también se puede hacer la prueba de la probabilidad
de p, que es una prueba no tradicional o moderna de la era cibernética. Así, si el valor
de la estadística calculada es mayor que la zc o t tabuladas, se rechaza la hipótesis
nula, Ho: y se inclina por la hipótesis alternativa. De otra manera no se rechaza Ho: o
no se hace ninguna decisión. Esta prueba de probabilidad p, se hace para ver, con qué
tanta fidelidad (en términos de probabilidad) pudiéramos estar acertados o
equivocados en haber rechazando la hipótesis nula. Aquí, por ejemplo, si el valor de p
es menor que el valor del nivel de significancia de α, se rechaza la hipótesis y se dice
si es significante o muy significante, etc.
Reglas de decisión bajo varias condiciones con las distribuciones z y t
Para la distribución normal:
Cuando n ≥ 30 casos, σ conocida y, a sabiendas que la distribución es normal.
Para pruebas bilaterales (dos colas): rechazar Ho: y aceptar H1:, si el valor de la
estadística z es mayor que la zc tabulada; de otra manera aceptar Ho: o postergar la
decisión.
Para pruebas unilaterales (una sola cola), digamos, la izquierda: rechazar Ho: y aceptar
H1: si el valor de la estadística z es menor que la zc tabulada. De otra manera, aceptar
o retener Ho:
Para pruebas unilaterales (una sola cola), digamos la derecha: rechazar Ho: y aceptar
H1: si el valor de la estadística z es mayor que la zc tabulada; de otra manera, aceptar
la Ho:
5-46
Para la distribución de t de Estudiante:

Cuando n ≥ 30 casos, σ desconocida y sabiendo que la población muestreada es
normal.
Para pruebas bilaterales (dos colas): rechazar Ho: y aceptar H1: si el valor de la
estadística t > +tα/2. Hacerlo de igual manera, si el valor de la estadística t < -tα/2; de
otra manera, retener Ho:
Para una sola cola, digamos la izquierda, rechazar Ho: y aceptar H1: si el valor de la
estadística t < -tα; de otra manera aceptar Ho o no hacer ninguna decisión
Para una sola cola, digamos la derecha: rechazar Ho: y aceptar H1: si el valor de la
estadística t > +tα. De otra manera aceptar Ho:
La idea detrás de hacer pruebas de hipótesis
Como se dijo antes, la idea de hacer pruebas de hipótesis es la de acumular evidencia
para rechazar la hipótesis nula. En el campo de la investigación científica, todos los
investigadores siempre están esperanzados en rechazar las hipótesis nulas de sus
trabajos de investigación. Cosa similar ocurre con la ingeniería industrial y de
manufactura. Los ingenieros industriales siempre tienen que hacer pruebas de
hipótesis periódicas de los productos manufacturados o de los artículos producidos
por la industria de manufactura. Esto se hace con el objeto de revisar la eficiencia de
la línea de producción de la fábrica. Esto se debe a que, al rechazar una hipótesis nula,
esto denota un diseño experimental fuerte y confiable. En la industria de manufactura
los rechazos de hipótesis indican que la línea de producción está operando
normalmente.
En las pruebas de hipótesis, el valor de s o de σ es muy importante, porque ahí
se refleja las técnicas del laboratorio refinadas o defectuosas. Un valor bajo de s
refleja técnicas de laboratorio muy sofisticadas o refinadas, mientras que un valor alto
5-47
de s, refleja lo contrario. Todo esto se explica y se prueba a través del poder de la

prueba y de los errores estándar del promedio, de la desviación estándar, etc.
El valor de p en la toma de decisiones
En las pruebas de hipótesis hay otra forma alternativa moderna computarizada de
probar la misma situación (que se hace con la prueba clásica de hipótesis que se
diseñó en el siglo antepasado), es decir, el enfoque moderno. En verdad, el valor de p
es la probabilidad, bajo la hipótesis nula (o la probabilidad, si la hipótesis nula es
verdadera), de obtener un valor tan inusual o más inusual que aquél que obtuvimos de
la muestra, cuando la hipótesis nula es verdadera (una situación inusitada).
Esta prueba no tradicional se hace usando el valor de la probabilidad p. Por
ejemplo, cuando rechazamos o aceptamos una hipótesis nula Ho: y nos inclinamos por
la hipótesis alternativa, H1:, con un nivel de significancia de α = 0.05 o igual a 0.01,
etc., queremos saber, qué tanta confiabilidad podemos poner al hacer nuestras
decisiones estadísticas. Este grado de confiabilidad se da por la probabilidad, p.
En verdad, el concepto filosófico del valor de p es que este valor representa un
decremento en el grado de confiabilidad en un resultado. Este enfoque está diseñado
para darnos la alternativa (en términos de probabilidad), de rechazar o no rechazar la
hipótesis sustentada. Así, entre más bajo sea el valor de p, menos podemos creer en la
hipótesis nula. Específicamente hablando, el nivel de p representa la probabilidad de
error en aceptar los resultados observados como válidos.
Por ejemplo, con un valor de p = .05 esto significa 1/20, es decir que
pudiéramos estar equivocados con una probabilidad de 1 en 20 en la decisión de
rechazar la hipótesis nula, Ho: sustentada. Además, si p = .01, esto es, 1/100, indica
que pudiéramos estar equivocados en nuestra decisión de rechazar la hipótesis con
una probabilidad de 1 en 100. (Aquí, en estos casos, nadie va a argumentar que vamos
5-48
a equivocarnos en nuestra decisión, con esta probabilidad tan baja).

En términos generales, valores grandes de p, digamos > 0.1 apoyan el no
rechazo de la hipótesis (es decir se acepta o se reserva una decisión). Por otro lado,
valores pequeños de p apoyan el rechazo de la hipótesis.
Los tipos de mecanismos que se siguen para establecer las pruebas de hipótesis
1. La hipótesis nula se puede hacer como: Ho:µ = µo. Bajo estas condiciones de
igualdad, las hipótesis alternativas son:
H1:µ ≠ µo, H2:µ < µo y H3:µ > µo, donde µo es el promedio poblacional que se quiere
probar. Aquí, cabe notar que en este caso, la prueba de hipótesis es bilateral o de dos
colas.
2. También la hipótesis nula se puede hacer como: Ho:µ ≥ µo. En este caso, la
hipótesis alternativa es Ho:µ < µo. Aquí, la prueba de hipótesis es unilateral izquierda.
3. Igualmente, la hipótesis nula se puede hacer como: Ho:µ ≤ µo. En este caso la
hipótesis alternativa es H1:µ > µo. Aquí, la prueba de hipótesis es unilateral derecha.
4. Seleccionar un nivel de significancia de tamaño α, esto es, α = .05 o α = .01 con sus
respectivos niveles de confianza de 95% y 99%. También, se pueden usar otros
niveles de significancia, como el .10, .20, etc., pero los más comunes son los de 0.05
y .01.
5. Seleccionar la estadística apropiada (por ejemplo, si n > 30 casos se usa la
distribución z. Si la muestra es n < 30 casos y la población muestreada no es normal
se usa la distribución de t, etc.
6. Se establecen las regiones críticas usando niveles de confianza del 95%, 99%, 90%,
80% etc. (95% y 99% los más comunes)
7. Se estima el valor de la prueba de estadística de la muestra y se compara con el
valor de la estadística calculada, es decir, zcalc. o tcalc. (de las regiones críticas) y se
5-49
comparan con ztab. o ttab. Si la estadística calculada es mayor que la estadística tabulada
(de las regiones críticas) se rechaza la hipótesis nula. De otra manera, se acepta la
hipótesis o no se hace ninguna decisión. De esta manera, si el valor de la estadística
calculada se mete en las regiones críticas se rechaza la hipótesis nula (o también si el
valor de p es menor o igual al nivel de significancia, α deseado).
Nota: Aquí es importante recordar que, la prueba de hipótesis nula estadística se
diseñó el siglo antepasado. En tiempos modernos de la era cibernética, existe la
prueba no tradicional relacionada con el valor de la probabilidad p. También es
importante notar que muchos programas de computadora dan únicamente el valor de
p y el investigador o lector tiene que interpretarlo acordemente.
Mecanismos para calcular los valores de la probabilidad p (para la distribución
normal) cuando se hacen las pruebas de hipótesis no tradicionales (calculando el
valor de p)
1. Para calcular el valor de la probabilidad p, se busca el valor de la z calculada en la
tabla de la distribución normal, con el valor del nivel de significancia usado. Los
criterios que se siguen se hacen comparando el valor de la p con el valor de α.
2. Los criterios que se siguen para interpretar el valor de p son:
P ≤ .05 La prueba está en el umbral de la significancia. Aquí casi siempre se
acepta la hipótesis nula. Es un argumento débil y no convincente en la pruebas de
hipótesis. Nos deja en una situación de incertidumbre. Nos dice que, “tal vez así
sea”.
P ≤ .01 La prueba es altamente significativa. Se considera un argumento
estadístico muy fuerte en contra de la aceptación de la hipótesis nula. La
probabilidad de .01 dice que pudiéramos habernos equivocado en la
decisión de rechazar la hipótesis nula, con una probabilidad de 1 en 100 de haber
5-50
rechazado una hipótesis verdadera, cuando debió ser aceptada.

P ≤ .001 La prueba es mucho muy significativa. Se considera un argumento
estadístico mucho muy fuerte, conciso y preciso. Aquí, la probabilidad con la cual
pudiéramos habernos equivocado en haber hecho una decisión errónea en el
rechazo de la hipótesis nula es de una milésima, es decir, de 1 en 1000.
Interpretación matemática de los valores de la probabilidad p (Pfaffenberg et al.
1987)
Forma I. Valor de p = 2P[X > x], si Ho: µ = µo con H1: µ > µo
Valor de p = 2P[X < x], si H2: µ < µo
Forma II. Valor de p = [X < x], si Ho: µ ≥ µo, con H1: µ < µo
Forma III. Valor de p = P[X > x], si Ho: µ ≤ µo con H1: µ > µo
Donde: X es ≤ , ≥ , = , que, el promedio muestral X
Ejemplo #33. Abajo se dan los valores de la z calculada. Calcular el valor de la
probabilidad p, si:
(a) El valor de z = 3.2, con Ho:µ = µo.
(b) El valor de z = 3.0, con Ho:µ ≤ µo
(c) El valor de z = -3.2, con Ho:µ ≥ µo.
Solución:
(a) Buscamos el valor de z = 3.2 en la tabla de la distribución normal y da un valor de
.9993. Entonces, para calcular el valor de la probabilidad p procedemos como sigue:
p = 1 - .9993 = .0007.
Sin embargo, debido a que la prueba es bilateral, este valor de p se multiplica por 2
para dar p = .0014.
(b) Buscamos el valor de z = 3.0 en la tabla de la distribución normal y nos da .9987.
Entonces, para calcular el valor de la probabilidad, p procedemos como:
5-51
p = 1 - .9987 = .0013
Como la prueba es unilateral, así se queda.
(c) Para z = -3.2 con Ho: µ ≥ µo. Esta es una prueba unilateral izquierda (porque el
valor de z es negativo). Buscamos este valor en la tabla de la distribución normal y da
.0007.
Metodología para calcular los valores de la probabilidad p dependiendo de la
estadística usada
Para las pruebas de hipótesis no tradicionales, es decir, usando el valor de la
probabilidad p, es necesario hacer interpolaciones de los valores obtenidos. Sin
embargo, en el caso de la distribución normal, para estimar el valor de la probabilidad
p, no es necesario hacer interpolaciones, porque se puede leer directamente en la tabla
de la distribución normal el valor de la estadística z calculada. No obstante, para la
distribución de t de estudiante, para la distribución Fisher, para la distribución de la JI
cuadrada, etc., si es necesario hacer interpolaciones. Esto se hace buscando el valor de
la estadística calculada en la tabla de la distribución que se está usando con su
correspondiente valor de grados de libertad y del valor porcentual deseado.
Fórmula empírica para hacer interpolaciones y calcular el valor de la

probabilidad p
Aquí vamos a dar un método para hacer interpolaciones usando una fórmula empírica
diseñada por el autor de este libro, el Dr. Héctor Quevedo Urías (autor de este libro) y
por la Dra. Socorro Arteaga. Esta fórmula se da como:
(λ2 – λ1)/(TR2 – TR1) = (λ2 – X)/(TR2 – TRcalc.) (5-27)
Donde:
λ2 = El nivel de confianza más alto de la tabla de la distribución usada.
5-52
λ1 = El nivel de confianza más bajo de la tabla usada.

TR2 = probabilidad de la estadística usada correspondiente a λ2.
TR1 = probabilidad de la estadística usada correspondiente a λ1.
X = valor que se quiere interpolar. Aquí, cuando la prueba es bilateral este valor se
multiplica por 2.
TRcalc. = valor de la estadística calculada.
Fórmulas para calcular el valor de p por medio de interpolaciones para
diferentes distribuciones
Para la distribución de t de Estudiante (la cual se retomará en el capítulo 6):
(λ2 – λ1) / (t2 – t1) = (λ2 – X) / (t2 – tcalc.) (5-28)
Para la distribución de la JI cuadrada:
(λ2 – λ1) / (χ22 – χ21) = (λ2 – X) / (χ22 – χ2calc.) (5-29)
Para calcular la distribución F:
(λ2 – λ1) / (F2 – F1) = (λ2 – X) / (F2 – Fcalc.) (5-30)
Ejemplos mostrando la manera de calcular el valor de la probabilidad p
Ejemplo #34. Supóngase qué, si el valor calculado de la estadística de la distribución
de z fuera, digamos de z = - 3.4 con una prueba de hipótesis bilateral, entonces,
buscamos este valor en la tabla de la distribución normal y nos da .0003. Este valor es
precisamente el valor de la probabilidad p. Pero como la prueba es bilateral, se
multiplica por dos y da p = .0006.
Ejemplo #35. Supóngase ahora que el valor de la estadística z fuera digamos z = 3.4
con una prueba bilateral. Entonces buscamos este valor en la tabla de la distribución
normal y vemos que está al extremo derecho con un valor de .9998. Ahora le
restamos 1 y nos da p = 1 - .9998 = .0002. Nuevamente, como la prueba es bilateral,
el valor lo multiplicamos por dos y da p = .0004.
5-53
5-54
Prueba de hipótesis para un solo promedio poblacional µ con varianza σ2

conocida usando la distribución normal
Una hipótesis estadística es una aseveración o conjetura con respecto a una o más
poblaciones. En estadística, una hipótesis es un enunciado de que algo es verdadero.
En la verdad o falsedad de una hipótesis estadística siempre hay una incertidumbre,
porque no se puede muestrear toda la población (esto sería imposible). En lugar de
esto, se toma una muestra aleatoria de la población de interés y se usan los datos para
proporcionar evidencia (en términos de la probabilidad p) para apoyar o refutar la
hipótesis. Por ejemplo, la aceptación de una hipótesis nula implica que no hay
suficiente evidencia para poder rechazar la hipótesis. No obstante, si se rechaza una
hipótesis hay una evidencia más fuerte e implica un diseño experimental fuerte,
preciso y conciso. Contrariamente, el no rechazo de una hipótesis implica un diseño
experimental débil, con una muestra de insuficiente tamaño o técnicas de laboratorio
defectuosas que conllevan mucha variación.
La estadística que se usa para hacer pruebas de hipótesis para un solo promedio
poblacional µ, con varianza conocida α usando la distribución normal, a sabiendas de
que la población muestreada es normal o que n > 30 casos, es:
z = ( X – µo) / σ/ n (5-31)
Donde:
z = variable aleatoria normal estándar
X = promedio estadístico
µo = valor esperado del promedio
σ = desviación estándar conocida
n = tamaño de la muestra
La tabla de abajo muestra los cálculos de las regiones críticas usando diferentes
5-55
niveles de significancia.
TABLA 5.5. Tabla mostrando las regiones críticas de acuerdo al valor del nivel de
confianza usado, es decir, si la prueba de hipótesis es bilateral, unilateral derecha o
unilateral izquierda. (Elaboración propia)
Nivel de confianza (%) 90% 95% 99% 99.5%
Valores críticos de z
para pruebas unilaterales 1.28 1.645 2.33 2.58
(derecha o izquierda) o -1.28 o -1.645 o -2.33 o -2.58
___________________________________________________________________
Valores críticos de z para ±1.645 ±1.96 ±2.58 ±2.81
pruebas bilaterales
Por ejemplo si usamos un nivel de confianza de 95%, es decir, un nivel de

significancia de α = 0.05, para una prueba de hipótesis unilateral izquierda, entonces,
bajo estas condiciones, el valor crítico de z es -1.645. Similarmente, si se usa el nivel
de significancia de α = 0.10, para una prueba de hipótesis unilateral derecha,
entonces, el valor crítico de z es de +1.28.
Cabe notar qué, para las pruebas de hipótesis, los valores de los niveles de
significancia más comunes son los de α = 0.05 y de α = 0.01. Por ejemplo, para una
prueba bilateral con α = 0.05, los valores críticos de z son de ±1.96. No obstante, para
una prueba unilateral izquierda con α = 0.05, el valor crítico de z sería de de -1.645 y
así sucesivamente.
Ejemplos de pruebas de hipótesis usando la distribución normal
Ejemplo #36. Se saca una muestra de 36 análisis de nitratos (NO3-) para el diseño de
una planta de tratamiento de aguas industriales. Para esto, se calcula un promedio
5-56
estadístico de X = 92 mg/L. Estudios previos indican una desviación estándar

conocida de σ = 9 mg/L. Probar la hipótesis de que el valor esperado de µo es 100
mg/L. Asumir α = 0.05 y calcular el valor de la probabilidad p.
Solución:
1. La hipótesis nula es Ho:µ = 100.
2. Las hipótesis alternativas son H1:µo ≠ 100, H2:µo > 100, H3:µo < 100.
3. Las suposiciones son que la poblacional muestreada es normal, σ es conocida y, la
muestra es aleatoria.
4. Con el nivel de significancia de α = 0.05 (nivel de confianza 95%), las regiones
críticas y los coeficientes críticos son de ±1.96.
5. La estadística usada es la de la distribución z , z = ( X – µo) / σ/ n
6. Sustituyendo los valores de X = 92, µo = 100, σ = 9 y n = 36 en la fórmula de
arriba da:
z = (92 – 100) / 9/ 36
= - 5.3
7. Ahora comparando la zcalc. = – 5.3 con la z tabulada ztab. Igual a -1.96, se rechaza la
hipótesis y nos inclinamos por H3:µo < 100.
8. El valor de la probabilidad p se calcula buscando el valor de –5.3 en la tabla de la
distribución normal, pero como no está tomamos el valor de .0003. Además, como la
prueba es bilateral, entonces, multiplicamos .0003 por 2, es decir, (2)(.0003) = .0006.
Este valor es mucho muy significante y da mucha evidencia para apoyar el rechazo de
la hipótesis.
Ejemplo #37. Una muestra aleatoria de 36 concentraciones atmosféricas de óxidos de
nitrógeno (NOx), en mg/L, mostró un promedio estadístico o de la muestra de X =
5-57
74.0 mg/L. Suponiendo que σ2 = 81.0 mg/L, ¿indicaría esto que un límite de
concentraciones de NOx esté arriba de 70 mg/L? Usar α = 0.05.
Solución:
1. La prueba de hipótesis nula debe ser Ho:µ ≤ 70, porque la hipótesis alternativa,
dada por el problema, es H1:µ > 70.
2. Por lo tanto, la prueba de hipótesis es una prueba unilateral derecha.
3. La región crítica es zα = z0.05 = 1.645
4. La estadística usada es z = ( X – µo) / σ/ n
Sustituyendo los valores del promedio X = 74, de la desviación estándar σ = 9, n =
36 y µo = 70 en la función estadística z da:
z = (74 – 70) / 9/ 36 = 2.66
5. Al comparar el valor de zcalc. = 2.66, con ztab. = 1.645, se rechaza la hipótesis nula y
se dice que, H1:µ > 70, con un valor de p = 1 - .9961 = .0039, de haber hecho la
decisión equivocada. Aquí, nótese que el valor de p no se multiplica por 2, porque la
prueba es unilateral derecha. Como resultado, la evidencia a favor de H1: es más
fuerte que la sugerida por un nivel de significancia de 0.05 (porque .0039 <<< 0.05).
Ejemplo #38. En un estudio de la ingeniería ambiental atmosférica, para evitar la
contaminación ambiental producida por el consumo excesivo e innecesario de
gasolina, en el diseño de un motor de combustión interna, el departamento de
ingeniería de un constructor de autos, de cierto modelo, afirma que el rendimiento del
millaje de este modelo de auto es de cuando menos 35 millas por galón. El
departamento de control de calidad sugiere que el valor de la desviación estándar es
de σ = 4 millas. La Environmental Protection Agency de Estados Unidos de América
quiere probar esta afirmación para ver si la figura afirmada debería ser más alta o más
baja que 35 millas por galón. Para esto, se saca una muestra aleatoria de 50 modelos
5-58
de este tipo y se prueban bajo circunstancias iguales. Los resultados dan un promedio
muestral de 33.6 millas por galón. Probar el reclamo del departamento de ingeniería
usando un nivel de significancia de 0.05. Calcular el valor de p.
Solución:
1. La prueba es bilateral, porque un promedio muestral significantemente, más alto
que 35 (cola derecha) o menos que 35 (cola izquierda) es una fuerte evidencia contra
la hipótesis nula de µ = 35.
2. Las regiones críticas son distribuyendo α = 0.05 igualmente entre las dos colas para
obtener 0.025 en cada una, con esto, los valores críticos son de ±1.96.
3. Usamos la función estadística y sustituimos los valores y da:
z = ( X – µo) / σ/ n
z = (33.6 – 35) / 4 50 = -2.47
4. En conclusión, debido a que el valor de -2.47 se introduce en el extremo izquierdo
de la distribución normal, se rechaza la hipótesis. El valor de p es de .0068, pero
como son dos colas, entonces, este valor se multiplica por 2 y da .0136. Ver figura de
abajo.
X = 33.6
z = -2.47
Figura 5.14. Gráfica mostrando los valores críticos para el problema de arriba.
5-59
Ejemplo #39. El estándar químico para el agua potable, en cuanto a sólidos disueltos
totales (SDT) es de 500 mg/L. Para probar esta aseveración se saca una muestra
aleatoria de 144 casos y da un promedio aritmético estadístico de 503 mg/L, con una
desviación estándar de 15 mg/L. Probar la hipótesis de que el estándar químico, para
el agua potable es de no más de 500 mg/L. Para esto, usar α = 0.05 y calcular el valor
de p.
Solución:
1. La prueba de la hipótesis nula es Ho:µ ≤ 500. Esto quiere decir que, la prueba es
unilateral derecha.
2. La hipótesis alternativa es H1:µ > 500.
3. La región crítica es unilateral derecha, esto es, zα = z0.05 = 1.645.
4. Ahora, sustituyendo los valores correspondientes de X = 503, σ = s = 15, n = 144 y
µo = 500, en la función de z nos da:
zcalc. = (503 – 500) / 15/ 144 = 2.4
5. En conclusión, debido a que el valor de la estadística se introduce en el extremo
derecho de la distribución, se rechaza la hipótesis nula y se inclina por la hipótesis
alternativa.
6. El valor de la probabilidad p se calcula buscando el valor de 2.4 en la tabla de la
distribución normal y da .9918, pero como queremos únicamente el valor de p, le
restamos 1 y nos da p = 1 - .9918 = .0082. Este valor es muy significante.
Ejemplo #40. Se calcula el promedio muestral de 5 ppm de cadmio (Cd), para medir
la calidad del aire, de cierta región industrial. Esto se hace sacando una muestra de 36
observaciones de Cd atmosférico. Hacer lo siguiente:
(a) Una prueba de hipótesis con µo = 4.85 ppm, con α = 0.05 y α = 0.01
5-60
(b) Además, calcular el valor de la probabilidad p e interpretarlo acordemente. Otrosí,

encontrar los intervalos de confianza con los mismos valores de α de arriba, para el
promedio poblacional µ.
Asumir que la desviación estándar poblacional es de 0.3.
Solución:
(a) La prueba de hipótesis nula es Ho:µ = 4.85. Las pruebas alternativas son de H1:µ ≠
4.85, H2:µ < 4.85 y H3:µ > 4.85.
Las regiones críticas con α = 0.05 y α = 0.01, para una prueba de hipótesis bilateral
son, respectivamente, ±1.96 y ±2.58.
Usando la estadística z = ( X – µo) / σ/ n con X = 5 ppm, µo = 4.85, σ = 0.3 y n = 36
y sustituyendo todos estos valores en la estadística de arriba nos da:
z = (5.0 – 4.85) / 0.3/ 36 = 3.0
En conclusión, debido a que el valor de zcalc. = 3.00 es mayor que el valor crítico de
1.96 se rechaza Ho: y nos inclinamos por la hipótesis alternativa de H3:µ > 3.85. Cosa
similar ocurre con el nivel de significancia de α = 0.01, porque el valor de 3.00 es
mayor que el valor crítico de 2.58.
Por otra parte, con respecto a la estimación del intervalo de confianza del 95%,
que corresponde a un nivel de significancia de α = 0.05, los valores críticos son de
±1.96. La estimación puntual de µ es X = 5.0. Para calcular el intervalo de confianza
de 95%, se sustituyen los valores en ecuación (5-24) de abajo para dar:
X – zα/2 σ/ n < µ < X + zσ/2 σ/ n
5.0 – (1.96)(0.3)/ 36 ) < µ < 5.0 + (1.96)(0.3/ 36 )

El cual se simplifica a:
5-61
4.902 < µ < 5.098

Por otra parte, el valor correspondiente a un intervalo de confianza del 99%, es
decir, con un nivel de significancia de α = 0.01, en este caso los valores críticos son
de ±2.575. La estimación puntual de µ es X = 5.0. De aquí que el intervalo de
confianza del 99%, es:
5.0 – (2.58)(0.3/ 36 ) < µ < 5.0 + (2.58)(0.3/ 36 )
El cual se simplifica a:
4.871 < µ < 5.129
Ejemplo #41. En un estudio de higiene industrial y seguridad, las temperaturas del
cuerpo de un grupo de 100 trabajadores industriales, que laboran un frigorífico, se
analizaron. La temperatura promedio fue de 98.2 oF con una desviación estándar de
0.62 oF. Encontrar el mejor punto estimador del parámetro poblacional µ de todas las
temperaturas del cuerpo. Para un nivel de confianza de 95%, encontrar, ambos, el
margen de error E y el intervalo de confianza para µ.
Solución:
Usando la función:
X – zα/2(σ n ) < µ < E + zα/2(σ/ n ) (5-32)
Donde: E = margen de error = zα/2(σ/√ n). Ahora, sustituyendo los valores apropiados,
con zα/2 = 1.96, σ = s = 0.62 (porque n > 30), X = 98.2 y n = 100, obtenemos:
98.2 – 1.96(0.62)/( 100 ) < µ < 98.2 + 1.96(0.62)/ 100 )
98.2 – 0.12 < µ < 98.2 + 0.12
98.08 < µ < 98.32
El valor del margen de error es E = 1.96(0.62)/( 100 ) = 0.1215.
Este intervalo 98.08 < µ < 98.32 dice que si fuéramos a seleccionar muchas muestras
5-62
de un tamaño de 100 y construyéramos un intervalo de confianza, el 95% de estas

muestras contendrían el promedio poblacional µ. Aquí, nótese que el intervalo de
confianza no contiene el valor de 98.6 oF, la cual es la temperatura normal del cuerpo.
Ejemplo #42. Se saca una muestra aleatoria de una población normal. Los valores de
las observaciones son: 22, 24, 22, 25, 30, 28, 29, 28, 24, 23, 25, 27, 26, 23, 24, 21, 22,
21, 25, 21, 23, 24, 21, 20, 21, 20, 22, 28, 27. Hacer los siguientes cálculos usando el
programa Minitab.
(a) Calcular la estadística descriptiva y determinar el 95% del intervalo de confianza
para el promedio poblacional µ.
(b) Determinar el 95% del intervalo de confianza para la desviación estándar σ, y la
mediana.
(c) Hacer una prueba de normalidad usando la estadística de Kolmogorov-Smirnov.
Solución:
Para estimar los incisos (a) y (b) usar el programa Minitab de la siguiente manera:
Stat > Basic statistics > Graphical Summary
Esto genera la Figura 5.15 de abajo, la cual incluye histograma con curva normal
sobrepuesta, los intervalos de confianza para el promedio poblacional, la mediana, la
desviación estándar, la estadística descriptiva, la prueba de Anderson-Darling, los
cuartiles, etc..
5-63
S umma r y for V a lor e s de la s obs e r v a cione s

A n d e rs o n -D a rlin g N o rm a lity T e s t
A -S q u a re d 0 .6 4
P -V a lu e 0 .0 8 5
M ean 2 4 .0 0 0
S tD e v 2 .8 6 6
V a ria n ce 8 .2 1 4
S k e w ness 0.488813
K u rto s is -0 . 8 2 2 3 1 6
N 29
M in im u m 2 0 .0 0 0
1 s t Q u a rtile 2 1 .5 0 0
M e d ia n 2 4 .0 0 0
3 rd Q u a rtile 2 6 .5 0 0
20 22 24 26 28 30 M a xim u m 3 0 .0 0 0
9 5 % C o n f id e n ce I n te rv a l fo r M e a n
2 2 .9 1 0 2 5 .0 9 0
9 5 % C o n f id e n ce I n te rv a l fo r M e d ia n
2 2 .0 0 0 2 5 .0 0 0
9 5 % C o n fid e n c e I n te rv a l f o r S tD e v
9 5 % C o n f id e n c e I n te r v a ls
2 .2 7 4 3 .8 7 6
M e an
M edian
22.0 22.5 23.0 23.5 24.0 24.5 25.0
Figura 5.15. Figura mostrando el histograma de los datos con curva normal
sobrepuesta, los intervalos de confianza para el promedio y la mediana y la estadística
descriptiva.
Para el inciso (c), es decir, para la prueba de normalidad de los datos esto se hace
usando la estadística de Kolmogorov-Smirnov, del programa Minitab. Siendo así, se
procede de la siguiente manera:
Basic Statistics → Normality Test
En la ventanilla del recuadro de Normality Test introducir las variables y puntear
Kolmogorov-Smirnov. Esto genera la figura de abajo.
5-64
Figura mostrando la grafica de los valores.

Normal
99
Mean 24
StDev 2.866
95 N 29
KS 0.085
90
P-Value >0.150
80
70
Percent
60
50
40
30
20
10
1
16 18 20 22 24 26 28 30 32
C1
Figura 5.16. Gráfica mostrando la prueba de normalidad usando la función de

Kolmogorov-Smirnov.
Como se ve en la Figura 5.16, las probabilidades (o porcentajes en este caso) se

grafican en función de los valores estipulados por el problema. Luego el programa
traza una línea de los cuadrados mínimos, con el objeto de verificar si los puntos están
dentro de las bandas de confianza. Sin embargo, es de notarse que, en comparación
con la función de Anderson-Darling o de Lilliefors, la prueba de Kolmogorov es
menos precisa que la función de Anderson-Darling. Sin embargo, la función de
Kolmogorov-Smirnov se sigue usando, tradicionalmente, por muchos investigadores
estadísticos.
Ejemplo #43. Un fabricante de sistemas de aspersión contra incendios, que se instalan
dentro de casas y edificios, argumenta que el promedio poblacional de temperatura de
sus sistemas de aspersión contra incendios es de 54.4 oC. Para esto se saca una
muestra aleatoria de 16 unidades, las cuales, al probarse dan un promedio estadístico
5-65
de 55.0 oC, con una desviación estándar de 1.0 oC. Si se sabe que la distribución de
los tiempos de activación de los sistemas de aspersión, contra los incendios, de este
fabricante, es normal, ¿se refutaría el argumento del fabricante de que el verdadero
promedio es el que se menciona arriba? Asumir un nivel de significancia de 0.05.
1. Aquí la prueba de hipótesis es Ho:µ = 54.4 contra la prueba de hipótesis alternativa
de H1:µ ≠ 54.4.
2. Debido a que la prueba de hipótesis llena la condición de igualdad, la prueba es
bilateral, es decir, z ≥ z.025 y z ≤ z.025, esto es, z ≥ 1.96 o z ≤ -1.96.
3. Usamos la distribución de z, aunque el tamaño de la muestra no sea de n > 30
casos. Esto es así, porque sabemos de antemano que la población muestreada es
normal. También se pudiera usar la distribución de t de estudiante, pero en este caso
es mejor usar la distribución z porque es mas precisa.
4. Siendo así, el valor de la prueba estadística es:
z = (55.0 – 54.4) / 1.0/ 16
= 2.4
5. De acuerdo al inciso (4) el promedio muestral observado se encuentra a 2.4
desviaciones estándar arriba de lo que se hubiera esperado, si Ho: fuera verdadera.
6. En conclusión, debido a que el valor calculado de z cae en la región crítica derecha,
se rechaza la prueba de hipótesis tradicional.
7. Ahora, para hacer la prueba de hipótesis no tradicional, es decir, calculando el valor
de p, buscamos en la tabla de la distribución normal el valor de 2.4 y vemos que el
valor de la probabilidad p es p = 2(1 – 0.9918) = 0.0164.
8. El valor de p = 0.0164 contradice la afirmación del fabricante de que el verdadero
promedio de sus productos contra incendios es de 54.4 oC.
5-66
Pruebas de hipótesis para las diferencias de dos promedios poblacionales (µ1 –

µ2), para muestras grandes (n ≥ 30) usando la distribución normal, con
varianzas conocidas e iguales (σ21 = σ22). Aquí se asume que las dos muestras son
independientes
Hasta ahora, hemos discutido pruebas de hipótesis de una sola muestra aleatoria, es
decir, para un solo promedio. Ahora, vamos a discutir pruebas de hipótesis donde se
involucran 2 muestras provenientes de dos poblaciones. De esta manera, en muchos
problemas prácticos estamos interesados en comparar dos poblaciones con relación a
alguna característica cuantitativa. Por ejemplo, la comparación de dos métodos para
medir el mismo proceso cualitativo o cuantitativo.
En ingeniería ambiental, por ejemplo, se pueden comparar dos métodos para
medir las concentraciones de arsénico en muestras de agua. Otra aplicación sería
medir dos métodos para el cadmio en muestras de agua, y así sucesivamente.
En términos estadísticos, si se tienen dos poblaciones con medias µ1 y µ2 y con
varianzas σ1 y σ2 respectivamente, el estimador puntual de la diferencia de los
promedios (µ1 - µ2) lo da el estadístico ( X 1 – X 2). Por lo tanto, para obtener una
estimación puntual de (µ1 – µ2) se seleccionan dos muestras aleatorias independientes,
una de cada población de tamaños n1 y n2 y se calcula la diferencia, X 1 – X 2. De esta
manera, dejemos que X 1 y X 2 sean los promedios de dos muestras grandes de
tamaños n1 y n2 sacados de dos poblaciones que tienen promedios de µ1 y µ2 y
desviaciones estándar de σ1 y σ2, respectivamente. Entonces, si ponemos µ1 = µ2
estamos diciendo que no hay diferencias entre ambos promedios poblacionales, que
es lo mismo que decir, que dos muestras se sacaron de poblaciones que tienen el
mismo promedio, µ. La estadística que se usa para estimar las diferencias entre dos
promedios es:
5-67
σ +σ
2 2
z = [( X 1 - X 2) - (µ1 - µ2)] / 1 2
(5-33)
n
1 n 2
Donde:
X 1, X 2 = promedios de muestras uno y dos, respectivamente
σ21, σ22 = varianzas de muestras uno y dos respectivamente
( X 1 – X 2) = estimador puntual de (µ1 – µ2)
n1 y n2 = tamaños de muestras uno y dos, respectivamente
z = variable normal estándar
Si se asume que σ1 = σ2 = σ, la estadística de arriba se reduce a:
1 1
z = ( X 1 – X 2) – (µ1 – µ2) / σ + (5-34)
n n 1 2
Las funciones para las pruebas de hipótesis nulas y las alternativas, son:
Ho:µ1 - µ2 = 0 es decir, que µ1 = µ2
H1:µ - µ2 ≠ 0 y H2:µ1 - µ2 > δ y H3:µ1 - µ2 < δ
Aquí, aunque δ puede ser cualquier valor constante, muchas veces el valor de δ es de
0 y se prueba la hipótesis nula de no "diferencia", es decir Ho:µ1 = µ2.
Ejemplo #44. Para medir la calidad del aire de cierta zona industrial, con relación a
los óxidos de azufre, se sacaron dos muestras de tamaños 50 y 75, respectivamente.
Los promedios fueron de 76 mg/L y de 82 mg/L, respectivamente. Asumir que las
varianzas de estas poblaciones son conocidas e iguales a 16. Asumir un nivel de
significancia de α = .05. Usando el valor de p, probar que no hay deferencias entre las
dos poblaciones muestreadas, que es lo mismo que µ1 = µ2, esto es, µ1 – µ2 = 0
Solución:
1. Usamos la función de z, porque las muestras son grandes.
2. Las hipótesis nulas y alternativas, son, respectivamente:
5-68
Ho:µ1 – µ2 = 0 y H1:µ1 – µ2 ≠ 0
3. Los valores críticos correspondientes a las regiones críticas, con α = .05 son de
±1.96.
4. Los valores que se substituyen en la fórmula (5-34) son:
X 1 = 76, X 2 = 82, n1 = 50, n2 = 75, σ1 = σ2 = 16. Substituyendo estos valores en la
fórmula (5-34) nos dan:
1 1
z = [( X 1 – X 2) – (µ1 – µ2)] / σ +
n n
1 2
1 1
= [(76 – 82) – 0] / 16] + = 2.05
50 75
5. En conclusión, debido a que el valor calculado de z = 2.05 es mayor que la región

crítica derecha de 1.96, se rechaza la hipótesis y se concluye que los promedios no
son iguales.
6. El valor de la probabilidad p se calcula buscando el valor de z = 2.05 en la tabla de
la distribución normal y da 0.9798. Por lo tanto, el valor de la probabilidad es p = 2(1
- .9798) = 0.04.
Ejemplo #45. Una compañía farmacéutica quiere probar una droga para la fibrosis
pulmonar, la cual es muy común entre los trabajadores industriales. Para esto se
prueban dos grupos, es decir, el de "control" (que no usan la droga) y el grupo de
"tratamiento" (que si usan la droga). Se toma una muestra de 50 trabajadores a los
cuales se les da la droga y otro grupo más de 100 personas, al cual no se les da la
droga. La presión arterial se toma para cada sujeto. La compañía de drogas afirma que
la droga no causa ningún efecto secundario, para el grupo de tratamiento. Dicho en
otras palabras, esto dice que el promedio µ1 del grupo control y el promedio µ2 del
grupo de tratamiento son iguales. Probar el reclamo de la compañía de que no hay
5-69
efectos secundarios entre el grupo que toma la droga y el que no la toma. (Nota: En
este problema, de acuerdo al autor de este libro de estadística, el uso de medicamentos
artificiales siempre causará efectos secundarios. Esto se debe a qué, el cuerpo es una
esencia natural, que no puede aceptar artificialismos, por ser antagónicos al diseño
natural del organismo humano. Además, el medicamento artificial ataca un efecto
reactivo (el síntoma de la enfermedad), más no su origen causal (vida antinatural). En
verdad, el efecto secundario es una reacción orgánica natural, en respuesta a la acción
incompatible del artificialismo médico. De cualquier manera, para este problema usar
el nivel de significancia de α = .05. Los cálculos de las variables y sus valores se dan
en la tabla de abajo.
TABLA 5.6. Tabla mostrando los datos del Ejemplo #45.
_________________________________________________________________
Grupo de tratamiento Grupo de control
_________________________________________________________________
n1 = 50 n2 = 100
X 1 = 203.4 X 2 = 189.4
σ1 = 39.4 σ2 = 39.0
_________________________________________________________________
Nótese que también se pudiera usar s en lugar de σ, debido a que, el valor de la

muestra n es n >>> 30.
Solución:
1. El reclamo de la compañía se expresa como µ1 = µ2. Esto quiere decir que, en
ninguno de los dos grupos hay un efecto secundario de alta presión arterial.
2. Si el reclamo original es falso, entonces µ1 ≠ µ2
3. La prueba de hipótesis nula contiene la condición de igualdad de manera que, las
pruebas de hipótesis nulas y las alternativas son:
5-70
Ho:(µ1 - µ2) = 0, H1:(µ1 - µ) ≠ 02, H2:(µ1 - µ2) > 0, H3:(µ1 – µ2) < 0
4. El nivel de significancia es de α = .05
5. El problema satisface las suposiciones de normalidad.
6. Usamos la estadística de z (5-33) que se da abajo y se sustituyen los valores
correspondientes:
σ +σ
2 2
z = [( X 1 - X 2) - (µ1 - µ2)] / 1 2
n1 n 2
39.42 39.02
= [(203.4 - 189.4) - (0)] / + = 2.06
50 100
7. Las regiones críticas son de zα/2 = 0.05/2 = ±1.96

8. Debido a que la estadística z cae en la región crítica derecha se rechaza la Ho: µ1 =
µ2 y se dice que los promedios son desiguales.
9. Se concluye que si hay efectos secundarios y la droga si causa alta presión arterial.
Por lo tanto, se rechaza el reclamo de que, ambos grupos tengan el mismo promedio.
De esta manera, se concluye que H2: µ1 - µ2 > 0.
10. Ahora para calcular el valor de la probabilidad p, se busca el valor de z = 2.06 en
la tabla de la distribución normal y el valor de la probabilidad correspondiente es de
0.9803. Por lo tanto, el valor de p es de: p = 0.5000 - 0.4803 = 0.0197. Sin embargo,
debido a que la prueba de hipótesis es bilateral, el valor de 0.0197 se debe de
multiplicar por 2.
La Figura 5.17 de abajo muestra toda la información requerida por este
problema.
5-71
Figura 5.17. Figura mostrando la distribución de las diferencias de los promedios de

los dos grupos de control y de tratamiento. (Elaboración propia).
Ejemplo #46. Se quieren probar dos analizadores de CO de diferentes marcas, para

ver si los dos dan los mismos resultados en las mediciones de CO. Llamemos al
primer analizador A y al segundo B. Probar que los resultados de las dos mediciones
de CO provenientes de los dos analizadores son iguales. Asumir α = 0.05. Calcular
del valor de la probabilidad p. Los datos se dan abajo.
TABLA 5.7. Tabla mostrando los datos de este problema.
__________________________________________________________________
Muestreador de CO (A) Muestreador de CO (B)
__________________________________________________________________
n1 = 50 n2 = 100
X 1 = 4.53 kgs. X 2 = 4.01 kgs.
σ1 = 0.80 σ2 = 0.80
__________________________________________________________________
Solución:
Los dos promedios son independientes y σ1 y σ2 son conocidos, por lo tanto, usamos
5-72
la distribución normal. Usamos el nivel de significancia de α = 0.05. La prueba

involucra dos colas.
1. Las pruebas de hipótesis son:
Ho:µ1 = µ2 (o µ1 - µ2 = 0)
H1:µ1 ≠ µ2 (o µ1 - µ2 ≠ 0)
2. Las regiones críticas son de ±1.96
3. Una vez que se sustituyen todos los valores en la ecuación de z (5-33), el resultado
es de z = 4.06.
4. Debido a que 4.06 cae dentro de la región crítica derecha, se rechaza la hipótesis
nula y se concluye que los promedios poblacionales correspondientes a ambos
muestreadores de CO no son iguales. Tal parece que el muestreador A da resultados
de mediciones de CO, con una probabilidad mucho más significante que el
muestreador B.
5. Para calcular el valor de p buscamos z = 4.06 en la tabla de la distribución normal y
vemos que el valor más cercano es .9997 o sea 1 - .9997 = .0003, lo cual dice que p
<< .0003
Intervalos de confianza para las diferencias de dos promedios poblacionales, (µ1
- µ2), cuando la varianzas σ21 y σ22 se conocen.
Si X 1 y X 2 son los promedios de dos muestras estadísticas independientes de
tamaños n1 y n2 de poblaciones que tienen varianzas conocidas de σ21 y σ22, entonces,
el intervalo de confianza se da como:
σ +σ σ +σ
2 2 2 2
( X 1 - X 2) - zα/2 1 2
< (µ1 - µ2) < ( X 1 - X 2) + zα/2 1 2
(5-35)
n1 n
2 n1 n
2
Donde:
zα/2 es el valor de z con α = 0.05 y 0.01 niveles de significancia
5-73
Ejemplo #47. Un experimento para reducir el consumo de gasolina (para que se

contamine menos el medio ambiente, especialmente, con CO2 que está calentando la
tierra y cambiando el clima) se hizo un estudio para comparar dos tipos de máquinas
A y B. El rendimiento, en kilómetros por litro se midió. Para esto se seleccionó una
muestra de 50 unidades del tipo máquina A y otra muestra de 50 unidades tipo
máquina B. El promedio de gasolina consumida para la máquina A fue de X 1 = 36
Km. por litro y el promedio para la máquina B fue de X 2 = 42. Las desviaciones
estándar fueron de 6 y 8 Km. para las máquinas A y B, respectivamente. Hacer lo
siguiente:
(a) Encontrar el 95% de intervalo de confianza para (µA - µB).
(b) Hacer una prueba de hipótesis para decidir si hay diferencia entre los dos
promedios poblacionales.
(c) Calcular el valor de la probabilidad p.
Solución:
Los promedios aritméticos y las desviaciones estándar son de:
X 1 = 36 Km. y X 2 = 42 Km. con σ1 = 6 y σ2 = 8, respectivamente. Los tamaños de
las muestras son n1 = n2 = 50
(a) El punto estimador de µ1 - µ2 es X 1 y X 2. Usando zα/2 = z.05/2 nos da el intervalo de
zα/2 = ±1.96. Ahora, substituyendo todos estos valores en la función estadística del
intervalo de confianza, nos da:
3.43 < (µ1 - µ2) < 8.57
(b) Aquí, usamos una prueba de hipótesis para poblaciones normales con varianzas
conocidas. Se usa la estadística (5-33) recapitulada anteriormente:
5-74
σ +σ
2 2
z = [( X 1 – X 2) – (µ1 – µ2)] / 1 2
n1 n
2
Sustituyendo los valores apropiados en esta formula:

6 8
z = (36 – 42) – 0 / +
50 50
= 6 / 0.529
= 11.34
Pruebas de hipótesis para proporciones
Las pruebas de hipótesis relacionadas con proporciones (porcentajes) se requieren en
muchas áreas de la ingeniería. Por ejemplo, las compañías constructoras están
interesadas en saber, qué proporción de sus productos salen defectuosos. Además, los
políticos están interesados en saber qué fracción de los votantes los favorecerán.
Por otro lado, en la ingeniería ambiental estamos interesados en saber qué
fracción de las industrias están cumpliendo con las legislaciones ambientales.
También, es de interés social saber qué fracción de los jóvenes universitarios
usan determinadas drogas. Igualmente, es de interés saber qué fracción o proporción
de personas que puedan estar conscientes de la magnitud del problema de la
contaminación ambiental, etc.
Las pruebas de hipótesis con la estadística p (que estima a ρ) de proporción
están basadas en una muestra aleatoria de tamaño n de la población muestreada. Si el
tamaño de la muestra n es pequeño, con relación al tamaño poblacional, el promedio
X tiene aproximadamente una distribución binomial. Además, si n es grande, el
promedio X y el estimador p = X/n posee una distribución binomial. Pero si n es

grande, se usa la distribución normal como una aproximación a la binomial.
Las condiciones para usar la distribución binomial es tener un número fijo de
5-75
ensayos independientes, que tengan probabilidades constantes y de que, cada ensayo,

tenga dos resultados clasificados como “éxito” o “fracaso”.
Sin embargo, si las condiciones de np ≥ 5 y nq ≥ 5 se satisfacen, la distribución
binomial se puede aproximar por la normal con µ = np y σ = npq , donde, n es el
tamaño de la muestra, p es la probabilidad (%) y q es 1 – p. En este tópico,

consideraremos únicamente, la distribución normal como aproximación a la binomial,
es decir, para muestras grandes.
Pruebas de hipótesis para proporciones con muestras grandes
La estadística usada para pruebas de hipótesis para proporciones, para muestras
grandes es:
z = (p – po) / pq / n = (p – po) / p 0 (1 − p 0 ) / n (5-36)
Donde:
p = proporción muestral = promedio/n = fracción/n
ρo = proporción poblacional o valor esperado
q=1–p
La proporción muestral algunas veces se da directamente. Por ejemplo, si se da
40%, esto se traduce en p = 0.40 usando la fracción p = X/n. Por ejemplo, de la
afirmación 20 de 50 podemos calcular el valor de la proporción muestral como p =
X/n = 20/50 = 0.40.
Ejemplo #48. Un grupo ambiental afirma que los incidentes de las aves que chocan
con los aviones son muy raros, es decir, como para justificar la matanza de aves en los
aeropuertos. Sin embargo, un grupo de pilotos aviadores afirman que, en el despegue
de los aviones, en el 10% de los casos, las aves chocan contra el avión. Usar α = 0.05
5-76
para probar esta afirmación. La muestra es de 150 despegues abortados de aviones, de

los cuales 5 se debieron a choque contra las aves.
Solución:
1. Se usa la distribución normal como aproximación a la binomial, porque np ≥ 5 y
nq ≥ 5, es decir, (150)(0.10) = 15 y nq = (150)(0.90) = 135.
2. Debido a que el reclamo es del 10%, entonces, la fracción = p = 0.10. Lo opuesto
del reclamo original es ρ = 0.10.
3. Debido a que ρ = 0.10 contiene la condición de igualdad, la hipótesis nula y la
alternativa son:
Ho:ρ = 0.10 y H1:ρ ≠ 0.10
4. El nivel de significancia es de α = 0.05.
5. La estadística apropiada para probar si p = 5/150 = 0.033 es usando la estadística z
que se aproxima a la distribución binomial.
pq (0.1)(0.9)
z = (p – po) / = (0.033 – 0.1) / = -2.79
n 150
6. Los valores críticos con α = 0.05 son z = ±1.96

7. Debido a que el valor de –2.79 cae en la región crítica izquierda, se rechaza la
hipótesis.
8. El valor de p es de p = 1 - .9974 = 0.0026
Ejemplo #49. Un activista del medio ambiente afirma que, menos de la mitad de las
industrias, cumplen con los límites ambientales. Probar esta aseveración, si un sondeo
dice que 48% de 1998 industrias si cumplen, satisfactoriamente, con los reglamentos
ambientales. Usar un nivel de α = 0.05 y calcular el valor de p.
Solución:
En este problema la hipótesis alternativa se interpreta como H1:ρ < 0.5. Siendo así,
5-77
por lo tanto, la hipótesis nula debe ser Ho:ρ ≥ 0.5.

2. La región crítica es la izquierda y con α = 0.05 y el valor crítico es –1.645
3. La estadística usada es la aproximación de z a la binomial. Aquí, p = 0.48, ρo = 0.5
y n = 1998. Sustituyendo todos estos valores en la estadística (5-36) de abajo da:
pq
z = (p - ρo) /
n
(0.5)(0.5)
= (0.48 – 0.5) / = -1.79
1998
4. Debido a que el valor de –1.79 < 1.645, se introduce en el extremo izquierdo de la

distribución, se rechaza Ho:
5. El valor de la probabilidad p es p = 1 - .9636 = 0.036
Intervalo de confianza para proporciones
Si p es la proporción de éxitos en una muestra aleatoria de tamaño n y q = 1 – p, un
intervalo de confianza aproximado de (1 – α)100% para el parámetro binomial ρ se da
por la función de abajo:
pq pq
p – zα/2 < ρ < p + zα/2 (5-37)
n n
Donde: zα/2 es el valor de z dejando un área de α/2 a la derecha

Ejemplo #50. Si p = 2.5, n = 36, q = 7.5 y la región crítica es de 1.645, estimar el
intervalo de confianza para el parámetro ρ.
Solución:
Usando la función (5-37) y sustituyendo todos los valores, nos da:
2.5 – 1.645( 0.5208 ) < ρ < 2.5 + 1.645( 0.5208 )
La cual se simplifica a:
0.629 < ρ < 4.371
5-78
Ejemplos de problemas usando el programa Minitab para la distribución

normal, la distribución exponencial, la distribución gamma y la distribución
Weibull, para generar valores de la distribución normal estándar acumulada:
Calc > Probability distributions > Normal…
En la ventana de “Cummulative probability” puntear cummulative probability. En la
ventana de “Input column” poner los valores de -4 hasta +4, es decir, en C1. En la
ventana de “Optional storage” poner C2, para registrar los valores de la probabilidad
acumulada.
Por otro lado, si se quieren hacer las gráficas de frecuencia relativa y de
frecuencia acumulada, de la distribución normal proceder como está abajo y seguir las
instrucciones:
Graph > Plot
Además, para calcular los valores de la distribución normal no estandarizada:
Calc > Probability distributions > Normal…
En la ventana de “Mean” y de “Estándar deviation” poner los valores del promedio y
de la desviación estandar deseados. En la columna C1 poner los valores de la variable
aleatoria X que se quieran estandarizar. Para las gráficas proceder como arriba.
Además, para calcular los valores de la distribución exponencial irse a:
Calc > Probability distributions > Exponential..
En la ventana de “Exponential distribution” puntear “Cummulative probability”. En la
ventana de “Mean” poner el promedio deseado.
Para calcular los valores de la distribución Weibull:
Calc > Probability distributions > Weibull…
En la ventana de “Weibull distribution” puntear “Cummulative distribution”. En la
ventana de “Shape parameter” y “Scale parameter” teclear los valores de α y β. Para
5-79
el resto proceder como arriba. Para las gráficas hacer lo mismo que arriba.
Similarmente, para calcular los valores de la distribución Gamma:
Calc > Probability distributions > Gamma…
Proceder en forma análoga a como se hizo con la función Weibull
Ejemplo #51. Calcular las siguientes probabilidades bajo la curva normal estándar
usando el paquete de computadora Minitab:
(a) Entre z = -1.5 y z = -1
(b) P(z ≥ 2)
(c) Entre z = 1 y z = -1
(d) Hacer una gráfica
Solución:
Abrir el programa Minitab y seguir las instrucciones correspondientes. Esto generará
una tabla de abajo.
TABLA 5.8. Valores de la variable aleatoria X y la cpd. (Elaboración propia)
___________________________________________________________________
Columnas C1 C2
Variable aleatoria z Distribución de Probabilidad acumulada
1 -4.0 .000032
2 -3.5 .000233
3 -3.0 .001350
4 -2.5 .006210
5 -2.0 .022750
6 -1.5 .066807
7 -1.0 .158655
8 0.0 .500000
9 1.0 .841345
10 1.5 .933193
11 2.0 .977250
12 2.5 .993790
13 3.0 .998650
14 3.5 .999767
15 4.0 .999968
(a) P(-1.5 ≤ z ≤ -1.0) = 0.1587 – 0.0668 = 0.0919 (de la tabla de arriba)
5-80
(b) P(z ≥ -2) = 1 – P(z ≤ -2.5) = 1 – 0.0062 = 0.9938

(c) P(1 ≤ z ≤ -1) = 0.6827 (sin consultar la tabla. ¿Por qué?)
Ejemplo #52. Calcular la distribución de las probabilidades acumuladas para los

valores de la variable aleatoria X = 2.5, 2.6, 2.7, 2.8, 2.9, 3.0, 3.1, 3.2, 3.3, 3.4.
Además, calcular los siguientes enunciados:
(a) P(X ≥ 2.9)
(b) P(2.6 ≤ X ≤ 3.2)
(c) El valor de X es de cuando menos 3.4
Solución:
Usando el programa Minitab, primeramente calculamos el promedio y la desviación
estándar, de los valores de la variable aleatoria X, y da los resultados de la estadística
descriptiva de abajo.
Figura 5.17. Resultados de la estadística descriptiva usando el Minitab.
__________________________________________________________________
Estadística Descriptiva: Variable aleatoria x
Variable N Promedio Error estándar s s2 Coef. de Var.
Variable aleatoria 10 2.9500 0.0957 0.3028 0.0917 10.26
Variable Q1 Mediana Q3 Maximum Sesgo Kurtosis
Variable aleatoria 2.6750 2.9500 3.2250 3.4000 0.00 -1.20
__________________________________________________________________
Después, tableando los valores de X en C1 con X = 2.95 y s = 0.3028, en sus
ventanas respectivas, se genera la tabla de abajo.
TABLA 5.9. Tabla mostrando la variable aleatoria X y probabilidades acumuladas.

5-81
__________________________________________________________________
Columnas C1 C2
Variable aleatoria X Probabilidad acumulada
1 2.5 0.068622
2 2.6 0.123865
3 2.7 0.204508
4 2.8 0.310167
5 2.9 0.434423
6 3.0 0.565577
7 3.1 0.689833
8 3.2 0.795492
9 3.3 0.876135
10 3.4 0.931378
Ahora, para resolver los incisos pedidos por el problema se procede como:
(a) P(X ≥ 2.9) = 1 – 0.3102 = 0.6890 (de la tabla de arriba)
(b) P(2.6 ≤ X ≤ 3.2) = 0.795492 – 0.068622 = 0.7269
(c) P(X ≥ 3.4) (para resolverse por el lector)
Ejemplo #53. Supongamos que el tiempo promedio que se tarda una sustancia
radiactiva (un isótopo radiactivo que tiene el mismo número atómico pero diferente
peso molecular) en descomponerse es de µ = 15 años; siendo así:
(a) Hacer una tabla con los valores de la función exponencial de densidad para los
valores de la variable aleatoria X = 0, 5, 10, 15, 20, 25, 30, 35, 40, 45 y 50 años.
(b) Graficar las probabilidades individuales y las probabilidades acumuladas en
función del tiempo en años.
(c) ¿Cuál es la probabilidad que el isótopo tarde en degradarse a lo más en 5 años?
(d) ¿La probabilidad de que el isótopo tarde en oxidarse en cuándo menos 20 años?
(e) ¿La probabilidad de que el isótopo tarde en degradarse entre 20 y 50 años?
(f) ¿Cuánta radiactividad quedó después de 40 años?
5-82
(g) ¿Cuánta energía se liberó después de 40 años?

(h) ¿Qué cantidad del isótopo radiactivo quedó después de 50 años?
TABLA 5.10. Tabla mostrando los valores generados de la probabilidad acumulada y
la probabilidad individual. (Elaboración propia)
__________________________________________________________________
Solución:
(a) Ver TABLA 5.10

(b) Para este inciso, las gráficas de abajo muestran esta situación.
Scatterplot of Radiactividad restante vs Tiempo en años
0.07
0.06
Radiactividad restante
0.05
0.04
0.03
0.02
0.01
0.00
0 10 20 30 40 50
Tiempo en años
Figura 5.18. Gráfica mostrando la radiactividad restante, en función del tiempo en

años. (Elaboración propia)
5-83
Scatterplot of Energia liberada vs Tiempo en años

1.0
0.8
Energia liberada
0.6
0.4
0.2
0.0
0 10 20 30 40 50
Tiempo en años
Figura 5.19. Gráfica mostrando la energía liberada (o la cantidad de la sustancia

ejercida) del isótopo radiactivo, en función del tiempo en años. (Elaboración propia)
(c) P(X ≤ 5) = 0.2835 (de la Tabla 5.10 de la probabilidad acumulada)
(d) P(X ≥ 20) = 1 – P(X ≤ 15) = 1 – 0.6321 = 0.3679
(e) P(20 ≤ X ≤ 50) = 0.3322
(f) P(X > 40) (resolverse por el lector)
(g) (Resolverse por el lector)
(h) (Resolverse por el lector)
En forma análoga para hacer gráficas de probabilidad para las diferentes
distribuciones como la Lognormal, gamma, Weibull, Logística, etc., irse a:
Graph → Probability Plot
Haciendo esto aparece la ventana de “Probability Plots” y luego poner OK, lo que
lleva a la ventana de “Probability Plot Single”. Después de irse a “Distribution” y
aparece la ventana con la lista de todas las distribuciones como normal, lognormal,
Weibull, logística, gamma, exponencial, etc. Se le pide al lector hacer un ejercicio
haciendo gráficas de probabilidad para las distribuciones continuas.
5-84
5.1. En un muestreo de partículas atmosféricas, el promedio de la muestra fue de 72
micras y la desviación estándar fue de 15 micras. Determinar las unidades de
desviación estándar de las partículas que tuvieron valores de:
(a) 60 (-0.80)
(b) 93 (1.4)
(c) 72 micras (0)
5.2. Refiriéndose al problema anterior, encontrar los valores de la variable aleatoria
normal z correspondientes a:
(a) z = -1
(b) z = 1.6
5.3. En un estudio independiente, dos industrias contaminantes fueron informadas de
que recibieron evaluaciones ecológicas de variables aleatorias normales estándares de
z de 0.7 y -0.5, respectivamente. Si sus resultados (evaluaciones) fueron de 90 y 74,
respectivamente, y asumiendo que s = 13.32, encontrar el promedio aritmético, para
ambos casos. ( X = 80.67, X = 60.67) 5.4. Encontrar el área o la
proporción de la valores de la variable aleatoria z de la curva normal entre z = 0 y z =
1.2.
5.5. Encontrar el área entre z = 0.81 y z = 1.94. (0.1828)
5.6. Encontrar la probabilidad de que una z observada se encuentre a la derecha de z =
2.05 y a la izquierda de z = -1.44.
5.7. Determinar el valor o los valores de z cuando:
(a) La probabilidad entre 0 y z es de 0.3770 (±1.16)
(b) La probabilidad a la izquierda de z es de 0.8621 (1.09)
5.8. El peso promedio de residuos tóxicos peligrosos generados por 500 industrias es
5-85
de 151 toneladas métricas, con una desviación estándar de 15 toneladas. Si los pesos
de los residuos tóxicos generados por estas industrias están normalmente distribuidos,
encontrar todo lo siguiente:
(a) Cuántas industrias generan entre 120 y 155 toneladas, inclusive.
(b) Cuántas generan más de 185 toneladas
(c) Cuántas generan cuando menos 128 toneladas
(d) Cuántas generan igual a 128 toneladas
(e) Cuántas generan más de 75, pero menos de 100 toneladas
5.9. Si los diámetros de unas chumaceras de una maquinaria están normalmente
distribuidos, con un promedio de 0.6140 pulgadas y una desviación estándar de .0025
pulgadas, determinar la probabilidad de que las chumaceras tengan diámetros de:
(a) Entre .610 y .618 pulgadas inclusivamente (0.8904)
(b) > .617 pulgadas (0.1151)
(c) < .608 pulgadas (.0207)
(d) Igual a .615 pulgadas
5.10. Si una muestra aleatoria de análisis de las concentraciones de demanda
bioquímica de oxígeno de 5 días (DBO5) está normalmente distribuidas, ¿qué
probabilidad hay de que éstas difieran del promedio por?
(a) Más de la mitad de la desviación estándar
(b) Menos que 0.75 de la desviación estándar.
5.11. Dada una distribución normal de precipitaciones pluviales con promedio de 50
mm y s = 10 mm. Encontrar la probabilidad de que X asuma un valor entre 45 mm y
62 mm de lluvia. (0.5764)
5.12. Si el X y s son el promedio y la desviación estándar de una muestra aleatoria de
análisis de aguas residuales de concentraciones de nitratos, en mg/L, ¿Cuál es la
5-86
probabilidad de que las concentraciones estén?

(a) Dentro del rango ( X ± 2s)
(b) Afuera del rango ( X ± 1.2s)
(c) Mayor que ( X - 1.5 s)
5.13. Dada una distribución normal de valores, en partes por millón, de CO
atmosférico, con X = 300 y s = 50. Encontrar la probabilidad de que X asuma un
valor mayor que 362. (0.1075)
5.14. Dada una distribución normal con µ = 40 y σ = 6, encontrar el valor de X que
tenga:
(a) 45% del área a la izquierda
(b) 14% del área a la derecha.
5.15. La tela de fibra de vidrio del equipo de control para partículas atmosféricas dura
un promedio de 3.0 años, con una desviación estándar de 0.5 años. Si las duraciones
de las telas están normalmente distribuidas, encontrar la probabilidad de que una tela
de un filtro dure menos de 2.3 años. (0.0808)
5.16. Una compañía fabrica electrodos para los precipitadores electrostáticos (equipo
de control para partículas contaminantes en aire), cuya duración está normalmente
distribuida, con un promedio igual a 800 horas y una desviación estándar de 40 horas.
Encontrar la probabilidad de que un electrodo se funda entre 778 y 834 horas.
5.17. En un proceso industrial el diámetro de un balero se establece en sus
especificaciones como 3.0 ± 0.01 cm. En la manufactura de estos valeros, la
implicación es que no se acepta ningún balero que se salga de esta medida. Se saca
una muestra de 100 valeros al azar y se calcula el promedio aritmético de 3.0 cm., con
una desviación estándar de 0.005 cm. En promedio, ¿cuántos valeros fabricados se
descartarán? (≈ 5 valeros)
5-87
5.18. Se utilizan medidores para rechazar todo los componentes cuyas dimensiones no
se encuentren dentro del la especificación dada de 1.50 ± d. Sin embargo, se sabe que
esta dimensión está normalmente distribuida con un promedio de 1.50 Y una
desviación estándar de 0.2. Determinar el valor de d para que la especificación cubra
el 90% de las mediciones.
5.19. Cuál es la probabilidad de que:
(a) P(-0.5 < z < 1.25) (0.5859)
(b) ¿El valor de z no esté entre estos dos valores? (0.4144)
5.20. En un estudio de ingeniería de higiene industrial y seguridad, el supervisor de
producción encuentra que, los trabajadores, en promedio, completan una tarea en 10
minutos cuando están expuestos a altas concentraciones de gases. Los tiempos
requeridos para completar la tarea son aproximadamente normales con una desviación
estándar de 3 minutos. Encontrar lo siguiente:
(a) La proporción de empleados que completan la tarea en menos de 4 minutos.
(b) El % de empleados que requieren más de 5 minutos en completar la tarea.
(c) La probabilidad de que un empleado, quien acaba de ser asignado a la tarea, la
completará dentro de 3 minutos.
5.21. Se llevó a cabo un muestreo y un análisis de las concentraciones de nitratos
(NO-3) de un sistema de tratamiento de aguas industriales. Las concentraciones de
nitratos se reportaron en mg/L. Los siguientes datos se dan en mg/L en la tabla de
abajo:
5-88

___________________________________________________________________
6.9 7.8 8.9 5.2 7.7 9.6 8.7 6.7 4.8 8.0 10.1 8.5
6.5 9.2 7.4 6.0 6.1 6.3 5.6 5.2 5.4 7.3 8.2 8.3
7.2 7.5 6.1 6.0 9.4 5.4 7.6 8.1 7.9
___________________________________________________________________
Hacer los siguientes cálculos corriendo una estadística descriptiva que incluya:
(a) El promedio muestral, la varianza, la desviación estándar y el rango. ( X = 7.26,
s2 = 2.02, s = 1.42, rango = 5.3)
(b) Encontrar el error estándar, el sesgo, la kurtosis, el valor máximo y el valor
mínimo. (0.25, 0.08, -.088, 10.1, 4.8)
(c) Evidenciar la simetría de los datos.
(d) Si el límite de las concentraciones de nitratos en el efluente es de 8.5 mg/L, de
acuerdo a la legislación ambiental de aguas, hacer una prueba de hipótesis con un
nivel de significancia de α = .05 y calcular la probabilidad p e interpretarla
acordemente. (P <<< .0003)
(e) Hacer un intervalo de confianza para el promedio µ. (6.76, 7.76)
(f) Hacer un intervalo de confianza para la mediana. (6.39, 7.95)
(g) Hacer un intervalo de confianza con nivel de confianza de 95% para la desviación
estándar poblacional, σ. (1.14, 1.88)
(h) Encontrar el primer cuartil (6.05)
(i) Encontrar el tercer cuartil. (8.25)
5.22. En un estudio de meteorología de precipitación pluvial, el promedio de lluvia
registrado, a la centésima de un centímetro, para el mes de marzo fue de 9.22
centímetros. Asumiendo que estos valores están normalmente distribuidos con una
desviación estándar conocida de 2.83 cm., encontrar la probabilidad de que el
5-89
siguiente mes de marzo del año entrante, se reciban:

(a) Menos de 1.84 cm. de lluvia.
(b) Más de 5 cm. de lluvia.
(c) Cuando menos 13.8 cm. de lluvia.
(d) A lo más 10.0 cm. de lluvia.
(e) Igual a 5 cm. de lluvia, e.g., P(4.5 ≤ X ≤ 5.5)
(f) Hacer una gráfica para cada inciso.
5.23. Supóngase que la función de densidad de cierto experimento de mediciones de
oxígeno disuelto (OD) es f(x) = ex. Si suponemos que la variable aleatoria continua
asuma valores entre X = 2.0 y X = 5.0, encontrar las siguientes probabilidades.
(a) P(0 < X < 4) (e4 – 1)
(b) P(X < 4) (e2) (c)
P(2 < X < 5) (e3) (d)
P(0 < X < 3) (e3 – 1) 5.24.
Dar el dominio de cada una de las siguientes variables y decir si las variables son
continuas o discretas.
(a) El número de litros de agua en un radiador de automóvil.
(b) El número de libros en el estante de una librería.
(c) El diámetro D de una esfera.
5.25. Sea z una variable aleatoria normal estándar, entonces, calcular las siguientes
probabilidades, dibujando las gráficas.
(a) P(0 ≤ z ≤ 2.17) (0.4850)
(b) P(0 ≤ z ≤ 1) (0.3413)
(c) P(-2.5 ≤ z ≤ 0) (0.4938)
(d) P(-2.5 ≤ z ≤ 2.5)
5-90
(e) P(1.5 ≤ z) (1 - 0.9332)

(f) P(|z| ≤ 2.50)
5.26. Si X es una variable aleatoria normal con promedio de 80 y desviación estándar
de 10, entonces, calcular las siguientes probabilidades, mediante estandarización.
(a) P(X ≤ 100)
(b) P(65 ≤ X ≤ 100)
(c) P(85 ≤ X ≤ 95)
(d) P(70 ≤ X)
(e) P(90 ≤ X ≤ 100)
(f) P(80 ≤ X ≤ 110)
(g) P(2 < z < -2)
5.27. La vida promedio de una partícula en la atmósfera, sigue a la ley de Stoke. Ésta
va en función del diámetro de sedimentación, misma que va en función de la densidad
de la partícula, la densidad del medio, la viscosidad absoluta del medio, la aceleración
de la gravedad (981 cm/sec2), etc. Con esto, se puede modelar la caída de la partícula
usando la función exponencial. Suponiendo que la vida promedio en la atmósfera de
esa partícula sea de 12 años, entonces calcular las siguientes probabilidades:
(a) ¿Cuál es la probabilidad de que la vida de residencia atmosférica de la partícula
sea de a lo más 6 años. (0.3934)
(b) ¿Cuál es la probabilidad de que la vida de residencia atmosférica de la partícula
sea entre 5 y 10 años? (0.2244)
Sugerencia: Usar las siguientes relaciones:
P(x ≤ xo) = 1 – e-x/µ y P(x ≤ xo) = P(X ≤ 10) – P(X ≤ 5)
5.28. La vida (en horas) de un dispositivo electrónico es una variable aleatoria con la
siguiente distribución exponencial de probabilidad: f(x) = 1/50 e-x/50 para x ≥ 0
5-91
(a) ¿Cuál es la vida promedio del dispositivo?

(b) ¿Cuál es la probabilidad de que el dispositivo funcione 10 o menos horas antes de
que falle?
(c) ¿Cuál es la probabilidad de que el dispositivo dure entre 40 y 60 horas?
(d) Hacer una gráfica con valores de x = 5, 10, 20, 30, 40, 50, 60 con sus
probabilidades correspondientes f(x).
5.29. La demanda bioquímica de oxígeno (DBO5) de 5 días (¿porqué de 5 días?) de
una muestra de materia orgánica sigue a una distribución exponencial de probabilidad
con un promedio de 80 mg/L de DBO5: f (x) = 1/80 e-x/80
(a) Hacer una gráfica con esta función usando x = 1, 2, 3, 4, 5 días.
(b) Calcular la cantidad de DBO (en mg/L) que quedó entre 1 y 2 días. Expresarlo en
la gráfica. (0.0245)
(c) Calcular la concentración de DBO (mg/L) que quedó entre 1 y 3 días. Expresarlo
en la gráfica. (0.0368)
(d) Calcular la concentración de DBO (mg/L) que quedó entre 1 y 5 días. (.060)
(e) Calcular la cantidad de DBO que se ejerció (cantidad de materia orgánica
oxidada) en a lo más 4 días. Expresarlo en la gráfica. (0.0488)
(f) Calcular la concentración de DBO que quedó después de 5 días. (0.0606)
(g) ¿Qué porcentaje de DBO se ejerció, a lo más en 5 días? (0.6006)
5-92
Tabla mostrando los resultados del DBO que va quedando y el DBO oxidado o
ejercido. (Elaboración propia)
X DBO restante DBO oxidado
(Días) (Prob. individual) (Prob. acumulada)
1 .0123 .0124
2 .0122 .0247
3 .0120 .0368
4 .0119 .0488
5 .0117 .0606
5.30. Se da la tabla de abajo con los porcentajes de DBO oxidado en función del
tiempo y de la constante de desoxigenación k. Si el DBO5 último o total es de Lo =
300 mg/L (derivado de la ecuación monomolecular y = Lo(1 – 10-kt), hacer lo
siguiente:
(a) Una gráfica para ver el efecto de la velocidad de la constante k para un nivel dado
de Lo de la ecuación monomolecular.
(b) Una gráfica que indique el DBO que va quedando y la cantidad de DBO que se
va ejerciendo, para cada uno de los 20 días y para cada una de las tasas k.
(c) ¿Cuál es la probabilidad de que la concentración de DBO esté entre 3 y 6 días
inclusivamente, para k = 0.15? ¿A qué concentración de DBO ascendió esto?
(d) Calcular la concentración de DBO que quedó entre 3 y 5, para k = 0.10.
5-93
Tabla mostrando la tasa de reacción de la variable k en el DBO vs. tiempo.

Tiempo (días) Porcentaje del total de DBO ejercido
————————————————————————
k = 0.05 k = 0.10 k = 0.15 k = 0.20 k = 0.25
1 10.9 20.6 29.2 36.9 43.8
2 20.6 37.0 50.0 60.0 68.0
3 29.0 50.0 64.0 75.0 82.0
4 37.0 60.0 75.0 84.0 90.0
5 44.0 68.0 82.0 90.0 94.0
6 50.0 75.0 87.0 94.0 97.0
7 55.0 80.0 91.0 96.0 98.0
10 68.0 90.0 97.0 99.0 99.0
20 90.0 99.0 99.0+ 99.0+ 99.0+
(Fuente: Sawyer et al. 1967)
5.31. Supóngase que, el tiempo en horas, requeridas para reparar una bomba de calor
es una variable aleatoria X que tiene un distribución gamma con parámetros α = 2 y β
= 0.5.
(a) Encontrar el promedio, la varianza y la desviación estándar. (µ = 1.0, σ2 = 0.5)
(b) ¿Cuál es la probabilidad de que el siguiente servicio requerirá a lo más una hora
para reparar la bomba?
(c) La probabilidad de que se requieran cuando menos 2 horas para reparar la bomba.
(0.0916)
5.32. En cierta ciudad, el consumo diario de electricidad, en millones de kilowatt-
horas, es una variable aleatoria X que sigue a una distribución gamma con µ = 6 y σ2
= 12. Encontrar:
(a) Los valores de α y β.
(b) Encontrar la probabilidad de que en un día dado el consumo diario de electricidad
excederá 12 millones de kilowatt-horas.
5-94
5.33. Se sabe que la distribución de Weibull es ampliamente usada en problemas de

estadística relacionados con el envejecimiento y deterioro de materiales sólidos
aislantes sujetos a voltajes AC. Los valores de los parámetros dependen del voltaje y
de la temperatura. Basado en esto, supóngase que α = 2.5 y β = 200. Siendo así,
calcular lo siguiente:
(a) ¿Cuál es la probabilidad de que la vida de uno de estos aparatos sea a lo más de
200? (.632)
(b) Menos que 200 (0.6275)
(c) Más de 300 (0.064) (d)
Entre 100 y 200 (0.243)
5.34. En un estudio de meteorología, después de analizar una muestra de 106
temperaturas ambientales, un ingeniero ambiental afirma que el promedio de
temperatura es menor que 98.6 oF. Hacer lo siguiente:
(a) Identificar la hipótesis nula Ho:
(b) Identificar la hipótesis alternativa H1:
(c) Identificar si esta prueba es de dos colas, de la cola izquierda o de la cola derecha.
5.35. La afirmación de que el promedio poblacional del peso de las tabletas de
aspirina es probada con un nivel de significación de α = .05. Las condiciones son de
que se puede usar la distribución normal porque n > 30. Encontrar las regiones
críticas o los valores críticos de z, si la prueba es de:
(a) Dos colas. (ztab. = ±1.96)
(b) De la cola izquierda. (z.05 = -1.655)
(c) De la cola derecha. (ztab. = 1.645)
5.36. Contestar las preguntas en los ejercicios del 1 al 6.
1. El promedio del coeficiente de los instructores de estadística es de 185.
5-95
2. El promedio del peso del papel descartado cada semana en un estudio de reciclaje
de papel es menor que 10 kilogramos.
3. El tiempo promedio requerido para los estudiantes puedan adquirir su título es
mayor que 5 años.
4. El promedio anual de ingresos de los médicos es de $300,000 dólares.
5. El promedio de la edad de los aviones comerciales es de cuando menos 10 años.
6. La tasa del promedio de consumo de los automóviles Chevrolet es de no más de 17
millas/galón.
Para cada uno de estos ejemplos del 1 al 6, contestar lo siguiente:
(a) Identificar la hipótesis nula, Ho:
(b) Identificar la hipótesis alternativa, H1:
(c)Identificar la prueba si es bilateral, o unilateral izquierda o derecha.
(g) Asumir que la conclusión es de rechazar la hipótesis nula. Declarar la conclusión
en términos no técnicos. Asegurarse de enlistar el reclamo original.
(h) Asumir que la conclusión es la de fallar en rechazar la hipótesis nula. Declarar la
conclusión en términos no técnicos. Asegurarse de enlistar el reclamo original.
5.37. Calcular el valor de la probabilidad p con niveles de significación de α = 0.05 y
α = 0.01. Se dan los siguientes valores: n = 50, X = 31.8 y σ = 0.75. Probar la
hipótesis nula Ho:µ ≥ 32 contra H1: < 32. (z = -1.89, p = .0294)
5.38. Una muestra aleatoria de 36 casos de análisis de aguas conteniendo cloratos
(mg/L de ClO3-), se usa el método argentométrico de titulaciones (Estándar Methods
for the Examination of Water and Wastewater, 1971). Probar la hipótesis de que el
promedio poblacional es igual a 145 mg/L. Se calcula el promedio estadístico y nos
da X = 138.84 con una desviación estándar de 20. Probar la hipótesis de Ho:µ = 145
con los niveles de significancia de 0.05 y 0.01. También calcular el valor de p. 5.39.
5-96
El promedio de una muestra aleatoria de 100 análisis de sulfatos (SO4-2) es de 1570

mg/L, con una desviación estándar de 120 mg/L. Si µ es el promedio de todos los
casos de sulfatos, probar la hipótesis nula de Ho:µ = 1600 mg/L, contra la hipótesis
alternativa de H1:µ ≠ 1600 mg/L usando los niveles de significación de 0.05 y 0.01.
Calcular el valor de la probabilidad, p. (z = -2.5, p = .0062)
5.40. En un estudio de oceanografía (el estudio físico, químico y biológico de las
aguas de los océanos), supóngase que un oceanógrafo, al revisar la profundidad
promedio del océano, en cierta parte encuentra que es de 62.3 brazas. Esto lo hace
para ver la factibilidad de hacer ciertos análisis biológicos. Este investigador decidió
usar niveles de significancia de 0.05 y 0.01. Para esto, tomó una muestra de sondeos
de profundidad en 40 localizaciones marinas y encontró que el promedio de la
muestra estadística era de 64.8 brazas, con una desviación estándar de 5.1. Decir si se
rechaza Ho: y calcular el nivel de probabilidad.
5.41. Este es un estudio relacionado con el análisis de aguas industriales de calcio
(mg/L) usando el método gravimétrico. Para esto, se saca una muestra de 48 análisis y
se calcula un promedio estadístico de 76.4 mg/L con una desviación estándar de 3.6.
Usando un nivel de significancia de 0.05 probar la hipótesis de que el promedio
poblacional es mayor que 75 mg/L y calcular el valor de p. (z = 2.69, p = .0036)
5.42. Una muestra aleatoria de 16 observaciones de análisis de cobre, en el agua, se
sacaron de una población normal. Se calcula un promedio de X = 49.75 y una
desviación estándar de 10. Asumir una prueba bilateral. La muestra de los resultados
de los análisis se da abajo:
5-97

___________________________________________________________________
62 43 60 49 72 56 45 46 37 56 41 43 36 45 56 49
Usar el nivel de significancia de .05 y probar las siguientes hipótesis nulas:

(a) Ho:µ = 40
(b) Ho:µ = 49
(c) Ho:µ = 50
(d) Ho:µ = 51
(e) Ho:µ = 60
Debido a que X = 49.75 si puede determinar si una conclusión es correcta o errónea.
Para cada uno de los cinco incisos decir si la conclusión es correcta o si el error I o el
error II se han hecho cometido. Este ejercicio se hace para demostrar que el tipo de
error II se puede cometer si el promedio poblacional hipotético está cercano al
verdadero promedio poblacional.
_________________________________________________________________
Inciso µo X - µo z Ho: Región crítica Tipo de error
________________________________________________________________
a 40 9.75 3.90 rechazar ±1.96 ninguno
b 49 0.75 0.30 aceptar " II
c 50 -0.25 -0.10 aceptar " II
d 51 -1.25 -0.50 aceptar " II
e 60 -10.25 -4.10 rechazar " ninguno
__________________________________________________________________
5.43. Una muestra aleatoria de 2500 observaciones de temperaturas, expresadas en

grados Fahrenheit (oF), se sacaron y se calculó un promedio de igual a 49.9, con una
desviación estándar de 9.92. Usar las mismas hipótesis nulas que en el problema
5-98
anterior a un nivel de significación de α = 0.01. La intención de este ejercicio es para

demostrar que la probabilidad de cometer ambos errores tipo I y tipo II se pueden
reducir, al mismo tiempo, aumentando el tamaño de la muestra. Los datos pertinentes
se dan en la tabla de abajo.
_________________________________________________________________
Inciso µo X - µo z Ho: Región critica Tipo de error
________________________________________________________________
a 40 9.9 49.5 ±2.58 rechazar ninguno
b 49 0.9 4.5 " " "
c 50 -0.1 -0.5 " " "
d 51 -1.1 -5.5 " " "
e 60 -10.1 -50.5 " " "
5.44. Suponiendo que se observa un valor de z = 1.87 con un nivel de significación de

α = 0.05 y con Ho: µ = 10, entonces, calcular el valor de la probabilidad, p.
5.45. Si el valor de la variable aleatoria es de z = 2.73, α = 0.05 y Ho: µ = 10,
encontrar el valor de p. (0.0032)
5.46. En un estudio de higiene industrial y seguridad, (seguridad para los motoristas),
con la cooperación del departamento de policía, se requiere que los surtidores de
llantas tengan un vida promedio de cuando menos 30,000 millas. Para asegurarse de
este impedimento, el departamento de policía prueba una muestra aleatoria de 36
llantas y obtiene un promedio estadístico de 25,800 millas con una desviación
estándar de 8,000 millas. Permitiendo una probabilidad de .05 del tipo error I, usar los
datos para probar la hipótesis nula de que el verdadero promedio es de cuando menos
30,000 millas.
5.47. Se dan los siguientes datos procedentes de un estudio de precipitación pluvial en
5-99
mediciones de milímetros de lluvia: Ho:µ = 0.340 mm, H1:µ ≠ 0.340, donde 0.34 = µo,
α = .05, X = 0.343 mm., σ = .01, n = 35. (Nótese que aquí es una prueba de 2 colas,
porque Ho:µ = 0.340 reúne la condición de igualdad). Las regiones críticas son ±
1.96, porque α = 0.05. Ver tabla de abajo. (z = 1.77. Se retiene Ho: con p = .0768)
________________________________________________________________
Hipótesis alternativas Rechazar Ho:µ = 0.340 si:
__________________________________________________________________
H1: µ < µo = 0.3430 z < - zα
H1: µ > µo = 0.343 z > + zα
H1: µ ≠ µo = .0.343 z < - zα/2 o z > zα/2
__________________________________________________________________
5.48. Una empresa de camiones de carga sospecha de la afirmación de que el ciclo de

vida de ciertos neumáticos es de al menos 28,000 millas (≥ 28,000). Para verificar
este argumento, la empresa instala 40 de esas llantas en sus camiones y obtiene un
ciclo de vida promedio de 27,463 con σ = 1348 millas. ¿Qué se puede concluir, si la
probabilidad de un error tipo alfa se fija en 0.01? Asumir una prueba de hipótesis
unilateral izquierda.
5.49. Para un análisis de pesticidas clorinados hidrocarbonados en aguas residuales
(usando cromatografía de gas), se dio una muestra conteniendo este pesticida a dos
laboratorios. Los tamaños de las muestras fueron de 40 y 50 casos, respectivamente.
Si las muestras tienen promedios de X 1 = 74 con desviación estándar de σ1 = 8, y de
promedio de X 2 = 78 con una desviación estándar de σ2 = 7, decir si hay una
diferencia significante entre los resultados de los dos laboratorios. Asumir niveles de
significancia de α = .05 y α = .01. (z = -2.49, p = .0064)
5.50. Una muestra aleatoria de 100 muertes en E. U. mostró una vida promedio de
5-100
71.8 años con una desviación estándar de 8.9 años. ¿Pudiera esto indicar que la vida
promedio de hoy en día es mayor que 70 años? Usar α = .05.
5.51. Un fabricante de cables de acero afirma que su producto tiene una resistencia de
ruptura de 8.0 Kg. Probar la hipótesis nula de que Ho:µ = 8.0 Kg., contra la prueba
alternativa de que H1:µ ≠ 8.0 Kg. Para esto, se sacó una muestra aleatoria de 50
cables y se encuentra que tiene una resistencia promedio de X = 7.8 Kg., con una
desviación estándar de 0.5 Kg. Para esta prueba usar α = .05 y α = .01. (p = .0046)
5.52. En un estudio de la aplicación del pH (potencial hidrógeno que tiene una escala
de 0 a 14, donde 7 es neutral y abajo de 7 es ácido y arriba de 7 es alcalino) para
medir la alcalinidad y la acidez de soluciones, un científico, dedicado al estudio de la
contaminación ambiental, asegura que dos muestras de soluciones (A y B) provienen
del mismo lugar de un río, donde supuestamente hubo un descarga industrial de ácido
clorhídrico (HCl). Si esto fuera cierto, entonces el pH de las dos muestras de
soluciones serían iguales. Asumiendo que las observaciones provienen de
poblacionales normales, probar la hipótesis nula de igualdad de los promedios de pH.
Asumir α = 0.05. Hacer las siguientes estimaciones:
(a) Hacer estos cálculos usando la distribución normal y la distribución de t de
Estudiante.
(b) También, calcular el valor de la probabilidad p en ambos casos y ver que
diferencias hay.
(c) Hacer intervalos de confianza usando las fórmulas para la distribución z y para la t
de Estudiante.
(d) ¿Desaprueban los datos la afirmación del científico? La tabla de abajo muestra la
información requerida para este problema.
5-101
Tabla mostrando los datos de las mediciones del pH. (Elaboración propia)
Mediciones del pH de solución A Mediciones del pH de solución B

___________________________________________________________________
6.24 6.27
6.31 6.25
6.28 6.33
6.30 6.27
6.25 6.24
6.26 6.31
6.24 6.28
6.29 6.29
6.22 6.34
6.28 6.27
___________________________________________________________________
5.53. Una compañía está en el proceso de decidirse si va a producir un nuevo

componente electrónico. En la planta hay dos máquinas que pueden ser adaptadas
para hacer este componente. Para esto, se hace una prueba en la máquina 1 y se mide
el tiempo de producción por componente y da un promedio de X 1 = 5.23 minutos
para una muestra de 100 componentes. En la máquina 2 el promedio de tiempo fue de
X 2 = 5.37 minutos para una muestra de 64 componentes. En pasadas experiencias, se
sabe que las desviaciones estándar fueron de 0.15 y 0.10 minutos, respectivamente
Asumir α = 0.05. Hacer los siguientes cálculos:
(a) Probar la hipótesis de que no hay diferencias entre las dos poblaciones de
componentes muestreadas. (z = -2.55 se rechaza Ho:)
(b) Hacer un intervalo de confianza para el verdadero promedio µ.
(c) Calcular el valor de p. (p = 0.011)

5.54. En una investigación relacionada con las concentraciones de plomo (Pb), se
5-102
sabe que el plomo es un veneno muy peligroso, en el cual el cuerpo se adapta

crónicamente a las acumulaciones de este metal pesado. La presencia de Pb en el agua
potable puede venir de descargas industriales, de minas y de fundiciones de metales.
Hay algunos métodos para determinar las concentraciones de Pb en el agua. Uno de
ellos es el método de absorción atómica espectrométrico (método A) y el método
calorimétrico (método B). En esta investigación se pretende comparar los resultados
de los métodos de absorción atómica y el de ditizone. El método de absorción atómica
espectrométrica consiste en aspirar la muestra preparada en una flama y
atomizándola. El método ditizone consiste en extraer en tetracloruro de carbono
(CCl4), el Pb en una solución ligeramente básica. Los datos debajo dan las
concentraciones (en mg/L) de dos muestras de método A y método B. Asumir un
nivel de significación de 0.05. También, asumir que las poblaciones muestreadas son
normales. Hacer los siguientes cálculos:
(a) Probar que no hay diferencia entre las dos poblaciones analizadas.
(b) Calcular el valor de p.
(c) Hacer un intervalo de confianza con α = 0.05
La tabla de abajo muestra los resultados de las concentraciones de los dos métodos.
Tabla mostrando las mediciones de Pb. (Elaboración propia)
Método A | .055, .051, .052, .053, .055, .053, .055, .049, .048, .049, .05, .053, .052, .054, .056, .054, .057, .049,
.048, .05, .057, .059, .040, .042, .043, .046, .055, .03, .07, .075, .08, .086, .056, .078, .076, .077
Método B |.057, .06, .07, .057, .059, .059, .049, .06, .07, .075, .06, .067, .068, .064, .069, .078, .07,
.079, .074, .05, .06, .07, .08, .081, .072, .082, .079, .087, .04, .04, .04, .043, .044, .046, .081, .083
5.55. Dos astrónomos registraron observaciones de cierta estrella en el firmamento.

Se obtuvieron 12 observaciones por el primer astrónomo y dio un promedio de 1.20
mediciones. El segundo astrónomo sacó una muestra de 8 observaciones y obtuvo un
5-103
promedio de 1.15 mediciones. La experiencia pasada indicó que estos astrónomos

obtuvieron mediciones con varianzas de 0.40 mediciones. Asumir que la población
muestreada es normal. Usar el nivel de significación de 0.05 y probar las hipótesis:
Ho:µ1 - µ2 = 0 contra las hipótesis alternativas de H2:µ > 0 y H3:µ < 0. (z = 0.17)
5.56. Decir de cuántas colas se harán las siguientes pruebas de hipótesis y decir las
pruebas alternativas:
(a) Si la prueba de hipótesis nula es de Ho: µ = 14.00, entonces las pruebas
alternativas son de:
(b) Si la prueba de hipótesis nula es de Ho: µ ≥ 14.00, entonces las pruebas
alternativas son de:
(c) Si la prueba de hipótesis es de Ho: µ ≤ 14.00, entonces las pruebas alternativas
son de:
5.57. Una muestra de 49 observaciones de análisis de ruidos (en decibeles, dB) se usó
para probar la hipótesis nula de que el promedio poblacional es de µ = 145 dB. Se
calculó un promedio muestral de X = 138.00 dB con una desviación estándar de 20.
Hacer los siguientes cálculos:
(a) Establecer las pruebas alternativas. (H1:µ ≠ 145)
(b) Si el nivel de significancia es α = 0.05 establecer la región crítica.(tcrítica = ±1.96)
(c) Si se rechaza la hipótesis nula, calcular el valor de p. (p = .0142)
5.58. Después de analizar las temperaturas de 50 trabajadores de un frigorífico, el
médico de la empresa afirma que, la temperatura promedio poblacional del cuerpo, es
igual a 98.6 oF. El promedio estadístico de este grupo fue de X = 98.2 oF con una
desviación estándar de σ = 0.62. Hacer lo siguiente:
(a) Identificar la hipótesis nula Ho:
(b) Identificar la o las hipótesis alternativas H1:
5-104
(c) Establecer las regiones críticas usando el nivel de significación de α = 0.05 y α =

0.01.
(d) Calcular el valor de la estadística z.
(e) Si se rechaza la hipótesis nula, calcular el valor de la probabilidad, p.
5.59. Si se usa el valor significante de α = 0.01 encontrar los valores críticos de z
(ztab.) si se usa:
(a) Prueba bilateral, es decir de dos colas. (±2.33)
(b) Prueba bilateral con α = 0.10. (±1.28)
(c) Prueba bilateral con α = 0.005. (±2.81)
5.60. Se dan los siguientes datos: Promedio aritmético, X = 31.8, σ = 0.25, n = 50,
Ho: µ ≥ 32. Hacer los siguientes cálculos:
(a) Decir cuál es la prueba de hipótesis alternativa
(b) Establecer las regiones críticas usando α = 0.05 y α = 0.01
(c) Calcular el valor de la estadística z (zcalc ).
(d) Si se rechaza la hipótesis en cualquiera de los dos niveles de significación de 0.05
y/o 0.01, calcular el valor de la probabilidad p.
5.61. Se saca un valor de n = 25 de una población normal, con s2 = 3. Usar α = .05.
Hacer lo siguientes:
(a) Calcular χ2. (χ2 = 9.6)
(b) Estimar las regiones críticas χ2α/2;n-1 y χ21-α/2;n-1 (12.4 y 39.4)
(c) Probar Ho:σ2 = 75, y H1:σ2 ≠ 75 (se rechaza Ho:)
(d) Calcular el valor de p. (p ≈ 0.01)
5.62. En un estudio ambiental hecho en varios lagos de Noruega, acerca del pH del
agua, en respuesta a la preocupación de los efectos de la precipitación pluvial ácida,
se hicieron dos muestreos hechos en los años de 1976 y 1981. Se quiere saber si hubo
5-105
diferencias en las dos mediciones de pH de esos años 1976 y 1981. Los datos se dan
en la tabla de abajo. Asumir que las varianzas de las dos poblaciones son iguales.
Usar un nivel de significación de 0.05 y calcular el valor de la probabilidad p en la
toma de decisiones. (Statistics for Environmental Sciences and Management, por
Bryan Manly, p. 8).
5-106
Tabla mostrando las mediciones de pH para 1975 y 1981.

No. de lago pH (1975) pH (1981)
1 4.59 4.63
2 4.97 4.98
3 4.32 4.49
4 4.97 5.21
5 4.98 5.00
6 4.58 4.94
7 4.72 4.90
8 4.53 4.54
9 4.96 5.69
10 4.96 5.75
11 5.31 5.43
12 5.42 5.19
13 5.60 5.70
14 5.37 5.38
15 4.87 4.90
16 5.87 6.02
17 6.20 6.25
18 6.67 6.67
19 6.06 6.09
20 5.38 5.51
21 5.60 5.98
22 5.60 5.66
23 5.37 5.67
24 5.07 5.18
25 6.23 6.29
26 6.24 6.37
27 5.15 5.68
28 4.82 5.45
29 5.42 5.54
30 4.99 5.25
31 5.31 5.55
32 5.99 6.13
33 4.63 4.92
34 4.47 4.50
35 4.60 4.66
36 4.88 4.92
37 4.60 4.84
38 4.85 4.86
39 5.06 5.11
40 5.97 6.17
41 5.47 5.82
(Fuente: Statistics for Environmental Science and Management. Manly, 2001)
5-107
Sugerencia: Usar la función estadística para pruebas de hipótesis para las diferencias
de dos promedios.
5.63. El presidente de cierta compañía fabricante de partes de automóvil afirma qué,
el número promedio de partes vendidas, diariamente, es de 1500. El director general
de toda la cadena de establecimientos quiere comprobar esta afirmación. Para esto, se
toma una muestra aleatoria consistente en 36 días, la cual mostró un promedio de
1450 partes. Asumir que se conoce el valor de σ = 120 partes. Usar α = 0.05. Calcular
el valor de la prueba no tradicional, es decir, usando el valor de p. ¿Qué se puede
concluir acerca de esta situación? (z = -2.5 y se rechaza Ho:)
5.64. Jay Devore autor del libro Probabilidad y Estadística para Ingeniería y
Ciencias (2201) discute el problema relacionado con el análisis de una muestra
aleatoria de n1 = 20 especimenes de acero laminado en frío, para determinar su
resistencia, dando, como resultado, una resistencia promedio muestral de X 1 = 29.8
ksi. Una segunda muestra aleatoria de n2 = 25 especimenes de acero galvanizado de
dos lados dio una resistencia promedio muestral de X 2 = 34.7 ksi. Si se supone que
las dos distribuciones de resistencia de los aceros son normales con σ1 = 4.0 y σ2 = 5.0
ksi (sugeridas por una gráfica en el artículo “Sinc-Coated Sheet Steel: An Overview”,
Automotive Engr., diciembre de 1984, pp. 39-43).
(a) ¿Significan estos datos que las verdaderas resistencias promedio µ1 y µ2 son
diferentes?
(c) También hacer un intervalo de confianza para los dos promedios poblacionales.
Realizar la prueba de hipótesis con α = 0.01.
5.65. En un estudio de higiene industrial y seguridad en carreteras estatales, al
seleccionar un concreto de azufre para construir una carretera, es importante escoger
5-108
un concreto con bajo valor de conductividad térmica, para reducir al mínimo los
daños ocasionados por cambios de temperatura y, así, evitar accidentes
automovilísticos en las carreteras. Supóngase que hay dos tipos de concreto, uno es
un agregado escalonado y el otro no tiene agregados finos considerados para cierta
carretera. La tabla de abajo resume los datos de un experimento realizado para
comparar los dos tipos de concreto. ¿Sugiere esta información que el verdadero
promedio de conductividad del concreto, con agregado escalonado supera al del
concreto sin agregado fino? ( Probabilidad y Estadística para Ingeniería y Ciencias,
J. L.Devore, 2000). (3.36, p = .0004)
Tipo de concreto Tamaño Promedio muestral Desviación

muestral de conductividad estándar
Escalonado 42 .486 .187
Sin agregados finos 42 .359 .158
(Fuente: Devore, 2000)
5.66. El gerente de una cadena de hoteles está considerando construir un motel a lo

largo de una autopista. El dueño que está vendiendo el terreno al gerente, para la
construcción del motel, asegura qué, por ahí pasan 1100 vehículos por día. Sin
embargo, el gerente de la cadena de hoteles dice que, una cifra mayor que 1100
vehículos, sería adecuada para la construcción del motel en ese sitio. Para esto se
toma una muestra aleatoria durante 18 días. ¿Los resultados reafirman o desaprueban
la afirmación del dueño del terreno? La tabla de abajo da la información requerida:
5-109
Tabla mostrando los datos del problema. (Elaboración propia).
Día | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
No. de vehículos |1150 1225 1195 1195 1210 1100 1150 1195 1105 1205 1121 1190 1195 1192 1100 1201 1090 1095
5.67. Encontrar las siguientes probabilidades:

(a) P(-1.0 < Z < 2.0) (0.8185)
(b) La probabilidad de que la variable aleatoria Z no se encuentre entre estos dos
valores. (0.1815)
(c) Si X = 4 y s = 1, encontrar los valores de la variable aleatoria X para el intervalo
del inciso (a). (X = 6)
5.68. La vida promedio de un pesticida órgano clorado depositado en la tierra es una
variable aleatoria con la siguiente distribución de probabilidad:
f (x) = 1/60 e-x/60 para x ≥ 0
(a) Dar el promedio del pesticida en cuestión.
(b) Estimar la probabilidad de que el pesticida, en cuestión, dure 100 días.
5.69. Se sacó una muestra al azar de 49 análisis de aguas residuales y se calculó X =
800 mg/L con s = 60.0 mg/L. Probar la hipótesis nula de que el verdadero promedio
es de 850 mg/L. Asumir α = 0.05. Calcular el valor de p. (z = -5.83, p = .0003).
5.70. Se sacó una muestra aleatoria de SO3 atmosférico en unidades de ppm
provenientes de un complejo industrial. Probar que µ = 52. Se sabe que la población
muestreada es normal. Calcular el valor de p con α = 0.01.
___________________________________________________________________
SO3 (ppm) | 50 52 56 57 55 55 54 55 56 57 56 54
___________________________________________________________________
5-110
5.71. En un estudio relacionado con el ahorro de combustible, se sabe que el 40% de

los coches no americanos de 4 cilindros, el consumo de gasolina se reduce
considerablemente, es decir, con relación a los coches americanos de 6 u 8 cilindros.
Si se saca una muestra aleatoria de 15 coches de 4 cilindros, calcular la probabilidad
de que 4 de estos coches sean eficientes en el ahorro de combustible. Hacer esto
usando la distribución binomial y la normal. Comparar los resultados. (Usando la
distribución normal da 0.1214; usando la distribución binomial da 0.1268)
5.72. Supóngase que el tiempo de reacción X a cierto estímulo en un individuo
seleccionado aleatoriamente, tiene una distribución gamma estándar con α = 2s
(Devore, 2001). Sugerencia: usar la relación P(a ≤ X ≤ b) = F(b) – F(a). Usar la tabla
de la función de gamma incompleta.
5.73. Este es un problema que involucra el uso de la distribución gamma en donde
aparecen distribuciones que no son estándar. Este problema dice así (Devore 2001, p.
171): Supóngase que el tiempo X de supervivencia, en semanas, de un ratón macho,
seleccionado al azar y expuesto a 240 rads de radiación gamma, tiene una distribución
gamma con α = 8 y β = 15. El tiempo esperado de supervivencia es de E(X) = (8)(15)
= 120 semanas, en tanto que, V(X) = (8)(15)2 = 1800 y σx = √1800 = 42.43 semanas.
Siendo así, encontrar la probabilidad de que un ratón sobreviva:
(a) Entre 60 y 120 semanas. (.496)
(b) Por lo menos 30 semanas. (.999)
5.74. Sea X la resistencia final a la tensión (ksi) a -200 oF de un tipo de metal que
presenta problemas de resistencia a temperaturas bajas. Supóngase que X tiene una
distribución Weibull con parámetros α = 20 y β = 100. Calcular lo siguiente:
(a) La probabilidad de que la resistencia final a la tensión (ksi) a -200 oF se de a lo
más 105. (.930)
5-111
(b) Entre 98 y 102

5.75. El encargado de la caseta de cobro de una carretera ha observado que los
vehículos llegan aleatoria e independientemente, con un promedio de 300 vehículos
por hora. Sugerencia: usar P(X ≥ a) = e-λa para (a) y p(x) = e-µx/x! para (b). Siendo así,
resolver los siguientes enunciados:
(a) Usar la función exponencial para calcular la probabilidad de cuando menos 1
minuto pasará antes de que el siguiente motorista llegue. (P(X ≥ 1.0) = e-5(1))
(b) Usar la distribución de Poisson para comparar el valor de la probabilidad obtenida
en (a).
5.76. La duración de cierta refacción para automóviles sigue a una distribución
Weibull con una tasa de falla A(t) = 1/√ t. Siendo así, encontrar las siguientes
probabilidades:
(a) La probabilidad de que la refacción en cuestión se deteriore antes de 4 años.
(b) La probabilidad de que la refacción no se desgaste después de 4 años.
5.77. Una batería solar tiene una vida promedio que está exponencialmente
distribuida con un promedio de vida de 10 horas. Usando cálculo integral, determinar
(a) La mediana de las vidas de las baterías. (6.93 horas)
(b) La probabilidad de que la vida de una batería esté entre 8 y 12 horas. (0.148
horas)
(c) La probabilidad de que la vida de una batería excederá 15 horas. (0.777 horas)
(d) La probabilidad de que la vida de una batería solar esté entre 60 y 120 minutos.
5.78. Decir cuál de las siguientes afirmaciones es correcta:
(a) A medida que el tamaño de la muestra, n disminuye y la desviación estándar, s
aumenta, el valor de la probabilidad, p disminuye.
5-112
(b) A medida que n disminuye y s disminuye, el valor del error estándar aumenta y,
por lo tanto, el valor de p disminuye.
(c) A medida que n aumenta y las técnicas del laboratorio se refinan causando una
varianza pequeña, el error estándar del promedio baja y, por consiguiente, el valor
de p aumenta y la hipótesis nula se rechaza.
(d) A medida que el error estándar del promedio disminuye por tamaños de
muestra grandes, con pequeñas variaciones, esto conlleva a un valor pequeño de p
mucho muy significante, lo cual nos lleva a retener la hipótesis nula.
(e) A medida que la varianza disminuye, con n constante, el valor de p disminuye y
la hipótesis nula se rechaza.
(f) A medida que n aumenta y las técnicas del laboratorio se refinan causando una
varianza pequeña, el error estándar baja y, por consiguiente, el valor de p
disminuye y se retiene Ho:
(g) A medida que n aumenta y las técnicas del laboratorio se refinan causando una
varianza pequeña, el error estándar baja y, por consiguiente, el valor de p
disminuye y se acepta HA:
(h) los incisos (d), (e) y (f) son correctos
(i) Los incisos (e) y (g) son correctos
5.79. Actualmente, hay mucho debate, por saber si las emisiones de campos
electromagnéticos producidos por teléfonos móviles (celulares) y sus estaciones de
antenas base puedan estar afectando la salud. Con más de 500 millones de
teléfonos móviles en todo el mundo, de acuerdo a al artículo Examining the effects
of electromagnetic fields emitted by GSM mobile phones on human event-related
potentials and performance during an auditory task publicado en Clinical
Neurophysiology 115 (204) 171- 178 (http://www.wow-com.com/industry/stats),
5-113
el desmesurado incremento del uso de la telefonía celular y sus consiguientes

efectos en las funciones cognitivas y fisiológicas debido a las radiaciones
electromagnéticas (RE), es una situación que está causando preocupación entre las
personas conocedoras de este problema. Se han hecho muchas investigaciones con
relación a los efectos en la salud producidos por la radiación de microondas
debidas a la proximidad de los teléfonos celulares a la cabeza del usuario y de la
proximidad a las estaciones de antenas base de telefonía celular, a estaciones
eléctricas, a líneas de de alta tensión, hornos de microondas, etc. La mayoría de
estas investigaciones coinciden en que los efectos de estos tipos de RE están
afectando el cerebro y al sistema nervioso en mayor o menor grado. Hay estudios
que han relacionado las emisiones electromagnéticas con casos de cáncer en el
cerebro, efectos en la actividad enzimática y espermática, efectos visuales y
auditorios, prevalecía de dolores de cabeza entre los usuarios de teléfonos móviles,
problemas con el sueño, efectos en las células linfáticas humanas, mutaciones, etc.,
de las personas expuestas. En cuanto a la proximidad de las antenas base de
telefonía móvil, y sus efectos en la salud, algunos países han estipulado, como un
criterio seguro, el establecimiento de las antenas de microondas a distancias
mínimas de 600 metros de complejos habitacionales. Siendo así, se diseña un
ejemplo hipotético relacionado con las mediciones de radiación electromagnética y
la proximidad a la fuente emisora, es decir, de mediciones a diferentes distancias
de las antenas base de telefonía celular. Para este ejemplo, en particular, se calculan
los promedios de una muestra de 30 mediciones de radiación electromagnética,
para cada una de las siguientes distancias: 25, 50, 100, 200, 300, 400, 500 y 600
metros de la antena base de teléfonos móviles. Los promedios de la radiación
electromagnética para cada distancia son: 950 MHz, 800 MHz, 550 MHz, 400
5-114
MHz, 195 MHz, 80,000 Hz, 30,000 Hz y 500 Hz, respectivamente. Sus respectivas
desviaciones estándares fueron 50 MHz, 40 MHz, 35 MHz, 80 MHz, 100 MHz,
20,000 Hz, 10,000 Hz y 100 Hz. El estudio se llevó a cabo durante todo un año, en
un esfuerzo por evaluar variables, como la distancia, la altura, época del año,
factores meteorológicos (como temperatura, presión atmosférica, intensidad y
dirección del viento, humedad relativa), contaminación del aire por partículas y
gases, etc., que pudieran afectar el poder de la densidad de la radiación
electromagnética emitida. Para resolver este problema estimar el modelo
matemático que mejor ajuste los datos. Una vez que se evalúe el modelo
acordemente, predecir la radiación de microondas a una distancia de 10 y 1000
metros de la antena base. Si hubiese valores atípicos extremos, enlistar tres
posibles factores que puedan explicar estas situaciones.
5-115
CAPITULO 6
Distribuciones de t de Estudiante, JI cuadrada y F
Propiedades de la distribución de t de Estudiante.- Intervalos de confianza para
el promedio poblacional µ.- Prueba de hipótesis para µ.- Prueba de t pareada
para detectar diferencias entre dos tratamientos.- Prueba de t para probar la
hipótesis de dos promedios, cuando las varianzas son iguales.- Prueba de t para
probar la hipótesis de dos promedios cuando las varianzas son desiguales.-
Mecanismos para calcular el valor de p cuando se hacen pruebas de hipótesis no
tradicionales.- Intervalos de confianza y pruebas de hipótesis con la JI cuadrada,
(χ2).- Aplicación de la JI cuadrada en cuanto a la prueba de bondad de ajuste
comparando las frecuencias observadas y las frecuencias teóricas.- Distribución
F y su aplicación en la comparación de varianzas muestrales.-
Aquí, discutiremos la distribución de t de Estudiante, que está relacionada con la
teoría de muestreo pequeño. También, discutiremos la distribución de JI cuadrada y
la distribución de F.
En los capítulos anteriores hicimos hincapié de que, para muestras que fueran
≥ 30 casos, se usa la distribución normal. Sin embargo, para muestras menores que
30 observaciones se usa lo que se llama teoría de muestreo pequeño, que está
relacionada con la distribución de t de Estudiante, con la JI cuadrada o con la
distribución F. La distribución de t se nombró después de W.S. Gosset, quien usó el
seudónimo de estudiante.
Por ejemplo, cuando usamos la distribución normal siempre se conoce el valor
de σ, el tamaño de la muestra es > 30 y se sabe que la distribución muestreada es
normal. Pero cuando usamos la distribución de t de Estudiante, no se conoce σ y el
tamaño de la muestra es menor que 30 casos, sin saber si la distribución muestreada
6-1
es normal o no. Estas situaciones se explican usando las fórmulas de la distribución

normal y la de t de Estudiante.
Del Capítulo 5, ya sabemos que, para aplicar la distribución normal se usa la
variable aleatoria normal estandarizada z, dada como z = ( X - µ) / σ/√n. Sin
embargo, esta función tiene un uso limitado, porque la varianza σ2 de la población
rara vez se conoce y porque la población muestreada debe ser normal o
aproximadamente normal. La distribución de t de Estudiante no tiene esta limitación,
porque aún, para muestras de n < 30 casos, se asume que σ = s. Así sustituyendo el
valor de σ por s la función de t de Estudiante nos da:
t = ( X - µ) / s/√n (6-1)
Donde:
X = promedio muestral
µ = promedio poblacional que se quiere probar
s = desviación estándar muestral
s/√ n = error estándar del promedio
Propiedades de la distribución de t de Estudiante
La distribución de t de Estudiante es una familia de distribuciones, cada una
caracterizada por el número de grados de libertad ν. Es similar a la distribución de z
normal, con promedio igual a cero y es simétrica en forma de campana. Su forma
depende en el tamaño de la muestra. Con tamaños de muestras pequeñas, la forma de
esta curva es menos picuda que la normal, pero a medida que n llega a 30 casos o se
va a infinito, s2 se aproxima a σ2 y la t de Estudiante se aproxima a la distribución
normal. La gráfica de abajo muestra la distribución de t de Estudiante, con diferentes
grados de libertad.
6-2
Figura 6.0. Gráfica mostrando familias de curvas de la distribución de t de Estudiante

con diferentes grados de libertad ν, demostrando cómo, a medida que ν → ∞, la
distribución t se aproxima a la distribución normal.
Diferencias entre la distribución de t de Estudiante y la distribución normal

La distribución de t se usa en lugar de la distribución normal, cuando el tamaño de la
muestra es menor que 30 casos. Cuando hablamos de la distribución normal, ésta
requiere que la muestra sea de n ≥ 30 observaciones o que, la poblacional muestreada
sea normal. Este tamaño de muestra se considera como una muestra grande. Pero
cuando la muestra de casos es n < 30 observaciones, no se puede usar la curva normal
y tenemos que usar lo que se llama "teoría de muestreo pequeño." Para tales efectos
se usa la distribución de t de Estudiante, la JI cuadrada o la distribución, F. La
estadística t se usa para comparar los promedios de dos distribuciones, mientras que la
prueba de F se usa para comparar las varianzas de dos distribuciones.
De hecho, las diferencias entre la distribución de t y la distribución normal son
que la distribución t no necesita el parámetro de población, σ, mientras que la normal
si lo requiere. Además, la función t no requiere de muestras grandes. Otrosí, la
6-3
varianza, σ2 > 1 y, solamente, cuando n → ∞ entonces, ambas distribuciones son

iguales (prácticamente, cuando n ≥ 30 casos).
Funciones usadas con la distribución de t de Estudiante
1. Se usa para hacer intervalos de confianza para µ.
2. Se usa para probar la hipótesis de que µ tiene un valor determinado, como por
ejemplo, Ho:µ = µo.
3. Se usa para probar diferencias entre dos tratamientos deliberadamente emparejados,
esto es, Ho:µ1 - µ2 = 0. Aquí, los tamaños de distribuciones deben ser iguales.
4. Se aplica para probar diferencias entre dos promedios usando el método de
selección completamente al azar (aleatorio), y con varianzas iguales. Aquí los
tamaños de las distribuciones pueden ser iguales o desiguales.
5. Se aplica para selecciones completamente aleatorias (al azar) con varianzas
desiguales. El tamaño del las distribuciones puede ser igual o desigual.
Aplicaciones de la distribución de t de Estudiante
Las aplicaciones de la t de Estudiante son varias. Por ejemplo, puede usarse para el
control de la calidad industrial. También es muy útil para el control de la calidad de
un sistema de tratamiento de aguas residuales en el campo de la ingeniería ambiental.
Por otra parte, otra aplicación muy importante de la t de Estudiante, es la
distribución pareada. Esto es, para comparar el promedio de dos distribuciones o
tratamientos, como, por ejemplo, para probar la hipótesis nula de Ho:µ1 = µ2, es decir,
que no hay diferencias entre los dos promedios. Aquí, pudiéramos estimar dos tipos
de análisis usando dos métodos y tratamientos, digamos de oxígeno disuelto (OD) o
la comparación de dos métodos en la ingeniería del agua como el método Winkler y
el de electrodos y ver si hay diferencias entre los dos métodos usando la prueba de t
apareadas. También se puede usar para comparar dos distribuciones seleccionadas,
6-4
aleatoriamente, y, con varianzas iguales o desiguales. Aquí, cabe notar que, si se trata
de comparar los promedios de más de 2 distribuciones, entonces se usa el análisis de
varianza simple o múltiple.
Descripción de las funciones usadas con la distribución de t de Estudiante
Estadística descriptiva:
n
Promedio: X = Σ Xi / n (6-2)
x=0
Varianza muestral: s2 = [∑ X 2 – (∑X)2 /n ] / n - 1 (6-3)

Desviación estándar: s = √ s2 (6-3a)
Intervalos de confianza para el promedio poblacional µ:
Prob{ X - t[1 - α/2;ν] s/√n < µ < X + t[1 - α/2;ν} s/√n} = 1 - α (6-4)
Donde:
t[1–α/2;ν] = valor porcentual de t con un nivel de significancia α, con ν grados de
libertad
s = desviación estándar
s/√ n = error estándar del promedio
Prueba de hipótesis para el promedio poblacional µ
t = ( X – µo) / s/√ n (6-5)
Donde:
µo = promedio poblacional que se desea probar
s = desviación estándar de la muestra
6-5
Prueba de t para observaciones pares, para detectar diferencias entre dos

tratamientos
t = ( D - µ d ) / (s d /√n) (6-6)
Donde:
D = Promedio de la muestra de las diferencias de las observaciones del par de
distribuciones
s d = Desviación estándar de las diferencias de las observaciones del par de
distribuciones
n = número de observaciones
µd = 0
Prueba de hipótesis para la diferencia entre dos promedios poblacionales. Esta
función también aplica cuando las varianzas de las dos distribuciones son iguales
y normales.
( X 1 - X 2) - (µ1 - µ2)
t = ──────────────────────── (6-7)
s2p (1/n1 + 1/n2)
Donde:
X 1, X 2 = promedios aritméticos de las dos distribuciones
n1, n2 = tamaños de las dos muestras
µ1, µ2 = parámetros de población uno y dos a estimarse
s2p = (ν1 s12 + ν2 s22) / (ν1 + ν2)
Donde:
s2p = la varianza combinada de las dos muestras
ν1, ν2 = grados de libertad de muestras uno y dos
6-6
s12, s22 = varianzas de muestras uno y dos, respectivamente

Función de t para la misma situación que la función anterior, pero aplicándola
cuando las varianzas de las dos distribuciones son desiguales y asumiendo que
las poblaciones son normales
( X 1 - X 2) - (µ1 - µ2)
t = ────────────────────── (6-8)
√(s12 / n1) + (s22 / n2)
Para calcular los grados de libertad, se usa la fórmula:

ν = (s21/n1 + s22/n2)2 / [(s21/n1)2/n-1 + (s22/n2)2/n-1] (6-9)
Donde:
s21 y s22 = varianzas de las muestras uno y dos
n1 y n2 = tamaños de las muestras uno y dos
Nota importante: las diferencias entre las funciones de t (6-6), (6-7), y (6-8) se basan
en el método de la selección al azar que se sigue. Por ejemplo, en la función (6-6), el
método de selección en el emparejamiento de los pares de las observaciones de las
distribuciones es deliberado. Sin embargo, en el caso de las funciones (6-7) y (6-8),
con relación a la función (6-6), la selección es completamente aleatoria, sin hacer
emparejamientos. Además, las diferencias entre el uso de las funciones (6-6), (6-7), y
(6-8) es de que en el caso de la (6-6), el tamaño de las muestras pares debe de ser
igual. En contraste, las funciones (6-7) y (6-8) pueden usarse con tamaños de
muestras desiguales. También, con respecto a la uso de las funciones (6-7) y (6-8),
éstas están relacionadas con la condición de igualdad o desigualdad de las varianzas.
La función (6-7) requiere que las varianzas sean iguales y la función (6-8) no. Ahora
bien, para hacer un decisión sobre cual de las dos funciones, (6-7) o (6-8) se vaya a
6-7
usar, la manera de saber si las varianzas son iguales o desiguales, se puede deducir
haciendo una prueba de igualdad de varianzas con la distribución F, esto es, usando la
función de F = s21 /s22.
Tipos de criterios que se siguen para establecer las pruebas de hipótesis
(análogos a los de la distribución normal)
1. La hipótesis nula se puede hacer como: Ho:µ = µo. Bajo estas condiciones de
igualdad, las hipótesis alternativas son:
H1:µ ≠ µo, H2:µ < µo y H3:µ > µo. Donde µo es el promedio poblacional que se quiere
probar. Aquí, cabe notar que en este caso, la prueba de hipótesis es bilateral o de dos
colas.
2. También la hipótesis nula se puede hacer como: Ho:µ ≥ µo. En este caso, la
hipótesis alternativa es Ho:µ < µo. Aquí, la prueba de hipótesis es unilateral izquierda.
3. Igualmente, la hipótesis nula se puede hacer como: Ho:µ ≤ µo. En este caso la
hipótesis alternativa es H1:µ > µo. Aquí, la prueba de hipótesis es unilateral derecha.
4. Seleccionar un nivel de significación de tamaño α, esto es, α = .05 o α = .01 con sus
respectivos niveles de confianza de 95% y 99%. También, se pueden usar otros
niveles de significación, como el .10, .20, etc., pero los más comunes son los de 0.05
y .01.
5. Seleccionar la estadística apropiada (por ejemplo, si n > 30 casos se usa la
distribución z. Si la muestra es n < 30 casos y la población muestreada no es normal
se usa la distribución de t de Estudiante, la distribución de Ji cuadrada, la distribución
F, etc.
6. Se establecen las regiones críticas usando niveles de confianza del 95%, 99%, 90%,
80% etc. (95% y 99% los más comunes)
7. Se estima el valor de la prueba de estadística de la muestra y se compara con el
6-8
valor de la estadística calculada, es decir, zcalc. o tcalc. (De las regiones críticas) y se
comparan con ztab. o ttab. Si la estadística calculada es mayor que la estadística tabulada
(de las regiones críticas) se rechaza la hipótesis nula). De otra manera, se acepta la
hipótesis o no se hace ninguna decisión. De esta manera, si el valor de la estadística
calculada se mete en las regiones críticas se rechaza la hipótesis nula (o también si el
valor de p es menor o igual al nivel de significación, α deseado).
Nota: Aquí es importante recordar que, la prueba de hipótesis nula estadística se
diseñó el siglo antepasado. En tiempos modernos de la era cibernética, existe la
prueba no tradicional relacionada con el valor de la probabilidad p. También es
importante notar que muchos programas de computadora dan únicamente el valor de
p y el investigador tiene que interpretarlo acordemente.
Mecanismos que se siguen para calcular el valor de la probabilidad p usando las
tablas de las distribuciones de t de Estudiante, la JI cuadrada o la distribución F
Aquí, para calcular el valor de la probabilidad p se puede hacer usando la función t es
decir, haciendo interpolaciones aplicando una fórmula empírica diseñada por el autor
de este libro, el Dr. Héctor Quevedo Urías y auxiliado por la Dra. Socorro Arteaga.
(λ2 – λ1) / (t2 – t1) = (λ2 - X) / (t2 – tcalc.) (6-10)
Donde:
λ2 = el nivel de confianza más alto de la tabla de la t de Estudiante
λ1 = el nivel de confianza más bajo de la tabla de la distribución de t
t1 = la probabilidad correspondiente a λ1
t2 = la probabilidad correspondiente a λ2
X = valor desconocido de λ
tcalc.= valor de la estadística de la distribución de t, con el nivel significante deseado,
e.g., α = .05 o α = .01
6-9
Donde: (n - 1) = ν = grados de libertad

Nota: si se usa la distribución de JI cuadrada o la de Fisher, únicamente se substituye t
por χ2 o por F, respectivamente.
Ejemplo #1. Supongamos que queremos hacer la prueba de hipótesis no tradicional
con la función t, es decir, usando el valor de la probabilidad p. Entonces, si el valor de
la tcalc. = 2.83 con 4 grados de libertad, con α = 0.05 para Ho:µ = µo buscamos el valor
de 2.83 en la tabla, pero no lo encontramos. Sin embargo, vemos que está entre 2.776
y 3.747, con sus respectivos valores de λ de .99 y .975. Entonces para encontrar X,
procedemos usando la fórmula (6-10) de arriba, donde los valores correspondientes
son:
λ2 = .99, λ1 = .975, t2 = 3.747, t1 = 2.776, tcalc. = 2.83.
Ahora, sustituyendo estos valores en la fórmula de interpolación y sustituyendo:
((λ2 - λ1) / (t2 – t1) = (λ2 – X) / (t2 – tcalc.)
(.99 - .975) / (3.747 – 2.776) = (.99 – X) / (3.747 – 2.83)
Resolviendo por X da X = 0.976. Por lo tanto, p = 1 – 0.976 = 0.024, pero como son
dos colas, entonces, multiplicamos ese valor por 2 y da p = .048.
6-10
Ejemplo #2. Se saca una muestra aleatoria de 8 observaciones de pH cuyos valores

son: 5, 4, 6, 5, 4, 6, 5, 5. Probar la hipótesis nula de que el valor esperado del pH es de
cuando menos 6.5 usando α = 0.05. Calcular el valor de la probabilidad p.
Solución:
1. La hipótesis nula es Ho:µ ≥ 6.5; y la hipótesis alternativa es H1:µ < 6.5. Esto dice
que la prueba es unilateral izquierda.
2. Usamos la estadística: t = ( X – µo) / s/√ n
= (5.0 – 6.5) / 0.756/√ 8
= - 5.6
3. La región crítica izquierda es t[α;ν] = t[0.05;7] = - 1.895
4. Debido a que tcalc.= - 5.6 < ttab. = - 1.895, se rechaza la hipótesis y nos inclinamos
por la hipótesis alternativa.
5. El valor de la probabilidad p se calcula buscando |-5.6| con ν = 7 en la tabla de la
distribución t y se sustituyen los valores de λ2 = .99975, t2 = 7.885, λ1 = .9995 t1 =
5.408 y tcalc. = -5.61 en la fórmula de interpolación y resolviendo por la variable X da:
(.99975 - .9995)/(7.885 – 5.408) = (.99975 – X)/(7.8885 – 5.6)
El valor de la probabilidad es p = 0.00048, el cual es mucho, muy significante
Ejemplo #3. Un fabricante de cigarrillos afirma qué, el promedio de nicotina de sus
productos es de cuando mucho 5 miligramos por cigarrillo fumado. Para comprobar
esta aseveración, se sacó una muestra aleatoria de 25 cigarrillos y se encontró un
promedio estadístico de X = 5.5 miligramos de nicotina por cigarro fumado, con una
desviación estándar de s = 0.5. Probar la aseveración del fabricante que el verdadero
promedio es de a lo más 5 miligramos por cigarrillo fumado. Asumir un
6-11
valor significante de α = 0.05.

Solución:
1. La prueba de hipótesis nula es: Ho:µ ≤ 5.0. La prueba de hipótesis alternativa es: y
H1:µ > 5.0.
2. La región crítica es t0.05;24 = 1.711.
3. Usando la función de t y sustituyendo los valores da:
t = (5.5 – 5.0) / 0.5/5 = 5.0
4. Debido a que 5.0 > 1.711 se rechaza la hipótesis nula.
5. No obstante, esta prueba de hipótesis tradicional no da una idea de la fuerza de
convicción de que la decisión tomada es, en verdad, correcta. Sin embargo, usando la
prueba de hipótesis no tradicional del valor de p, este valor si determina, qué tan
verosímil es muestrear un valor del parámetro que sea igual o menor que X = 5.5,
cuando µ = 5.0.
6. El valor calculado de p es de aproximadamente .00002.
Ejemplo #4. Se dan los siguientes datos de una muestra aleatoria de 15 mediciones de
partículas atmosféricas en ppm: 33.38, 32.15, 33.99, 34.10, 33.97, 34.34, 33.95,
33.85, 34.23, 32.73, 33.46, 34.13, 34.45, 34.19, 34.05. Hacer los siguientes cálculos
de estadística descriptiva.
(a) Estimar el tamaño de la muestra n
~
(b) Estimar el promedio X , la mediana X y la moda X̂
(c) Estimar la varianza y la desviación estándar muestrales
(d) El valor máximo, mínimo, el rango y el error estándar
(e) El sesgo
(f) El número de grados de libertad, ν
6-12
(g) El intervalo de confianza del 95%, es decir, el nivel de significancia de α = .05)

para el promedio poblacional µ.
También, hacer los siguientes cálculos de estadística de inferencia:
(a) Probar la hipótesis nula de Ho:µ = 34.5 contra la hipótesis alternativa de H1:µ ≠
34.5. Calcular el valor de la probabilidad p.
(b) Probar la hipótesis de Ho:µ ≥ 34.5 contra la hipótesis alternativa de H1: µ < 34.5.
Calcular el valor de p.
(c) Probar la hipótesis nula de Ho:µ ≤ 33.2 contra H1:µ > 33.2.
(d) Calcular el valor de la probabilidad p
Solución:
Los cálculos de la estadística descriptiva son:
(a) El tamaño de la muestra es n = 15
(b) El promedio aritmético, la mediana y la moda son:
X = ΣX / n = (33.38 + 32.15 +...+ 34.05)/15 = 33.8
La mediana es: 33.99. La moda no existe.
(c) La varianza = s2 = [ΣX 2 – (ΣX) 2/n]/n-1
= [17,125.76 – (506.76)2/15] / 15-1
= 0.38
La desviación estándar = s = √ s2 = √0.38 = 0.62
(d) El valor máximo, mínimo y el rango son:
Valor máximo = 34.45. Valor mínimo = 32.15
Rango = valor máximo – valor mínimo = 2.3
El error estándar del promedio es:
Error estándar = σ/√ n = 0.62/√ 15 = 0.16
6-13
(e) El sesgo denota la simetría de la distribución y en este caso es de 2.55, el cual

comparado con el sesgo de la distribución normal estandarizada, que es de 0, indica
que la distribución de los datos es oblicua a la derecha o con sesgo positivo.
(f) El número de grados de libertad son: ν = n – 1 = 15 – 1 = 14
(g) El intervalo de confianza del 95% o α = .05, corresponde a los valores críticos de
±2.145, con ν = 14 grados de libertad.
X – t[1-α/2;ν] (s/√ n) < µ < X + t[1-α/2;ν] (s/√ n)
33.8 – t[.975;14] (0.16) < µ < 33.8 + t[.975;14] (0.16)
33.8 - 2.145 (0.16) < µ < 33.8 + 2.145 (0.16)
33.45 < µ < 34.15
Los cálculos de la estadística de inferencia son:
(a) Esta es una prueba de hipótesis bilateral con regiones críticas de ttab. = t[.975;14] =
±2.145 con 14 grados de libertad, con un nivel de significancia de α = .05 (de la tabla
de la distribución de t). La estadística usada es la función t de abajo:
tcalc. = ( X - µo) / s/√ n
= (33.8 – 34.5) / 0.63/√ 15
= - 4.3
Ahora se compara la t calculada con la t tabulada, es decir, con los valores críticos. El
criterio que se sigue es de que si la t calculada se introduce en las regiones críticas,
entonces, se rechaza la hipótesis sustentada de que Ho:µ = 34.5 y se inclina por la
hipótesis alternativa. En conclusión vemos que – 4.3 < - 2.145, es decir, se introduce
en el extremo izquierdo de la curva. El valor de la probabilidad p se calcula usando la
fórmula de interpolación (6-10) :
(λ2 – λ1)/(t2 – t1) = (λ2 – X) / (t2 – tcalc.)
6-14
Donde:
λ2 = .99975, t2 = 4.499, λ1 = .9995, t1 = 4.14, tcalc. = -4.3 (aquí en este caso, se toma
el valor absoluto), X igual a valor buscado el cual corresponden a la interpolación
de t = -4.3 con ν = 14 g.l.
Sustituyendo los valores en la fórmula de arriba da:
(.99975 – .9995)/(4.499 – 4.14) = (.99999 - X)/(4.499 – 4.3)
X = 0.99987 y el valor de p es p = 2(1 - .99999) = 0.00002. Este valor es mucho muy
significativo y apoya, muy contundentemente, la contención de que el promedio no es
mayor que 34.5.
(b) Probando la hipótesis nula de Ho:µ ≥ 34.5 contra H1:µ < 34.5
La t calculada es la misma que en la parte (a), es decir, - 4.3. Esta es una prueba
unilateral izquierda con α = 0.5 con el valor porcentual de t.95;14 = - 1.761 o sea que la
región crítica izquierda es – 1.761 (de la tabla de la distribución de t). Para hacer una
decisión de rechazar o de aceptar Ho: se compara el valor de t.95;14 = – 1.761 con tcalc. =
– 4.3 y vemos, nuevamente, que se introduce en el extremo izquierdo de la
distribución, por lo tanto, se rechaza la hipótesis. El valor de la probabilidad p se
calcula buscando el valor absoluto de |-4.3| en la tabla con α = 0.05 y vemos que está
entre 4.499 y 4.14 con sus respectivos valores de λ igual a .99975 y .9995. Es decir
que el valor de p está entre .00025 < p < .0005, con un valor de p ≈ .0002.
(c) Para probar la hipótesis de Ho:µ ≤ 33.2 contra la hipótesis alternativa de H1:µ >
33.2, se usa la estadística de t de Estudiante, es decir:
t = (33.8 – 33.2)/0.63/3.87 = 3.68
La región crítica derecha es t.95;14 = 1.76 y vemos que 3.68 es mayor que este valor y
se rechaza la hipótesis nula. Bajo estas condiciones, el valor de la probabilidad p es
0.001.
6-15
Ejemplo #5. Un fabricante de llantas afirma qué, la vida promedio de cierto tipo de
neumático, es mayor que 25,000 kilómetros, bajo condiciones normales de manejo y,
para vehículos de cierto peso. Para esto, se saca una muestra aleatoria de 15 llantas y
se calcula un promedio aritmético y una desviación estándar de 27,000 y 3,000,
kilómetros, respectivamente. Asumir que α = 0.05 y que la población de llantas está
normalmente distribuida ¿Se puede concluir de esta información que la contención
del fabricante de llantas es legítima? Para resolver este problema hacer lo siguiente:
(a) Establecer las pruebas de hipótesis nula y alternativa
(b) Establecer la(s) región(es) crítica(s)
(c) Calcular el valor de la estadística
(d) Calcular y graficar el valor de p.
Solución:
(a) El problema está preguntando si se puede concluir que µ es mayor que 25,000
kilómetros. Por lo tanto, una afirmación de este efecto deberá ir en la prueba de
hipótesis alternativa. Las hipótesis apropiadas son:
Ho:µ ≤ 25,000 y H1:µ > 25,000
(b) La región crítica con α = 0.05 es: t0.95;14 = 1.7613
(c) El valor calculado de la estadística t con X = 27,000, error estándar = 774.61, n =
15 y µo = 25,000 es:
t = (27,000 – 25,000) / 3000/√15
= 2.58
(d) Para encontrar el valor de la probabilidad p se procede de la siguiente manera: Se
busca t = 2.58 en la tabla de la distribución de t con ν = 14 grados de libertad, y
vemos que este valor está entre 2.624 y 2.1448, con sus respectivos percentiles de
0.10 y 0.025. De esta manera, si la hipótesis nula Ho: es cierta, entonces, la
6-16
probabilidad de obtener un valor de t tan grande o más grande que 2.1448 es 0.025.
Similarmente, la probabilidad de obtener un valor tan grande o más grande que 2.624
es de 0.10. Por lo tanto, si Ho: es verdadera, la probabilidad de obtener un valor de t
tan grande o más grande que t = 2.58 está entre 0.010 y 0.025, es decir, 0.10 < p <
0.025. Las figuras de abajo muestran esta situación.
Figura 6.1. Figuras (a) y (b) mostrando el intervalo de la probabilidad p y el valor de

la probabilidad p, respectivamente.
Ejemplo #6. Para probar la eficiencia de una planta de tratamiento lodos activados se
midió la concentración del DBO5 en la entrada y en el efluente (salida). Se requiere
saber qué tan eficiente es este sistema de tratamiento del drenaje.
6-17
TABLA 6.0. Tabla mostrando las concentraciones de DBO. (Elaboración propia)

Concentraciones de Concentraciones de Diferencias de las
DBO en la entrada DBO en el efluente concentraciones
(mg/L) (mg/L) (mg/L)
170.5 140.4 30.1
207.4 174.7 32.7
215.9 170.2 45.7
209.0 174.6 34.4
171.6 154.6 17.0
201.2 185.0 16.2
209.9 118.9 91.0
213.3 169.8 43.5
184.1 174.7 9.4
220.4 176.7 43.7
__________________________________________________________________
Solución:
Usando los valores de la TABLA 6.0 sacamos las diferencias entre las
concentraciones en la entrada y en el efluente. Esto se muestra en la tercera columna
de la tabla. Una vez hecho esto, se calcula el promedio aritmético de las diferencias
(que es igual a D ) y la desviación estándar (que es igual sd), el error estándar, etc.
1. Usando un paquete de computadora se calcula el valor del promedio D = X =
36.37, la desviación estándar que es igual a sd = 22.95, n = 10, error estándar = 7.26
2. La prueba de hipótesis nula es de Ho:µ = 0 o sea que no hay diferencias entre el
6-18
DBO de la entrada y del efluente. La hipótesis alternativa es H1:µ ≠ 0.

3. El nivel de significancia es α = 0.05. La región crítica es del extremo derecho y es
igual a t.95;9 = 2.262, es decir, con 9 grados de libertad.
4. Se usa la función (6-6) para emparejamiento deliberado, y sustituyendo los valores
da:
t = ( D – µo) / sd/√ n
t = (36.37 – 0)/7.26
= 5.01
5. Al comparar el valor de tcalc. = 5.01 con el valor de la t crítica de t.95;9 = 2.262, se
rechaza la hipótesis nula y decimos que sí hay diferencias entre las concentraciones de
la entrada y de la salida del drenaje.
6. Para calcular el valor de la probabilidad p usamos la fórmula de interpolación. Para
esto buscamos 5.01 en la tabla de la t de Estudiante y vemos que está entre los valores
porcentuales de λ2 = .99975 con t2 = 5.291 y λ1 = .9995 con t1 = 4.781. Ahora usando
la fórmula de interpolación y sustituyendo todos los valores da:
(.99975 - .9995)/(5.291 – 4.781) = (.99975 – X)/(5.291 – 5.01)
Resolviendo por X da X = .9996, por lo tanto, p = 1 - .9996 = .00039.
Este valor de p es mucho muy significante y apoya, en forma muy contundente, la
decisión de haber rechazado la hipótesis, de que no hay diferencias entre las
concentraciones de la entrada a la planta y de la salida.
6. En conclusión rechazamos la hipótesis Ho:µ = 0, esto es, de que no hay diferencias
entre las concentraciones de la entrada y del efluente (en verdad si hay mucha
diferencia, al juzgar por el valor de la probabilidad p).
6-19
Ejemplo #7. Este es un ejemplo de ingeniería ambiental (ingeniería sanitaria)

relacionado con el uso de la distribución t, cuando las varianzas de las distribuciones
son desiguales, asumiendo que las poblaciones son normales. Aplicando este
concepto, en un estudio se sabe que, el deterioro de muchas redes de tubería
municipal de agua y drenaje en todo el país es un asunto que preocupa cada vez más a
las autoridades. Unas de las tecnologías propuestas para la rehabilitación de las
tuberías consisten en usar un forro flexible alrededor del tubo existente. El artículo
“Effect of Welding on a High Density Polyethylene Liner” (J. of Materials in Civil
Engineering, 1996, pp. 94-100), informa los datos siguientes de resistencia a la
tensión, en lbs/in2 (psi), o sea libras por pulgada cuadrada, de especimenes de forro,
tanto en el caso en que cierto proceso de fusión se usa, como cuando no se usa. La
tabla de abajo da los datos crudos y procesados. Usar α = .05. Para esto hacer los
siguientes cálculos:
(a) Establecer la prueba de hipótesis nula y la prueba de hipótesis alternativa. Esto es,
haciendo una prueba de hipótesis nula de que no hay diferencias en las resistencias a
la tensión para los dos tratamientos.
(b) Establecer la región crítica.
(c) Usar la estadística más apropiada para elaborar este problema.
(d) Hacer una decisión estadística usando el criterio tradicional, es decir, de rechazar
o de retener la hipótesis nula.
(e) Hacer una prueba de hipótesis no tradicional, es decir, calculando el valor del nivel
de p.
6-20
TABLA 6.1. Tabla mostrando los datos del problema. (Elaboración propia)
Sin fusión (en libras por pulgada cuadrada)
2748 2700 2655 2822 2511 3149 3257 3213 3220 2753
2
n1 = 10 X 1 = 2902.8 s1 = 277.2 s 1 = 76,875.99
__________________________________________________________________
Con fusión (en libras por pulgada cuadrada)
3027 3356 3359 3297 3125 2910 2889 2902
n2 = 8 X 2 = 3108.1 s2 = 205.9 s22 = 42382.41.
__________________________________________________________________
Solución:
(a) La prueba de hipótesis nula es: Ho:µ = 0 o sea que no hay diferencias entre las
tensiones, para los dos tratamientos.
Las pruebas de hipótesis alternativas son H1:µ > 0 y H2:µ < 0.
(b) La región crítica es unilateral izquierda es igual a -1.75
(c) Se usa la función estadística de t para varianzas desiguales. Es decir, cuando se
usan dos muestras aleatorias independientes de poblaciones normales, con varianzas
desiguales. Esta estadística de la función de t, algunas veces se llama prueba de
Smith-Satterthwaaie abajo mostrada. (Miller et al. 1976, p. 261)
Sustituyendo los valores en la ecuación (6-7) da:
3108.10 – 2925.33
t = ————————————
√(277.3)2/10 + (205.9)2/8
= - 1.86
6-21
Ahora, usando la fórmula de los grados de libertad, relacionada con la función de t

que tiene varianzas desiguales (Li, 1964), es decir:
(s21/n1 + s22/n2)2
ν = ————————————————— (6-11)
[(s21/n1)2/(n1-1)] + [s22/n2)2/(n2-1)]
Y sustituyendo todos los valores de: s21 = 76,875.96, n1 = 10, s22 = 42,382.41, n2 = 8
da:
[(76,875.96)/(10) + 42,382.41/(8)]2
ν = —————————————————
[(76,875.96)/10)2/9) + (42,382.41/8)2/7]
= 16 grados de libertad
(d) Conclusión: se rechaza la prueba de hipótesis nula de no diferencias en las
resistencias a la tensión debido a que el valor de la estadística t = -1.86 es menor que
la región crítica izquierda de -1.75.
(e) Para hacer la prueba de hipótesis no tradicional se busca el valor absoluto de la t
calculada, es decir, |-1.86| en la tabla de la distribución de t de Estudiante con 16
grados de libertad y vemos que los valores percentiles son de 0.025 y 0.05 con sus
puntos porcentuales de 1.746 y 2.120. Entonces, el razonamiento que se sigue para
calcular el valor de p es como sigue. Si Ho: es verdadera, la probabilidad de obtener
un valor de t tan grande o más grande que 1.746 es 0.025. Además, la probabilidad de
obtener un valor tan grande o más grande que 2.120 es de 0.05. Por lo tanto, si Ho: es
verdadera, la probabilidad de obtener un valor tan grande o más grande que el valor
de -1.86 está entre 0.025 y .05. Para esta prueba en particular, 0.05 > p > 0.025.
Ejemplo #8. Supóngase que se saca una muestra de 8 mediciones de nitratos (NO3-) y
se calcula un valor de t = - 3.62, con un nivel de significancia de α = 0.05. Probar la
6-22
hipótesis nula de Ho:µ = 32.0. Calcular el valor de la probabilidad p.

Solución:
Aquí la prueba es bilateral. Las regiones críticas son de t[.05;7] = 2.365. El valor de la t
calculada es de t = -3.62. Se usa la función de P para dos colas dada como:
P = P(t.025 < -|t|) + P(t.025 > |t|) (6-12)
2. Estamos buscando la probabilidad de sacar un valor de t que exceda 3.62 con ν = 7
grados de libertad, pero vemos que este valor no está en la tabla de la distribución t.
Entonces tenemos que interpolar este valor y lo buscamos en la tabla y vemos que
está entre λ2 = .9975 con t2 = 4.029 y λ1 = .995 con t1 = 3.499. Además, sabemos que
t[.05;7] = -2.375 (porque es de la cola izquierda). Ahora se sustituyen todos estos
valores en la fórmula de interpolación (5-27) recapitulada abajo:
P = (λ2 – λ1) / (t2 – t1) = (λ2 – X) / (t2 – tcalc.)
Enseguida sustituyendo los valores de arriba da:
p = [(.9975 - .995)/(4.029 – 3.499) = (.9975 – X)/(4.029 – 3.62)]
= (.0025)/(0.53) = (.9975 – X)/(0.409)
= .99785.
La probabilidad p es 1 - .99785 = .002. Sin embargo, debido a que la prueba
involucra dos extremos, por lo tanto, el valor de la probabilidad p se multiplica por 2
para dar p = .0043. Este valor es mucho muy significativo. Las figuras de abajo
muestran esta situación.
6-23
Figura 6.2. Figuras mostrando las regiones críticas. (Elaboración propia)

La distribución de JI cuadrada (χ2)
La distribución de JI cuadrada está relacionada con la varianza. Esta distribución se
usa para hacer intervalos de confianza para la varianza poblacional y pruebas de
hipótesis para la varianza poblacional. Esta estadística de χ2 también se usa para
hacer pruebas de bondad de ajuste. Esto se hace para ver si los datos provienen de
una población que sigue alguna distribución especificada, como discreta o
continua, es decir, comparando los datos teóricos con los observados. Finalmente,
la JI cuadrada también se usa para hacer pruebas de independencia, etc.
La distribución de JI cuadrada está críticamente condicionada a muestreos de
poblaciones normales, porque de otra manera puede conducir a errores muy
grandes. Además, un tamaño de muestra grande, no garantiza una prueba confiable.
6-24
Propiedades de la distribución de JI cuadrada (χ2)

1. La distribución de JI cuadrada no es simétrica, como la distribución normal o la
distribución de t. Los valores de la JI cuadrada pueden ser de cero o positivos, pero
no negativos.
3. La distribución de JI cuadrada es una familia de curvas y hay una distribución
diferente para cada número de grados de libertad, ν. Pero, a medida que el número
de grados de libertad aumenta, la distribución de la JI cuadrada se aproxima a la
distribución normal.
Figura 6.3. Distribución de JI cuadrada (χ2) con varios grados de libertad, ν en

función f (χ2) = [(χ2)ν/(2-1) e-χ2/2] / {2ν/2 [ν - 2ν) / 2]!}. (Dunn et al. 1974)
Ejemplos para determinar las regiones críticas de la JI cuadrada usando los

valores porcentuales de χ2p y de χ2[λ,ν].
Ejemplo #9. Encontrar los valores críticos de χ2 que determinen las regiones
críticas que contengan un área de 0.025 en cada cola. Asumir que n = 10, por lo
tanto, los grados de libertad son de ν = 10 – 1 = 9.
Solución:
6-25
La figura de abajo muestra una prueba bilateral. Para encontrar el valor crítico
izquierdo, se refiere a la tabla de la JI cuadrada y se busca ν = 9 en la columna
izquierda de la tabla y se va hasta la columna 0.975, porque el área total a la
derecha de este valor es 0.975 que lo sacamos restando 0.025 de 1 y nos da χ2 =
2.700. Similarmente, para la región crítica derecha, se localiza el valor de ν = 9 y
nos movemos hacia el valor de 0.025 y da χ2 = 19.023. La Figura 6.4 de abajo
muestra esta situación.
↑ ↑
χ20.975;9 = 2.70 χ20.025;9 = 19.023
Figura 6.4. Gráfica mostrando los valores críticos de la distribución, con un área de
0.025 en cada cola, con n = 10 y ν = n –1 = 10 – 1 = 9. Fuente: Triola (1995)
Por ejemplo, recapitulando el razonamiento anterior, de la Figura 6.4, se puede ver

que, para obtener el valor crítico o límite izquierdo de 2.70, hay que localizar 9 en
la columna izquierda de grados de libertad y luego localizar 0.975 arriba de la
tabla. El área total a la derecha de este valor crítico es 0.975, el cual se estima de 1
– 0.025. Similarmente, para obtener el valor crítico de 19.023, localizar 9 en la
columna de grados de libertad y luego localizar 0.025 arriba de la tabla.
6-26
Ejemplo #10. Encontrar los valores críticos de χ2 por los cuales el área del extremo
derecho de la distribución es de 0.05, si:
(a) ν = 15
(b) ν = 21
Solución:
(a) El valor de la cola derecha de la distribución de JI cuadrada se busca en la tabla
de esta distribución y es: χ2α;n-1 = χ2.05;16-1 = χ2.05;15 = 24.996
(b) El valor de la cola derecha es de χ2.05;21 = 32.7
Ejemplo #11. Para una distribución de JI cuadrada con 12 grados de libertad,
encontrar el valor de χ2 de tal manera que:
(a) El área a la derecha de χ2 es .05,
(b) El área a la izquierda de χ2 es .99
Solución:
(a) χ2.05;12 = 21.026
(b) χ2.01;12 = 26.22
Ejemplo #12. Encontrar los valores críticos de χ2 por los cuales el área a la derecha
de la distribución es de α = .01, si ν = 5:
Solución:
Si el área sombreada sobre la derecha es .010, el área a la izquierda de χ22 es .99 y
χ22 representa el 99avo percentil, χ2.99, el cual es igual a 15.1.
Intervalos de confianza y pruebas de hipótesis usando la distribución de JI
cuadrada χ2
El intervalo de confianza 1 – α para la varianza poblacional, σ2 se da como:
(n – 1) s2 / χ2[1-α/2;n-1] < σ2 < (n – 1)s2 / χ2[α/2;n-1] (6-14)
Ejemplo #13. Si una muestra aleatoria estadística de 17 mediciones tiene una
6-27
varianza de s2 = 196.38, encontrar el intervalo de confianza para σ2 usando los

niveles de confianza son de:
(a) α = 0.05
(b) α = 0.01
Solución:
(a) Se requiere la función P(χ21-α/2 < σ2 < χ2α/2) = 1 – α. Se calculan los límites
superiores e inferiores y luego se sustituyen los valores correspondientes.
Para el límite superior: χ2[1-α/2;n-1] = χ2[1-.05/2;17-1] = χ2.975;16 = 6.91
Para el límite inferior: χ2[α/2;n-1] = χ2.05/2;17-1 = χ2.025;16 = 28.8
Ahora, sustituyendo estos valores en la función (6-14) nos da:
(17 – 1)(196.38) / 6.91 < σ2 < (17 – 1)(196.38 / 28.8)
454.7 < σ2 < 109.1
La cual se simplifica a: 453.7 > σ2 > 109.1
(b) Para calcular los superiores e inferiores, con un nivel de significancia de 0.01 se
procede como sigue:
Para el límite inferior: χ2[α/2;n-1] = χ2[.01/217-1] = χ2.005;16 = 34.13
Para el límite superior: χ2[1-α/2;n-1] = χ2[1-.01/2;17-1] = χ2.995;16 = 5.14
Enseguida, usando la fórmula del intervalo y sustituyendo da:
(17 – 1)196.38 / 5.14 < σ2 < (17 – 1)196.38 / 34.13
Que se simplifica a:
92.06 < σ2 < 611.3
Este intervalo dice que estamos confiados en un 95% de que la varianza
poblacional está entre 92.06 y 611.3.
El intervalo de confianza para σ se calcula sacando la raíz cuadrada, lo cual
da (10.45, 21.32) y (9.59, 24.72), para α = .05 y α = .01, respectivamente.
6-28
Ejemplos de pruebas de hipótesis para la varianza usando la distribución de

la JI cuadrada, χ2 asumiendo que la población muestreada es normal
La función estadística usada para hacer pruebas de hipótesis para la varianza es la
función (6-15) descrita abajo:
χ2 = (n – 1)s2 / σ2 (6-15)
Donde:
χ2 = estadística de la distribución de la JI cuadrada
s2 = varianza muestral
σ2 = varianza poblacional (la dada en la hipótesis nula)
n = tamaño muestra
Ejemplo # 14. Un fabricante de medidores de CO afirma que la desviación estándar
poblacional de estos aparatos es menor que 3 ppt. Se saca una muestra aleatoria de
10 aparatos, y se calcula la desviación estándar muestral de 1.6. ¿Existe suficiente
evidencia con α = 0.05 para apoyar la contención del fabricante?
Solución:
1. Primeramente, debido a que ser requiere determinar si la desviación estándar es
menor o menos que 3 ppt, la prueba de hipótesis alternativa es H1:σ2 < 9. Por lo
tanto, la prueba de hipótesis nula debe ser Ho:σ2 = 9
2. La región de rechazo es χ2 < χ21-α;n-1 o sea χ2 < χ2.95;9 o sea χ2 < 3.33
3. La estadística a usarse es: χ2 = (n – 1)s2 / σ2
4. Los cálculos son: χ2 = 9(1.6)2 / 9 = 2.56
5. En conclusión, se rechaza la hipótesis nula y se dice que si hay suficiente evidencia
para apoyar la contención del fabricante.
6. El valor de p se hace buscando 2.56 en la tabla de la distribución de JI cuadrada
con ν = 9 y vemos que es (.025 < p < .01). Usando la función (5-29), y sustituyendo
6-29
los valores da: (0.025 – 0.01)/(2.7 – 2.09) = (0.025 – X)/(2.7 – 2.56) y la

probabilidad es p = 0.022. La figura de abajo muestra esta situación.
Figura 6.5. Gráfica mostrando el valor de la estadística χ2, la región de rechazo, la

región crítica y el valor de la probabilidad p, para el Ejemplo #13..
Ejemplo #15. En un estudio de ahorro de energía eléctrica (lo que ocasionaría que
hubiera menos contaminación del medio ambiente) se observa qué, la varianza
(poblacional) del consumo es de 28.0 kWh. Se decide poner focos fluorescentes y
apagar las luces cuando no se usen, para ver si hay una reducción en la variación
del consumo. Para esto se saca una muestra aleatoria de 26 consumos de energía, y
se estima una varianza muestral de 16.0 kWh. Usar un nivel de significancia de α =
0.05, y probar que la varianza del consumo de energía se ha reducido, bajo las
condiciones dadas. También hacer una prueba de hipótesis no tradicional
calculando el valor de la probabilidad p e interpretarla, acordemente.
Solución:
1. La prueba de hipótesis nula es Ho:σ2 = 28.0. La prueba de hipótesis alternativa es
6-30
H1:σ2 < 28.0.

2. La región crítica se calcula buscando el numero de grados de libertad ν = 26 en
la tabla de la distribución de la JI cuadrada con χ2.05;26 y da 15.379 (probabilidades
de la cola inferior o izquierda).
3. Usando la estadística de la distribución de la JI cuadrada χ2 para la prueba de
hipótesis (6-15), esto es, χ2 = (n - 1)s2 / σ2, y sustituyendo los valores da:
χ2calc. = (26 – 1)(16.0) / 28.0 = 14.29
4. Ahora, comparando el valor de χ2calc. = 14.29 con la región crítica izquierda de
15.38, es decir, χ2calc. = 14.29 < χ2.05;26 = 15.38, se rechaza la hipótesis Ho:σ2 = 28.0
y se inclina por la hipótesis alternativa.
5. El valor de p se hace buscando 14.29 en la tabla de la JI cuadrada con ν = 26 y
vemos que está entre λ2 = .05 con χ22 = 15.379 y λ1 = .025 con χ21 = 13.844.
Sustituyendo los valores en la función (5-29) y resolviendo por X da:
(λ2 – λ1)/(χ22 – χ21) = (λ2 – X)/(χ22 – χ2calc.)
(.05 - .025)/(15.4 – 13.8) = (.05 – X)/(15.4 – 14.29)
La probabilidad es de p = .029. Por lo tanto, si la hipótesis nula es verdadera,
esperaríamos de tener un valor de χ2 más grande que, o igual que 14.29, con una
probabilidad de .03.
Aplicación de la JI cuadrada, χ2 en cuanto a la prueba de bondad de ajuste
comparando las frecuencias observadas (lo práctico o los resultados de
laboratorio) y las frecuencias teóricas (lo esperado)
La prueba de bondad de ajuste se usa para probar la hipótesis de que una
frecuencia observada está de acuerdo con algunas distribuciones teóricas, o que
hay consistencia entre una distribución hipotética (como la distribución normal, la
binomial, etc.) qué encaje con una distribución empírica o muestral.
6-31
Aquí se nota qué, las pruebas de hipótesis nulas son siempre unilaterales
derechas. También, es de notarse que se puede usar la prueba de Kolmogorov-
Smirnov en las pruebas de bondad de ajuste.
Descripción de la estadística de χ2 usada para la prueba de bondad de ajuste
χ2 = (o1 – e1)2 / e1 + (o2 – e2)2 / e2 +...+ (ok – ek) / ek (6-16)
k
χ2 = Σ (oj – ej)2 / ej (6-17)
j=1
Donde:
χ2 = estadística usada para la prueba de bondad de ajuste
o = frecuencias observada
e = frecuencia esperada
k = número de categorías diferentes de un resultado
n = número total de casos o tamaño de la muestra
ν = k – 1 = número de grados de libertad
Nota: En algunas ocasiones, si se van a acomodar los datos por distribuciones
teóricas, como la binomial, se usa la relación ν = k – 1 – m (Spiegel, 1961).
Cuando se usa la prueba de bondad de ajuste, el criterio para rechazar o
retener la hipótesis nula es que, si χ2 = 0, entonces, las observaciones teóricas y las
observadas son iguales. Pero, si χ2 > 0, entonces, las frecuencias teóricas y las
observadas no son iguales. Esto quiere decir que, si el valor de la estadística χ2calc. >
χ2tab., entonces, se rechaza la hipótesis nula; de otra manera, se retiene Ho:.
Suposiciones para hacer las pruebas de bondad de ajuste
1. Los datos muestrales consisten de conteos de frecuencia de diferentes categorías, k
de muestras aleatorias.
2. Para cada una de las categorías k, la frecuencia esperada es de cuando menos 5.
6-32
f(χ2)
0 χ2α
Figura 6.6. Regla de decisión estadística mostrando la región crítica y la región de
aceptación, para la prueba de bondad de ajuste, es decir, usando la distribución de
JI cuadrada. (Elaboración propia)
Ejemplo #16. En un estudio de seguridad municipal, se analiza el número de

accidentes por días de la semana. Probar la hipótesis nula de que los accidentes
ocurren con iguales frecuencias en los 5 días de la semana. Para esto usar un nivel
de significancia de α = 0.05 y calcular el valor de p. Los datos se dan en la TABLA
6.3 de abajo.
TABLA 6.3. Frecuencias observadas y esperadas. (Elaboración propia)
Día de la semana | Lunes Martes Miércoles Jueves Viernes
Accidentes observados| 31 42 18 25 31
Accidentes esperados | 29.4 29.4 29.4 29.4 29.4
6-33
Solución:
Los datos calculados y los resultados de la prueba de hipótesis se dan abajo.
TABLA 6.5. Cálculos para la prueba de bondad de ajuste. (Elaboración propia)
Categoría Frecuencia Frecuencia (o – e) (o – e)2 (o – e)2/e

observada esperada
Lunes 31 29.4 1.6 2.56 0.0871

Martes 42 29.4 12.6 158.76 5.4000
Miércoles 18 29.4 -11.4 129.56 4.4204
Jueves 25 29.4 -4.4 19.36 0.6585
Viernes 31 29.4 1.6 2.56 0.0871
5
χ2 = Σ(o – e)2 / e = (0.0871) + (5.400) + (4.4204) + (0.6585) + (0.8711) = 10.65
j=1
La prueba de hipótesis nula dice que no hay diferencias entre las frecuencias
observadas y las esperadas (los accidentes si ocurren con la misma frecuencia). La
región crítica es del extremo derecho, con ν = k – 1 = 5 – 1 = 4 grados de libertad.
La estadística tabulada es de χ2α;ν = χ2.05;4 = 9.49. En conclusión, debido a que el
valor de χ2 = 10.65 > χ2tab. = 9.49, se rechaza la hipótesis nula, y se dice que si hay
diferencias entre las frecuencias observadas y las esperadas. Ahora usando la
fórmula de interpolación para la JI cuadrada, con λ2 = .025, λ1 = .05, χ22 = 11.14,
χ21 = 9.488 y χ2calc.= 10.65 y sustituyendo todos los valores da:
(0.025 – 0.05)/(11.14 – 9.488) = (0.025 – X)/(11.14 – 10.65)
Resolviendo por el valor a interpolarse da X = 0.015 = p = 0.015.
Ejemplos con la t de Estudiante usando el programa Minitab
Para usar el programa Minitab en las pruebas de hipótesis con la distribución de t se
6-34
procede como:
Stat > Basic Statistics > 1-sample t…
Procedimiento:
En la ventana de “Variables” poner los datos del problema en la columna C1. En la
ventana de “Test mean” poner el promedio probado. En la ventana de “Options” en la
ventanilla de “Alternative” poner la hipótesis alternativa deseada y luego presionar la
tecla de “OK”.
Ejemplo #17. Este problema está relacionado con el ejemplo de la sección de los
mecanismos usados para calcular el valor de p. Usando los datos de ese ejemplo #4
correspondientes a esa sección y aplicando la función de arriba del programa Minitab,
probar:
(a) Ho:µ = 34.5 vs. H1:µ ≠ 34.5
(b) Ho:µ ≥ 34.5 vs. H1:µ < 34.5
(c) Ho:µ ≤ 33.2 vs. H1:µ > 33.2
Después de sustituir todos los valores, el programa Minitab da los resultados
mostrados en la tabla de abajo.
6-35
TABLA 6.4. Tabla mostrando los cálculos hechos por el Minitab. (Elaboración
propia).
________________________________________________________________
Ejemplos de problemas de la t de Estudiante usando el programa de Excel

Este es un ejemplo relacionado con un problema de observaciones pares. También se
dan las instrucciones para probar las diferencias entre dos promedios poblacionales,
cuando las varianzas son iguales. Finalmente se dan las instrucciones para resolver
problemas cuando las varianzas son desiguales.
Por ejemplo, para el uso de la función de t de Estudiante usada para
emparejamientos deliberados se procede de la siguiente manera:
Tools > Data analysis > t-Test Paired Two Simples for Means
Ejemplo #17. Este es un ejemplo sacado del texto de Probabilidad y Estadística de
Walpole et al. (1999). Esta investigación está relacionada con el desarrollo de lo
llamado ectomycorrhizal, una relación simbiótica entre las raíces de los árboles y un
hongo en la que se transfieren minerales del hongo a los árboles y azúcares de los
6-36
árboles a los hongos. Este experimento consistió en aplicar nitrógeno a la mitad de los
árboles y a la otra mitad o sea el grupo de control al cual no se le aplicó el nitrógeno.
Los pesos de los árboles se registraron en gramos al final del experimento. Probar que
no hay diferencias entre los pesos de las dos poblaciones de árboles. Asumir un
pareamiento en este problema. Asumir α = 0.05. Los datos se dan en la tabla de abajo.
TABLA 6.5. Tabla mostrando los datos del problema. (Walpole et al. 1999)
Sin nitrógeno | 0.32 0.53 0.28 0.37 0.47 0.43 0.36 0.42 0.38 0.43
Con nitrógeno | 0.26 0.43 0.47 0.49 0.52 0.75 0.79 0.86 0.62 0.46
Solución:
El programa Excel da los resultados en la tabla de abajo.
TABLA 6.6. Tabla mostrando los resultados del programa Minitab. (Elaboración
propia).
Como se ve en la TABLA 6.6, el valor de la estadística t es de -2.74. Las regiones

críticas para una y dos colas son de 1.83 y 2.26, respectivamente. Además, los valores
de la probabilidad p son de 0.01 y de 0.02 para una y dos colas, respectivamente. En
6-37
conclusión, la hipótesis nula de no diferencias se rechaza en ambos casos y se

concluye que si hay diferencias entre los pesos de las dos muestras de árboles.
Probando las diferencias entre dos promedios poblacionales, cuando las
varianzas son iguales:
Tools > Data Analysis > t-Test Two Simples Assuming Equal Variances
Similarmente, para la función de t de Estudiante cuando las varianzas son
desiguales se procede como:
Tools > Data Analysis > t-Test Two Simple Assuming Unequal Variances
Se recomienda al lector usar estas dos últimas funciones de la t de Estudiante con el
programa Minitab.
Función probabilística de densidad de la distribución F y su aplicación en la
comparación de varianzas muestrales
La distribución F tiene mucha aplicación en la comparación de varianzas
muestrales. Esta distribución F se encuentra en problemas que involucran dos a
más muestras. Debido a que, la estadística F se define como una relación, la
distribución F de probabilidad tiene dos parámetros representados por ν1 y ν2,
donde estos valores son enteros positivos. El parámetro ν1 se llama número de
grados de libertad del numerador y ν2 se llama el número de grados de libertad del
denominador. Para estimar los grados de libertad ν1 y ν2 se usa la tabla de la
distribución F dada en el apéndice de este libro.
La distribución de F es similar a la distribución de t de Estudiante y de JI
cuadrada (χ2), porque es una familia de distribuciones. Cada par de valores de ν1 y
ν2 especifican una distribución de F diferente. Otrosí, F es una variable aleatoria
continua que varía de cero hasta infinito. Debido a que las varianzas en ambos, el
numerador y denominador de la relación F, están elevadas al cuadrado, el valor de
6-38
F es siempre positivo. La forma de la curva F es asimétrica y sesgada hacia la

derecha. Sin embargo, la distribución F tiende hacia la simetría, a medida que ν1 y
ν2 aumentan. No obstante, la prueba de F es extremadamente sensible a
distribuciones que no son normales y esta falta de robustez no se mejora con
muestras grandes (More et al. 1993). La Figura 6.7 muestra varias curvas de
densidad de la distribución de F para diferentes grados de libertad.
La distribución de F se usa en situaciones con dos muestras para sacar
inferencias acerca de más de dos varianzas poblacionales, como en el caso de
problemas de análisis de varianza. Por ejemplo, si s21 y s22 son las varianzas de
muestras aleatorias independientes de tamaño n1 y n2 tomadas de poblaciones
normales con varianzas poblacionales σ21 y σ22, respectivamente, entonces la
relación de abajo:
F = s21/σ21 / s22/σ22 = σ22 s21 / σ21 s22 (6-18)
tiene una distribución de F con ν1 = n1 – 1 y ν2 = n2 – 1 grados de libertad
La función (6-18) es ampliamente usada para hacer pruebas de hipótesis,
para ver si las varianzas son iguales o desiguales. Una aplicación de la función (6-
18) está enfocada en el uso, por ejemplo, de las funciones (6-7) o (6-8), es decir,
para decidir si las varianzas son iguales o desiguales.
Para probar por varianzas iguales poblacionales se usa el siguiente criterio
para pruebas unilaterales y pruebas bilaterales. Esta información se da en la tabla
de abajo (McClave et al. 1982).
6-39
Tabla 6.7. Diagrama mostrando los criterios que se siguen para pruebas de
hipótesis con la distribución F.
__________________________________________________________________
Prueba unilateral Prueba bilateral
Ho: σ21 = σ22 Ho: σ21 = σ22
Ha: σ21 < σ22 Ha: σ21 ≠ σ22
(o Ha: σ21 > σ22)
Prueba estadística: Prueba estadística:
F = s22/s21 F = Varianza muestral grande/varianza muestral pequeña
(o F = s21/s22 cuando Ha: σ21 > σ22) = s21/s22 cuando s21 > s22
(o s22/s21 cuando s22 > s21)
Región de rechazo: Región de rechazo:
Fcalc. > Ftab. Fcalc. > Fα/2 cuando s21 > s22
donde Ftab. está basada en ν1 = n2 -1 donde Fα/2 se basa en ν1 = n2 -1
y ν2 = n1 – 1 grados de libertad. y ν2 = n1 – 1 grados de libertad
(o Fcalc. > Ftab. donde Ha: σ21 > σ22 (o Fcalc. > Fα/2 cuando s21 > s22
donde Ftab. se basa en ν1 = n1 – 1 donde Fα/2 se basa ν1 = n1 – 1
y ν2 = n2 – 1 grados de libertad) y ν2 = n2 – 1 grados de libertad)
Fuente: McClave et al. (1982)
6-40
. Frecuencia relativa
Figura 6.7. Gráfica mostrando una familia de distribuciones de F con diferentes

grados de libertad. Nótese que para la curva con ν1 = 30 y ν2 = 30 grados de
libertad, la región crítica es igual a 4.28.
Figura 6.8. Figura mostrando la distribución F, con el valor crítico de F igual a

4.26, con α = 0.05.
Ejemplo #18. Este ejemplo está encaminado a encontrar los valores críticos usando
la distribución F. Siendo así, encontrar:
6-41
(a) F0.05 con ν1 = 6 y ν2 = 10

Solución:
Los grados de libertad del numerador son ν1 = 6 y los grados de libertad del
denominador son ν2 = 10. Con un valor de significancia de α = 0.05 de la tabla se
lee 3.22. Por lo tanto, F0.05;6,10 = 3.22
(b) F0.01 con ν1 = 6 y ν2 = 10
Solución:
Nuevamente se busca α = 0.01 en la tabla de F con ν1 = 6 y ν2 = 10 y da F0.01;6,10 =
5.39
(c) Si el tamaño de una muestra es de n1 = 3 y el tamaño de otra muestra es de n2 =
10, encontrar la región crítica con α = 0.05 y 0.01. Dibujar una gráfica señalando la
región crítica cuando α = 0.05.
Solución:
F0.05;2,9 = 4.26 y F0.01;2,9 = 8.02
La Figura 6.8 muestra la región crítica y su valor correspondiente con un nivel de
significancia de 5%.
Ejemplo #19. Este problema está encaminado a estimar el valor de la probabilidad
p para pruebas de F. Por ejemplo, con α = 0.05, para una prueba de hipótesis con n1
= 5 y n2 = 7 y con un valor de Fcalc. = 5.70 la región crítica es F0.05;4,6 = 4.53.
Entonces, al comparar el valor de Fcalc. = 5.70 con F0.05;4,6 = 4.53 se rechaza la
hipótesis. Sin embargo, esta prueba de hipótesis tradicional no dice, qué tanta
fidelidad se le puede dar a el resultado obtenido. Para esto, se hace una prueba de
hipótesis no tradicional usando el valor de la probabilidad p. Siendo así, se busca
en la tabla de la distribución F el valor de Fcalc. = 5.70, con 4 y 6 grados de libertad
y con α = 0.05, pero vemos que no está explícitamente mostrado. Sin embargo,
6-42
vemos que está entre 4.53 y 9.15 con sus valores respectivos de α = 0.50 y .010,
por lo tanto la probabilidad es .01 < p < .05. Ahora, para obtener un valor de p más
especifico se usa la fórmula de interpolación (5-30) :
(λ2 – λ1)/(F2 – F1) = (λ2 – X)/(F2 – Fcalc.)
Donde λ2 = valor porcentual más alto que el valor de Fcalc., λ1 = valor porcentual
más bajo que Fcalc., F2 = valor de la distribución F correspondiente a λ2, F1 = valor
de la distribución F correspondiente a λ1, X valor que se quiere interpolar y Fcalc. =
valor calculado.
Ahora con λ2 = 0.05, λ1 = 0.01, F2 = 4.53, F1 = 9.15 y Fcalc. = 5.70 y sustituyendo y
resolviendo por X da:
(0.05 – 0.01)/(4.53 – 9.15) = (0.05 – X)/(4.53 – 5.70)
X = p = 0.04
Ejemplo #20. Supóngase que un ingeniero ambiental saca dos muestras aleatorias
de dos sitios diferentes a lo largo de una corriente de agua y mide las
concentraciones de DBO5. Para la prueba de hipótesis el ingeniero quiere usar α =
.10. La primera muestra consiste de n1 = 25 concentraciones de DBO5, cuyo
promedio es de X 1 = 25 mg/L con una desviación estándar de s1 = 75 mg/L.
Similarmente, la segunda muestra consiste de n2 = 25, X 2 = 125 mg/L con s2 = 46.
Para esto, se tiene que hacer una decisión si se va a usar la distribución (6-7) de t
de Estudiante que requiere de varianzas iguales y/o la distribución (6-8) que no
requiere de varianzas iguales. Para resolver este problema hacer lo siguiente:
(a) Probar la hipótesis nula de que las varianzas de las dos muestras son iguales.
(b) Además, calcular el valor de p.
Solución:
1. Debido a que se quiere detectar una diferencia en las varianzas poblacionales,
6-43
tendremos que estimar, ya sea σ21 > σ22, o bien, σ22 > σ21.
2. Por lo tanto, la hipótesis alternativa es Ha:σ21 ≠ σ22.
3. La prueba es bilateral, es decir: Ho:σ21/σ22 = 1 y Ha:σ21/σ22.
4. La prueba estadística es:
F = varianza muestral grande/varianza muestra pequeña = s21/s22
5. Las suposiciones son de que las muestras tienen frecuencias relativas que son
aproximadamente normales. Además, se supone que las muestras son aleatorias e
independientes.
6. La decisión estadística se basará en comparar la región crítica de 1.98, con el
valor estadístico, esto es: Fcalc. > Ftab. = F.05;24,24 = 1.98
Donde ν1 = n1 – 1 = 24 y ν2 = n2 – 1 = 24 grados de libertad
7. Ahora se calcula la prueba estadística (6-18) y se sustituyen los valores:
F = s21/s22 = (76)2/(46)2 = 2.73
8. Debido a que, 2.73 > 1.98, por lo que se rechaza Ho: de varianzas iguales.
9. Usando α = .10 esto dice qué, solamente una vez en diez, esta prueba estadística
nos llevaría a concluir erróneamente que las varianzas σ21/σ22 fueran diferentes,
cuando de hecho fueran iguales.
10. Para calcular p se busca el valor de 2.73 en la tabla F con ν1 = 24 y ν2 = 24 y
está entre .100 y .050. Esto es: .050 < p < .100.
No obstante, si se deseara más precisión se puede usar la fórmula de interpolación
(5-30), con λ2 = .100, λ1 = .050, con F2 = 1.98, F1 = 2.41 y Fcalc. = 2.73
Sustituyendo todos los valores en (5-30) da: p = 0.013(2) = .02. (Nótese que aquí
se multiplica por 2 porque la prueba es bilateral).
6-44
6.1. Encontrar los valores críticos de t por los cuales el área del extremo derecho de la
distribución de t es de α = 0.05, y de α = 0.01, si:
(a) ν = 16 (t[α;ν] = t[.95;16] = 1.75, t[.99;16] = 2.583)
b) n = 28 (t[α;ν] = t[.95;16] = 1.70, t[.99;28] = 1.701
(c) ν = ∞ (t[α;ν] = t[.95;∞] = 2.33, t[99;∞] = 2.33)
6.2. Hacer el problema 6.1, pero bilateralmente.
6.3. Para mantener el control de la calidad industrial, un fabricante de sistemas de
control de partículas (ciclones), supone que la producción de estos sistemas para el
control de partículas < 10 micras, tienen un eficiencia promedio de 32%. Para probar
esta aseveración se tomó una muestra de 8 ciclones y se midieron las eficiencias de
cada uno para ese tamaño de partículas. Las eficiencias (%) fueron: 29.4, 30.8, 30.6,
31.5, 32.1, 31.7, 30.3, y 30.8%, respectivamente. Hacer las siguientes estimaciones:
(a) Establecer un intervalo de confianza para µ, con α = 0.05. (30.18 < µ < 31.62)
(b) Hacer una prueba de hipótesis bilateral al 95%. (t = -3.62)
(c) Calcular el valor de la probabilidad, p. (0.009)
6.4. En una prueba para medir la acumulación de plomo atmosférico (Pb) en la
sangre, se realizó un experimento con 15 voluntarios. La prueba consistió en exponer
los sujetos en un sitio aledaño a una planta de fundición de metales y de exaltar el
metabolismo, esto es, corriendo. Después de que los sujetos terminaron de correr, se
les sacó sangre y se medió la concentración de Pb, es decir, antes de correr y después
de correr. Para esto usar la estadística de t más apropiada para resolver este problema
y sacar las conclusiones apropiadas. La tabla de abajo muestra la información
requerida para este experimento.
6-45
___________________________________________________________________
No. sujeto Concentración de Pb antes de correr Concentración de Pb después de correr
1 2.76 7.02
2 5.18 3.10
3 2.68 5.44
4 3.05 3.99
5 4.10 5.21
6 7.05 10.26
7 6.60 13.91
8 4.79 18.53
9 7.39 7.91
10 7.30 4.85
11 11.78 11.10
12 3.90 3.74
13 26.00 94.03
14 67.48 94.03
15 17.04 41.70
__________________________________________________________________
6.5. En una prueba para diseñar un equipo de control para partículas emitidas por una
fuente industrial, se hicieron dos pruebas para saber cual de los dos sistemas de
control eran más eficientes. La primera prueba consistió en instalar un filtro de vidrio
(baghouse). La otra prueba consistió en agregar al sistema de control del baghouse, un
ciclón. Probar la hipótesis, al 95% de nivel de confianza de qué, con el equipo
adicional, no hubo diferencia en las reducciones de contaminantes. Calcular el valor
de la probabilidad, p. La tabla de abajo muestra los resultados de los dos equipos de
control. Asúmase que el muestreo de selección fue completamente al azar, sin
emparejamiento y asumir que las poblaciones son normales. (t = 3.54, p = 0.028)
6-46
Tabla mostrando las concentraciones de partículas para ambas situaciones.

___________________________________________________________________
Concentración de partículas con Concentración de partículas con el sistema
el sistema de control agregado de control, al cual se le agregó el ciclón
___________________________________________________________________
Microgramos/m3 Microgramos/m3
___________________________________________________________________
421 207
462 17
400 412
378 74
413 116
___________________________________________________________________
Observaciones y cálculos sugeridos:

Antes de comenzar, tenemos que hacer una decisión sobre cual prueba de t es la más
apropiada. Pudiéramos usar la versión de t para observación pares donde hay un
aparejamiento deliberado, esto es usando la función (6-6). Tal vez pudiéramos usar la
función de t que asume que las varianzas de las poblaciones son iguales y con
muestras del mismo tamaño (función (6-7)). La tercera opción, sería usar la versión de
t para varianzas desiguales y usando la función (6-8). Sin embargo, si asumimos que
se usó el método de selección completamente aleatorio, sin emparejamiento, y si
analizamos a simple vista los datos de la tabla de arriba, podemos ver que hay mucha
variación en las observaciones (también se puede hacer una prueba de hipótesis con el
objeto de ver si las varianzas son iguales), lo que nos inclinaría a usar la tercera
opción, esto es, la función (6-8). No obstante, antes de decidirse por el uso de esta
función es conveniente hacer una prueba con la función estadística F = s21/s22.
6.6. Para saber si una droga experimental puede curar los síntomas de la leucemia
6-47
(porque la llamada leucemia no es una enfermedad en particular de la sangre, sino un

síntoma que acusa que todo el cuerpo está enfermo, no únicamente la sangre. De no
pensarse así, entonces, se diría que la sangre es una parte independiente del cuerpo),
10 sujetos con el síntoma avanzado, fueron sometidos a una prueba. Cinco de ellos
recibieron el tratamiento experimental y cinco de ellos no. El tiempo de
supervivencia, en años, se midió en cada uno de los sujetos. Probar con α = 0.05 que
esta droga experimental fue efectiva. Asumir que las dos distribuciones son normales
y con varianzas iguales. Los datos se dan abajo.
__________________________________________________________________
Supervivencia en años
_______________________
Sujetos tratados 2.1 5.3 1.4 4.6 2.9
__________________________________________________________________
Sujetos sin tratamiento 1.9 1.5 2.8 3.1 2.0
__________________________________________________________________
6.7. En un estudio de ingeniería del agua de análisis de oxígeno disuelto (OD) varios
laboratorios se avocaron a hacer estos análisis usando el método de Winkler (MW)
(titulación) y el método de electrodos (ME). Usar una t estadística de muestras
pareadas y probar que no hay diferencias entre los dos métodos. Usar α = .05.
Calcular el valor de p. Los datos se dan en la tabla de abajo. La tabla de abajo muestra
los datos de oxígeno disuelto (OD) de varios laboratorios usando el método de
Winkler y el método de electrodos. Las concentraciones del oxígeno disuelto (OD), se
expresan en mg/L son en mg/L. Sugerencia: Usar el programa de computadora
Minitab o Excel. (t = -2.49, p = .01)
6-48
Método de | 1.2 1.4 1.4 1.3 1.2 1.3 1.4 2.0 1.9 1.1 1.8 1.0 1.1 1.4
Winkler
Método de | 1.6 1.4 1.9 2.3 1.7 1.3 2.2 1.4 1.3 1.7 1.9 1.8 1.8 1.8
Electrodos
6.8. Este es un experimento relacionado con higiene industrial y seguridad, para

reducir el número de hombre-horas perdidas, como resultado de los accidentes
industriales. Para esto se instaló un nuevo equipo de seguridad. En una prueba para
medir la eficiencia del equipo de seguridad instalado, se examinó una muestra
aleatoria en varios departamentos de esta industria. El número de horas-hombre
perdido en el mes antes de la instalación del equipo y el siguiente mes después de
instalar el equipo, el número de horas perdidas por accidentes industriales se registró.
La tabla de abajo muestra los datos de la muestra aleatoria que se sacó.
Tabla mostrando los datos de horas-hombre perdidas antes y después de instalar el
equipo de seguridad.
___________________________________________________________________
Horas perdidas por departamento
_______________________________________
Mes 1 2 3 4 5 6
___________________________________________________________________
Antes de instalar el equipo 18 26 43 17 29 30
Después de instalar el equipo 15 20 31 17 25 27
___________________________________________________________________

(a) ¿Realmente valió la pena la inversión en la instalación del equipo de seguridad?
6-49
6.9. Se coleccionaron los siguientes datos de una muestra aleatoria de óxidos de

azufre (SO2), en ppm, provenientes de una fundición. Asumir que los datos provienen
de una población normal de óxidos de azufre. Usar α = 0.05. La tabla de abajo da la
información.
Óxidos de azufre (ppm) | 56 58 58 59 57 57 56 57 58

(a) Estimar el intervalo de confianza del 95%. Incluir todos los pasos necesarios e
interpretarlo acordemente. (57.33 ± 0.768)
(b) Probar la hipótesis nula de que el promedio poblacional es de 58.5 ppm.
Establecer todos los pasos que requiere este problema. Hacer una gráfica mostrando
las regiones de rechazo y aceptación.
(c) Hacer una prueba de hipótesis no tradicional e interpretarla acordemente. Hacer
una gráfica con las probabilidades. (t = -3.19)
(d) Si no se pudiera rechazar la hipótesis nula, mencionar tres factores que pudieran
haber afectado el resultado de este experimento.
6.10. Hacer el mismo problema 6.9 de los óxidos de azufre y probar la hipótesis nula
de que el valor del promedio poblacional es de no más de 56.1 ppm. Usar un nivel de
significancia de 0.05. Además, estimar la hipótesis no tradicional (el valor de p) e
interpretarla acordemente. Hacer una gráfica mostrando la probabilidad.
6.11. Hacer el mismo problema 6.10 de los óxidos de azufre y proceder de la
siguiente manera:
(a) Probar la hipótesis de que µ es de cuando menos 58.5 usando el nivel de
significancia de 0.05. (t = -3.51, se rechaza Ho:)
6-50
(b) Calcular el valor de p. (p = 0.0002)

(c) Graficar los resultados.
6.12. Un fabricante de fusibles afirma que con una sobrecarga de 25%, los fusibles se
fundirán en 14.00 minutos, en promedio. Para probar esta afirmación, se tomo una
muestra aleatoria de 20 fusibles y se sometió a una carga de 20% y los tiempos que
tardaron en fundirse tuvieron un promedio de 10.63 minutos, con una desviación
estándar de 2.48 minutos. Asumiendo que la población muestreada es normal, hacer
una prueba de hipótesis para refrendar o rechazar la afirmación del fabricante de
fusibles. Asumir α = .05. También, calcular el valor de p.
6.13. En un estudio de seguridad en los caminos carreteros, hecho para evitar los
accidentes, la policía federal de caminos cree que la velocidad promedio de los
motoristas, que manejan sobre cierta zona carretera, exceden el límite de velocidad de
110 kilómetros por hora. Para esto, se tomó una muestra aleatoria de 20 vehículos con
sus respectivas velocidades, en kilómetros por hora registrada por el radar. Los
resultados en kilómetros por hora de cada uno de los 20 vehículos fueron: 113.6,
115.0, 117.0, 118.0, 115.9, 84.0, 87.0, 90.0, 110.0, 95.0, 98.0, 99.0, 118.0, 120.0,
121.0, 119.0, 118.0, 111.0, 112.0, 112.6. Usar α = 0.05. Hacer las siguientes
estimaciones:
(a) ¿Proveen estos datos suficiente evidencia para apoyar la aseveración de la policía
federal de caminos de que los motoristas están violando el reglamento del límite de
velocidad de 110 kilómetros por hora? (No hay evidencia de que se esté violando a
límite de velocidad de 110 kilómetros por hora)
(b) Estimar el intervalo de confianza con α = 0.05 y con α = 0.1 para el promedio
poblacional de velocidad. (103.14 < µ < 113.18)
6.14. En un estudio de ingeniería de manufactura, en un esfuerzo por establecer el
6-51
tiempo estándar para realizar determinada tarea en el ensamble de partes de

carburadores para automóviles, el ingeniero de producción selecciona, aleatoriamente,
a 16 trabajadores experimentados para realizar esta faena. El tiempo promedio
requerido por los 16 trabajadores fue de 13 minutos con una varianza de 9 minutos. El
ingeniero de producción desea construir un intervalo de confianza de 99% para la
longitud de tiempo del verdadero promedio µ requerido para realizar la faena. Hacer
un intervalo de confianza con un nivel de significancia de 0.05. ¿Como se comparan
los dos intervalos? ¿Cuál es más amplio y porqué?
6.15. En un estudio hipotético de consumo de gasolina, el kilometraje de gasolina
dado por los autos de ciertos modelos es de 10.4 kilómetros por litro con una
desviación estándar de 1.6 kilómetros por litro. Se calcula el promedio de rendimiento
en kilómetros por litro para muestras de este tipo de modelos de autos. ¿Cuál es la
probabilidad de que el promedio de rendimiento de gasolina sea de 12 kilómetros por
litro, si se saca una muestra aleatoria de 20 autos? Asumir un nivel significante de α =
0.01. (p ≈ .00098)
6.16. El ingreso promedio mensual, de cierto grupo de profesionistas es como sigue:
30,000, 32,000, 31,000, 29,000, 29,500, 33,000, 31,500, 30,500, 29,800, 29,900.
¿Cuál es la probabilidad de que el verdadero promedio sea de 31,200 pesos? ¿Cuáles
serían los factores que pudieran afectar el valor de la probabilidad p?
6.17. En un estudio estadístico, para demostrar que la prueba de t de estudiante es
independiente de las unidades de medición, se sacaron muestras de las temperaturas
de hornos de ladrilleras medidas en grados Celsius (oC) y en grados Fahrenheit (oF).
La hipótesis es que el promedio de la temperatura del horno es de 50 oC. Hacer la
misma prueba, pero ahora con el promedio en oF. La tabla de abajo muestra los
resultados de las temperaturas de los hornos en oC. Convertir estas temperaturas a oF
6-52
completar la tabla de abajo y comparar los resultados de las dos pruebas de hipótesis.
¿Son los resultados de la t de estudiante y de la probabilidad p, iguales o diferentes?
Tabla mostrando las temperaturas. (Elaboración propia).
Temperaturas oC | 47 55 68 55 51 50 49 45 53 47 48 51
___________________________________________________________________
Temperaturas oF |
___________________________________________________________________
6.18. Encontrar los valores críticos de χ2, por los cuales el área de la cola derecha
de la distribución es de 0.05 (χ2.95), si los grados de libertad son de:
(a) ν = 15
(b) ν 21
(c) ν = 50.
6.19. Para este problema, se dan los siguientes datos obtenidos de una muestra de
concentraciones (en mg/L) de nitratos (NO3-) tomados del efluente de una planta de
tratamiento de aguas residuales industriales. Construir un intervalo de confianza
para el verdadero valor de la varianza, es decir, la varianza poblacional σ2, usando
un nivel significante de α = 0.01. (0.21 < σ2 < 1.31)

37.61 38.61 37.69 37.72 36.75 38.61
38.88 38.19 37.88 38.00 37.20 37.20
37.53 38.21 38.11 37.40 37.40 39.39
6.20. Si una muestra de partículas de cadmio atmosférico de un tamaño de 17 micras

tiene una varianza de s2 = 196.38, encontrar el intervalo de confianza para la varianza
6-53
poblacional, si los niveles significantes son de:

(a) 0.05
(b) 0.01.
6.21. Si tenemos un tamaño de muestra de n = 20 y un nivel de α = .05, entonces,
encontrar los valores críticos de la distribución de la JI cuadrada si:
(a) La prueba es unilateral izquierda (10.117)
(b) Si la prueba es bilateral (8.907, 31.41)
(c) Si se asume una prueba de bondad de ajuste (30.14)
6.22. En un estudio de ahorro de energía eléctrica (que contribuiría a menos
contaminación ambiental. Porque?) se enlistó el consumo de energía eléctrica (en
kWh) durante 7 años diferentes. Usando un nivel de confianza de 95% probar la
afirmación de que la desviación estándar para todos esos años es de 1,000,000.
11,943 11,463 10,789 9907 9012 9942 11,153
6.23. El libro Elementary Statistics del auto Mario Triola (1995) da un ejemplo de
un radiador de un auto que contiene 3785 mL de anticongelante. Asumiendo que
las fluctuaciones son inevitables, el manejador de control de calidad quiere estar
seguro de que la desviación estándar sea menos que 30 mL. De otra manera,
algunos radiadores se derramarían, mientras que otros, que no tendrían suficiente
anticongelante, no. Para esto se selecciona una muestra aleatoria cuyos resultados
se dan abajo. Usar estos datos para construir un intervalo de confianza del 99%
para el verdadero valor de σ2. ¿Sugiere este intervalo de confianza que las
fluctuaciones están en un nivel aceptable? Asúmase que las distribuciones de los
llenados de los radiadores con el anticongelante están normalmente distribuidas.
6-54
(38.2 < σ < 95.7)

Tabla enlistando la muestra de los llenados de anticongelante.
__________________________________________________________________
3761 3861 3769 3772 3675 3861
3888 3819 3788 3800 3720 3748
3753 3821 3811 3740 3749 3839
(Fuente: Triola, 1995)
6.24. Una muestra aleatoria de 700 trabajadores de la industria participó en una

prueba para determinar, cuánto tiempo necesitaban para su protección personal
haciendo determinada faena. Esto se hizo después de tomar un curso de
entrenamiento de higiene industrial y seguridad. Asúmase una prueba de bondad de
ajuste. Asumir n = 8. Hacer lo siguiente
(a) Probar la hipótesis nula de Ho: y revisar si la población muestreada es normal o
aproximadamente normal. (χ2 = 20.36, χ2crítica = 15.51, se rechaza Ho:)
(b) Calcular el valor de p. (.05 < p < .005)
6.25. Un ingeniero ambiental mide la cantidad de DBO5 procedentes de 15 lugares a

lo largo de una corriente, la cual está contaminada por a una descarga industrial. El
ingeniero reporta las concentraciones en mg/L. Como información inicial se sabe que
la suma de los cuadrados es igual a 508.1 mg/L. Construir un intervalo de confianza
del 95% para la varianza poblacional. (90.2 > σ2 > 19.46)
6-55
CAPITULO 7
Análisis de Varianza
Diseños de análisis de varianza completamente aleatorizados.- Método de
comparaciones múltiples para saber cuales poblaciones son iguales y cuales
son desiguales.- Análisis de varianza de diseño de bloques aleatorizados.-
Suposiciones del modelo de bloques aleatorios completos.- Análisis de
varianza en dos sentidos.- Interacción con ANOVA de dos factores.- Análisis
de varianza de tres sentidos: diseño completamente aleatorio.- Interacción con
ANOVA de diseños factoriales de tres clasificaciones.- Ejemplos de análisis de
varianza usando el programa Minitab.-
El método para comparar varios promedios se llama análisis de varianza o
simplemente ANOVA. En su más simple forma, el análisis de varianza compara
varios tratamientos para determinar la igualdad de los promedios. En contraste con
la prueba de t de estudiante, que estudia la igualdad de dos poblaciones (Ho: µ1 =
µ2), el análisis de varianza estudia más de 2 distribuciones, y usa la estadística F.
Específicamente, el modelo ANOVA simple estudia las igualdades de más de 2
promedios, esto significa que estudia los efectos de más de dos "tratamientos," es
decir, de la hipótesis nula Ho: µ1 = µ2 = µ3 = ..... = µn, esto es, de que las varianzas
de los promedios son igual a cero (σ2µ = 0). A pesar de que este análisis de varianza
estudia los promedios, analiza, de hecho, la varianza de las poblaciones.
Las propiedades y suposiciones en el análisis de varianza (ANOVA) son:
1. Para las pruebas del análisis de varianza se usa la distribución de F. Esta

distribución F no es simétrica, sino sesgada, es decir, oblicua hacia la derecha.
2. Los valores de F pueden ser de cero o positivos, pero no
7-1
pueden ser negativos.

3. La prueba de hipótesis es siempre unilateral derecha.
4. Hay una distribución de F diferente para cada par de grados de libertad, (g.l.).
La Figura 7.1 muestra esta situación. Para denotar los grados de libertad para el
numerador se usa la anotación, ν1 y para los grados de libertad el denominador se
usa la anotación, ν2.
5. Las poblaciones tienen distribuciones normales.
6. Las poblaciones tienen la misma varianza o desviación estándar. Si esta
condición no puede ser cumplida, la prueba de F no es válida. En este caso se debe
de usar una prueba de hipótesis diferente.
7. Las muestras son aleatorias e independientes una de la otra.
Nota: Cuando no se pueden cumplir las condiciones de normalidad o de
independencia de los datos, uno se tiene que remitir a la pruebas no paramétricas,
que no requieren de estas suposiciones.
Figura 7.1. Gráfica mostrando la distribución F. Hay una distribución diferente de

F para cada par de grados de libertad del numerador, ν1 y del denominador, ν2.
7-2
Diseños de análisis de varianza completamente aleatorizados

Existen dos tipos básicos de análisis de varianza: el diseño completamente
aleatorizado y el diseño de bloque completamente aleatorizado.
En el caso del diseño completamente aleatorizado, conocido por análisis de
varianza en un sentido (ANOVA de una clasificación), se asignan los tratamientos
aleatoriamente a las unidades experimentales. En este diseño se sacan las muestras
independientemente, por lo tanto, la selección de una muestra no afecta la
selección de cualquier otra muestra. Para cada muestra se puede calcular el
promedio, X j y la varianza s2j. Por ejemplo, supóngase que se quieran probar
cuatro marcas de neumáticos, 1, 2, 3 y 4, para determinar si hay diferencias con
respecto a la duración. Para esto se pueden asignar, aleatoriamente, una muestra de
10 neumáticos de cada marca, a digamos 25 vehículos y probar su desgastamiento.
Una vez probadas las marcas de los neumáticos, se usa el análisis de varianza, para
ver si las marcas difieren con respecto a su duración.
Por otra parte, en el caso de ANOVA de diseño de bloques completamente
aleatorios, este enfoque se usa cuando el error experimental es grande, lo que
conlleva al no rechazo de hipótesis debido a que hay mucha variación. De manera
que, al “bloquear” las observaciones se reduce la variación. El término “bloque” se
deriva de diseños experimentales aplicados a la agricultura, en los cuales las
parcelas de tierras de cultivos se refieren como “bloques”. Por ejemplo, en el caso
del diseño de bloque aleatorio, los tratamientos (como fertilizantes) se asignan
aleatoriamente a unidades dentro de cada bloque, es decir, de parcelas que tengan
suelos parecidos.
Una suposición importante del modelo para un diseño de bloques completos
aleatorizados es que los efectos de tratamiento y de bloqueo se asume que son
7-3
aditivos. Por ejemplo, para ilustrar esta situación, si se grafican los promedios
poblacionales versus tratamientos, digamos de bloque 1 y 2 y, si las gráficas son
paralelas, se dice que los efectos de tratamiento y de bloques son aditivos o que no
interactúan. Sin embargo, si las líneas se cruzan entre si, se dice que hay
interaccion o no aditividad.
El formato de la tabla de ANOVA de un sentido completamente aleatorizado
se da abajo. La TABLA 7.1 da una descripción de todos los componentes de
clasificaciones unilaterales o de diseños completamente aleatorizados.
TABLA 7.1. Análisis de varianza de un sentido de diseños completamente
aleatorizados.
Fuente de la Suma de (SS) Grados de Cuadrado (MSa) Fcalc. Ftab. Valor
variación los cuadrados libertad medio de p
Tratamientos SSa a–1 MSa = SSa/(a – 1) F1 = MSa/s2 F[1-α;a-1,a(n-1)]
Error SSe a(n – 1) s2e = SSe/[a(n – 1)]
Total SSt an – 1
Donde:
a
SSa = n Σ ( y i. - y .. )2 (7-1)
i=1
a n
SSe = Σ Σ (yij – y i.)2 = SSt – SSa (7-2)
i=1 j=1
a n
SSt = Σ Σ (yij – y ..)2 (7-3)
i=1 j=1
a = número de tratamientos
7-4
Para denotar los simbolismos usados en la TABLA 7.1, estos se dan en la tabla de
abajo.
TABLA 7.2. Tabla mostrando los simbolismos usados en la TABLA 7.1. (Walpole
et al. 1999)
Tratamiento: 1 2 …… i …… k
y11 y11 …… yi1 …… yk1
y12 y22 …… yi2 …… yk2
. . …… . …… .
. . . .
y1n y2n …. yin ….. ykn
Total T1. T2. …. Ti. …. Tk. T..
Promedio y 1. y 2. …. y i. …. y k. y ..
Donde: yij = j-ésima observación del i-ésimo tratamiento

y i. = promedio de todas las observaciones para el i-ésimo tratamiento
y .. = promedio de todas las an observaciones o promedio de los
promedios
Ti. = Total de todos los promedios
Ejemplo #1. Este es un ejemplo relacionado con el uso de ANOVA unilateral o de
diseño completamente aleatorizado. Para esto se coleccionaron las concentraciones
atmosféricas de SO2 (en ppm) provenientes de 5 muestreadores localizados a
diferentes distancias (aleatoriamente asignadas), de una fuente industrial emisora.
Probar la hipótesis nula de que las 5 poblaciones de SO2 son iguales, es decir, Ho:
µ1 = µ2 = µ3 = µ4 = µ5. Calcular el valor de p. Los datos se dan en la tabla de abajo.
Usar un paquete de computadora para procesar los datos.
7-5
TABLA 7.3. Tabla mostrando los datos del problema.

Número de muestreador | 1 2 3 4 5
500 550 648 720 890
510 540 630 700 900
490 500 620 710 920
530 520 600 736 880
Solución:
Si se usa el programa Excel irse a: ANOVA → Single factor.
Usando este programa, los resultados se dan abajo:
TABLA 7.4. Tabla mostrando los resultados de este problem usando el programa
de Excel.
ANOVA: Un solo factor
RESUMEN
Grupos Conteo Suma Promedio Varianza
Columna 1 4 2030 507.5 291.6667
Columna 2 4 2110 527.5 491.6667
Columna 3 4 2498 624.5 401
Columna 4 4 2866 716.5 235.6667
Columna 5 4 3590 897.5 291.6667
Tabla de ANOVA
Fuente de
Variación SS gl MS Fcalc. Valor-p Fcrit.
Entre los grupos 406123.2 4 101530.8 296.5846 4.4E-14 3.055568
Dentro de los
grupos 5135 15 342.3333
Total 411258.2 19
7-6
Si se usa el programa Minitab irse a: Stat → ANOVA → One way (unstacked).

Los resultados de este problema usando el Minitab se dan en la tabla de abajo.
TABLA 7.5. Tabla mostrando los resultados usando el Minitab.
One-way ANOVA: Muestreador 1, Muestreador 2, Muestreador 3, Muestreador 4,
Muestreador 5
Source DF SS MS F P
Factor 4 406123 101531 296.58 0.000
Error 15 5135 342
Total 19 411258
s = 18.50 R-Sq = 98.75% R-Sq(adj) = 98.42%
Nótese que cada uno de estos paquetes de computadora tiene sus ventajas y
desventajas. De cualquier manera, al juzgar por el valor de F = 296.58 >>>> Fcrítica
= 3.06, la hipótesis nula de igualdad de poblaciones de SO2 se rechaza de una
manera mucho muy significante. Esta decisión es contundentemente apoyada por
el valor tan pequeño de p = 4.4x10-14.
Ejemplo #2. Se da la siguiente información en la tabla de abajo relacionada con
cierto estudio ecológico. Asúmase un diseño completamente aleatorizado. Sacar las
conclusiones adecuadas.
6
Tratamiento Observaciones ∑ yij y i.
J=1
1 99 40 61 72 76 84 432 72
2 96 84 82 104 99 105 570 95
3 63 57 81 59 64 72 396 66
4 79 92 91 87 78 71 498 83
Solución:
7-7
Usando un paquete de programa de computadora da:

TABLA 7.7. Tabla de análisis de varianza. (Elaboración propia)
Grupos Conteo Suma Promedio Varianza

Tratamiento 1 6 432 72 406.8
Tratamiento 2 6 570 95 97.6
Tabla de ANOVA
Fuente de
Variacion SS gl MS Fcalc. Valor-p Fcrit.
Entre los Grupos 2940 3 980 5.99022 0.004387 3.098391
Dentro de los
grupos 3272 20 163.6
Total 6212 23
El valor de la probabilidad de p es de 0.0044. Este valor también se puede calcular

manualmente buscando el valor de la Fcalc. = 5.99 en la tabla de la distribución F e
interpolando entre el valor más alto y el más bajo usando la relación (7-4) de abajo:
(λ2 – λ1) / (F2 – F1) = (λ2 – X) / (F2 – Fcalc.) (7-4)
Donde:
λ2 = valor porcentual de F más alto que el valor de Fcalc.
λ1 = valor porcentual de F más bajo que el valor de Fcalc.
F2 = valor de la distribución F correspondiente a λ2
F1 = valor de la distribución F correspondiente a λ1
X = valor que se quiere interpolar
Fcalc. = valor calculado usando la tabla de la distribución F.
Nota: El mecanismo que se sigue para interpolar es buscando el valor de la Fcalc. =
7-8
5.99 en la tabla de la distribución F con ν1 = 3 (numerador) y ν2 = 20

(denominador) y vemos que 5.99 está entre λ2 = .001 con F2 = 8.10 (valor más alto)
y λ1 = .01 con F1 = 4.94 (valor más bajo). Enseguida, sustituimos el valor de la
Fcalc. = 5.99 y los demás valores en la fórmula de interpolación (7-4) para dar:
(.001 - .01)/(8.10 – 4.94) = (.001 – X)/(8.10 – 5.99)
Resolviendo por X = .005= p = .005. Este valor está muy de acuerdo al valor de
.0044 de la TABLA 7.7. En conclusión, el valor de p = .0044 indica un diseño
experimental preciso y conciso.
Ejemplo #3. Los nitratos (NO-3) representan la fase más oxidada en el ciclo del
nitrógeno. Generalmente, esto ocurre en muy pequeñas cantidades en las
superficies de los almacenamientos de agua, pero puede existir en grandes
cantidades en algunas aguas subterráneas. En cantidades excesivas, los nitratos
pueden ocasionar una enfermedad infantil llamada metemeglobinemia. (Métodos
Estándares para el examen del agua y de las aguas residuales, 1971). Por esta
razón, el límite es de 45 mg/L para el agua potable. Para los análisis de los nitratos,
existen varios métodos. Por ejemplo, un método es el del ácido fenoldisulfónico;
otro es el método de la reducción de cadmio; otro más es el método de ácido
cromotrópico y, otro más es el método de brucina (alcaloide tóxico). Para esto, se
hizo un estudio estadístico para comparar los resultados de los cuatro métodos
mencionados arriba para analizar los nitratos. Los siguientes datos se dan abajo.
Para esto, llamemos tratamiento (1) al método del ácido fenoldisulfónico,
tratamiento (2) al método de la reducción del cadmio, tratamiento (3) al método de
ácido cromotrópico, y tratamiento (4) al método de brucina. La tabla de abajo da
los resultados en mg/L. Asumir un nivel de significancia de 0.05. Hacer los
7-9
siguientes cálculos:
(a) Enlistar las suposiciones implicadas por el modelo de ANOVA.

(b) Hacer una tabla de análisis de varianza y probar que no hay diferencias entre
los 4 métodos.
(c) Estimar el valor de la probabilidad p y sacar las conclusiones apropiadas.
TABLA 7.8. Tabla con los datos. (Elaboración propia)

Tratamiento Resultados de los seis análisis en mg/L
(1) 99 40 61 72 76 84
(2) 96 84 82 104 99 105
(3) 63 57 81 59 64 72
(4) 79 92 91 87 78 71
Solución:
(a) Las suposiciones implicadas por el modelo de análisis de varianza de una sola
clasificación son:
1. Las cuatro poblaciones de los nitratos están normalmente distribuidas.
2. Las varianzas de las cuatro poblaciones de nitratos son iguales.
3. Las 24 observaciones (análisis) son independientes, es decir, que las muestras
fueron seleccionadas aleatoriamente.
(b) Usando el programa Minitab irse a:
Stat → ANOVA → One way (unstacked) da los iguientes resultados mostrados en
la Tabla 7.9.
7-10
TABLA 7.9. Tabla de ANOVA para los resultados de ejemplo de arriba usando el
Minitab. (Elaboración propia)
One-way ANOVA: Tratamiento 1, Tratamiento 2, Tratamiento 3, Tratamiento 4
Source DF SS MS F P
Factor 3 2940 980 5.99 0.004
Error 20 3272 164
Total 23 6212
√MS = √164 = s = 12.81 R-Sq = 47.33% R-Sq(adj) = 39.43%
Por otra parte, un método corto para hacer análisis de varianza de un sentido, es
decir, manualmente, se da usando el formato de la tabla de abajo.
TABLA 7.10. Tabla de análisis de varianza (ANOVA) para una clasificación, con
muestras de tamaños iguales usando el método abreviado. (Elaboración propia).
Fuente de Suma de los g.l. Cuadrado del Fcalc. Ftab. Valor

Variación cuadrados promedio de p
Debido al SSa = ∑T2/n – G2/an a–1 MSa = SSa/(a-1) MSa/s2e F[1-α;a-1,a(n-1)] Estimado
tratamiento
Residuo SSr = ∑X2 - ∑ T2/n a(n-1) s2e = SSr/a(n-1)
Total SSt = ∑X2 – G2/an na-1
Donde:
T2 = cuadrado de los totales
g.l. = ν = grados de libertad
G = gran total
a = número de muestras
7-11
Ejemplo #4. La tabla de abajo muestra los datos de los análisis de demanda
química de oxígeno (DQO) hechos por 3 laboratorios diferentes. Se tomaron 3
muestras de 5 observaciones cada una. Asumir que las 3 muestras vienen de
poblaciones normales aleatorias y que tienen la misma varianza. Asumir un nivel
de significancia de α = 0.05. Hacer lo siguiente:
(a) Una tabla con un análisis de varianza para el DQO.
(b) Establecer la región crítica.
(c) Probar la hipótesis nula de Ho: µ1 = µ2 = µ3, o sea que σ2µ = 0, es decir, que los
promedios de las tres poblaciones de DQO son iguales. Además, establecer la
hipótesis alternativa apropiada.
(d) Si se rechaza Ho: calcular el valor de la probabilidad p.
Se da la tabla de abajo con algunos cálculos preliminares:
TABLA 7.11. Tabla mostrando los cálculos preliminares. (Elaboración propia)
Número de muestra (1) (2) (3) Combinación
Observación 3 9 1
7 12 2
7 11 6
6 8 4
2 5 7
__________________________________________________________________
Totales 25 45 20 G = 90
Promedio X 5 9 4 X =6
Solución:
Usando las estadísticas de la TABLA 7.10, los cálculos son:
7-12
G = ΣT = ΣX = T1 + T2 + T3 +...+ Tk = 25 + 45 + 20 = 90, an = (3)(5) = 15

Promedio general o promedio de los promedios = X = G / an = 90 / 15 = 6
También, X = ( X 1 + X 2 + X 3) / a = (5 + 9 + 4) / 3 = 6
ΣX 2 = 688, n = 5, a = 3, ΣT2 / n = 3,050 / 5 = 610
SS(entre las muestras) = (ΣT2 / n) - (ΣT)2 / an = ΣT2 / n - G2/an
= (252 + 452 + 202)/5 - [(25 + 45 + 20)2] / [(3)(5)] = 70.0
Nota 1: la suma de los cuadrados SSa = SS(entre las muestras) mide la variación entre los
promedios muestrales a.
SS(dentro de las muestras) = ΣX 2 - ΣT2/n = Σ(X - X )2 = 688 - 610 = 78
Nota 2: SSr = SS(dentro de las muestras) mide la variación de las observaciones dentro de
los promedios muestrales.
SS(total) = SS(entre las muestras) + SS(dentro de las muestras)
= ΣX 2 - G2/an = Σ(X - X )2
Nota 3. SS(total) mide la variación total de las observaciones an.
La varianza de los promedios muestrales es:
s2 x = cuadrado del promedio de SS(entre las muestras) = Σ(X - X )2 / a-1
= [(5 - 6)2 + (9 - 6)2 + (4 - 6)2]/3 - 1
= (-12 + 32 - 22)/2
= 7.0
s2e = cuadrado del promedio de SS(dentro de las muestras)
= Σ(X - X )2 / a (n - 1)
= SS(dentro de las muestras) / a (n - 1)
= 78 / 3(5 - 1)
= 6.5
7-13
Método de comparaciones múltiples para saber cuales poblaciones son iguales

y cuales son desiguales
Una vez que se prueban las hipótesis de que los promedios son iguales, o
desiguales, entonces, necesitamos saber cuales promedios son desiguales y cuales
son iguales. Para esto, se usa lo que se llaman comparaciones múltiples explicados
por Walpole et al. 1993.
El análisis de varianza es un procedimiento poderoso para probar la
homogeneidad de un grupo de promedios. Sin embargo, si rechazamos la hipótesis
de igualdad (Ho:µ1 = µ2 = µ3 = µn), y nos inclinamos por la hipótesis alternativa de
qué, cuando menos dos de los promedios son iguales, todavía no sabemos cuales
de los promedios son iguales y cuales son desiguales. El uso del método de
comparaciones múltiples implica hacer varias comparaciones emparejadas entre
los tratamientos o promedios.
Por ejemplo, las comparaciones emparejadas son pruebas como la de abajo
las cuales dicen que son iguales o que no hay diferencia:
Ho:µi - µj = 0 (7-5)
H1:µi - µj ≠ 0 (7-5a)
Para hacer estas pruebas emparejadas usamos la versión de t de Estudiante de la
forma de:
Xi- Xj
t = _—————————− (7-6)
s 2/n
Donde:
X i = unos de los promedios que se quiera comparar
X j = otro de los promedios que se quiera comparar
7-14
s = desviación estándar combinada o la raíz cuadrada del cuadrático

promedio del error MS
n = tamaño de la muestra de cada tratamiento
Ejemplo #5. El libro Probabilidad y Estadístisca de Walpole et al. (1993) da un
ejemplo del uso de las comparaciones múltiples. La tabla de abajo da los datos
relacionados con este problema. Asumir un nivel de significancia de α = 0.05.
Estimar de valor de la probabilidad p.
Número de Agregados
1 2 3 4 5
551 595 639 417 563
457 580 615 449 631
450 508 511 517 522
731 583 573 438 613
499 633 648 415 656
632 517 677 555 679
Resolver los siguientes enunciados:

(a) Correr un análisis de varianza usando en paquete de computadora.
(b) Probar la hipótesis nula de que la población del agregado 1 es igual a la
población del agregado 5, es decir, Ho:µ1 = µ5 contra la hipótesis alternativa de
H1:µ1 ≠ µ5.
(c) Probar la hipótesis nula de que la población del agregado 4 es igual a la
población del agregado 5, es decir, Ho:µ4 – µ5 = 0, contra H1:µ4 - µ5 ≠ 0.
7-15
Solución:
Usando un programa de computadora como EXCEL da los siguientes resultados.
(a) La tabla de abajo muestra los resultados obtenidos usando el paquete de
computadora.
TABLA 7.13. Resultados usando análisis de varianza de un solo factor.
Análisis de varianza de un solo factor
Resumen
Grupos Conteo Suma Promedios Varianzas
Agregado 1 6 3320 553.3333 12133.87
Agregado 2 6 3416 569.3333 2302.667
Agregado 3 6 3663 610.5 3593.5
Agregado 4 6 2791 465.1667 3318.567
Agregado 5 6 3664 610.6667 3455.467
ANOVA
Fuente de Variación SS gl MS F calc. Valor-p F crit.
Entre los grupos 85356.47 4 21339.12 4.301536 0.008752 2.75871
Dentro de los grupos 124020.3 25 4960.813
Total 209376.8 29
Al juzgar por los resultados obtenidos se rechaza los hipótesis de igualdad de

promedios, es decir, Ho:µ1 = µ2 = µ3 = µ4 = µ5, con una probabilidad de p = 0.009.
(b) Ahora bien, para probar la hipótesis de que la población del agregado 1 es igual
a la población del agregado 5, se usa la relación: Ho:µ1 = µ5 y H1: µ1 ≠ µ5. Usando

la función (7-6) y sustituyendo los valores de µ1 = 553.33, µ5 = 610.67, desviación
estandar combinada = s = √ 4960.813 = 70.43 y n = 6 da:
Xi- Xj
t = ────────
s 2/n
7-16
t = (553.33 – 610.67) / [(70.43) (√ 2/6)] = -1.41

Para calcular el valor de la probabilidad p se busca el valor absoluto, |-1.41| en la
tabla de la distribución de t de Estudiante y está entre 0.05 y 0.10 y por
interpolación da p = 0.17. Este valor no es significante y, por lo tanto, se dice que
“tal vez” µ1 = µ5.
(c) Aquí se quiere probar la hipótesis nula de que no hay diferencias entre las
poblaciones de los agregados 4 y 5, esto es, Ho:µ4 = µ5. Para esto, se procede en
forma análoga al inciso (b) usando los valores de µ4 = 465.17, µ5 = 610.67, s =
70.43 y tamaño de muestra de n = 6. Sustituyendo todos estos valores en la función
(7-6) da:
t = (465.17 – 610.67) / [(70.43)(√ 2/6) = -3.58
Para calcular el valor de la probabilidad p se consulta la tabla de la
distribución de t con 25 grados de libertad y vemos que el valor p correspondiente
a 3.58 está entre .0005 < p < 0.001. Por interpolación, el valor calculado de p es
igual a 0.0008. Este valor apoya, definitivamente, la hipótesis alternativa de H1:µ4
≠ µ5.
Análisis de varianza de diseño de bloques completamente aleatorizados
Como se dijo anteriormente, el diseño de bloques completamente aleatorios se usa
para reducir el error experimental, ya sea debido a muestras pequeñas o debido a
variación inherente de las observaciones. Con este tipo de diseño por bloques
completos es posible controlar la variación dentro de las muestras (residual)
generada por algun factor indeseable. De manera qué, al bloquear las
observaciones, se reduce la variación, que tal vez no se pueda controlar cuando se
usan diseños completamente aleatorizados.
El diseño de bloques aleatorizados también se refiere como ANOVA con
7-17
dos factores, en el sentido de que se usa I para representar el número de niveles del
primer factor A y J para representar el número de niveles del segundo factor B
(bloques). Siendo así, hay IJ posibles combinaciones que constan de un nivel de
factor A y otro de factor B. Cada una de estas combinaciones se llama tratamiento,
por lo que hay IJ diferentes tratamientos. Aquí, en el diseño de bloques, el número
de observaciones hechas en el tratamiento IJ se representan con Kij = 1, el cual es
un caso especial del diseño de bloques aleatorizados, donde un solo factor A es de
interés principal, y el otro factor (B) bloques es incluido para reducir el error
experimental. En la siguiente discusión de ANOVA de dos factores, nos
centraremos en el caso de Kij = K > 1, para diferenciarlo del diseño de bloques
aleatorios con Kij = 1.
De cualquier manera, el término “bloque” se deriva de diseños
experimentales agrícolas, en los cuales las parcelas de tierras de cultivos se refieren
como “bloques”. Por ejemplo, en el caso del diseño de bloques aleatorios, los
tratamientos se asignan aleatoriamente a unidades dentro de cada bloque con
características de suelos semejantes. De no ser así, las parcelas a las que se le
aplica fertilizante, no todas pudieran tener el mismo tipo de tierra, nutrientes o
humedad, (lo que puediera causar variaciones en los rendimientos agrícolas). Al
agrupar las parcelas por características similares de suelos, minerales, nutrientes,
humedad, etc., el error experimental se reduce.
Otro ejemplo, es el relacionado con experimentos médicos. Por ejemplo, si
los tratamientos son 3 drogas y hay 24 pacientes, usando el diseño completamente
aleatorizado, 8 pacientes son asignados aleatoriamente a cada uno de los
tratamientos. Pero puede ocurrir que el historial clínico de los 24 pacientes no sea
el mismo, lo cual puede afectar su comportamiento a las drogas (lo que puede
7-18
causar un error o residual grande). Sin embargo, agrupando los pacientes por
historiales clínicos similares, edades, sexo, pesos, fumadores, tomadores,
orientaciones sexuales, etc., se controla esta variación.
En el caso de la ingeniería ambiental, usando modelos de contaminación
atmosférica, se esperaría que las concentraciones de los contaminantes
disminuyeran en función de la distancia (siempre y cuando las alturas de los
muestreadores fueran iguales, las condiciones metereológicas fueran uniformes y
el tipo terreno por donde está pasando la pluma fuera similar). Al controlar estos
factores, las concentraciones de los contaminantes disminuyen exponencialmente,
en función de la distancia de la fuente emisora, sin producir mucha variación.
La tabla de abajo da el ANOVA para el diseño de bloques completos.
TABLA 7. 14. ANOVA de un diseño aleatorizado por bloques completos.
Fuente de Suma de los Grados de Cuadrado Fcalc. Ftab. Valor de
variación cuadrados libertad medio p
Debido a los SSa a–1 MSa = SSa/(a – 1) MSa/s21 F[1-α;a-1,(a-1)(b-1)] Calculada
tratamientos
Debido a los SSb b–1 MSb = SSb/(b – 1) MSb/s22 F[1-α;b-1,(a-1)(b-1)]
bloques
Residual (Error) SSe (a – 1)(b – 1) MSe = SSe/[(a – 1)(b - 1)]
Total SSt ab – 1
____________________________________________________________________________________
Donde:
a
SSa = b Σ ( y i. – y .. )2 Suma de cuadrados de tratamientos (7-7)
i=1
b
SSb = a Σ ( y .j – y .. )2 Suma de cuadrados de bloques (7-8)
J=1
7-19
a b
SSe = Σ Σ (yij – y i. – y .j + y .. )2 Suma de cuadrados del error (7-9)
i=1 j=1
a b
SSt = Σ Σ (yij – y ..)2 Suma total de los cuadrados (7-10)
i=1 j=1
Donde:
y i. = promedio de las observaciones para el i-ésimo tratamiento
y .j = promedio de las observaciones para el j-ésimo bloque
y .. = promedio de todas las ba observaciones o el promedio de los promedios
yij = j-ésima observación del i-ésimo tratamiento

Suposiciones del modelo de bloques aleatorios completos
El modelo o diseño de bloques aleatorios completos asume cuatro suposiciones
(Dunn et al. 1974) :
1. La respuesta al i-ésimo tratamiento en el j-ésimo bloque proviene de una
distribución normal.
2. Los promedios de las distribuciones normales ab pueden expresarse en la forma
de µ + α + β. Esta propiedad usualmente se llama aditividad o no interacción.
3. Las varianzas de las poblaciones ab son todas iguales. Esto se llama
homoscedasticidad. Este término se discutirá, nuevamente, en el capítuo de
regresión y correlación.
4. Las deviaciones de los promedios εij son independientes. Por ejemplo, si se sabe
que ε11 es grande, no se puede esperar que ε12 sea pequeña o grande.
Una suposición importante del modelo para un diseño de bloques completos
aleatorizados es que los efectos de tratamiento y de bloqueo se asumen que son
aditivos. Por ejemplo, para ilustrar esta situación, si se grafican los promedios
7-20
poblacionales versus tratamientos, digamos de los bloques 1 y 2 y, si las gráficas

son paralelas, se dice que los efectos de tratamiento y de bloques son aditivos o
que no interactúan. Sin embargo, si las líneas de la gráfica se cruzan entre si, se
dice que hay interacción. En este renglón, si no se cumple la condición de
aditividad, esto conduce a conclusiones erróneas.
El diseño completamente aleatorio, tiene muchas aplicaciones en la
producción industrial y en a modelos educativos. Para esto vamos a usar un
ejemplo para ilustrar esta situación.
Ejemplo #6. Supóngase que 4 diferentes máquinas son manejadas por 4 operadores
diferentes. Se quiere saber si los operadores difieren con respecto a la
productividad de tiempo, cuando son asignados a variados tipos de maquinarias.
Aplicar el análisis de varianza más apropiado para este problema, usando α = 0.05.
Sacar conclusiones al respecto usando un paquete de computadora. Los datos se
dan en la tabla de abajo:
TABLA 7.15. Tabla mostrando la productividad por tiempo de los diferentes
operadores asignados aleatoriamente a 4 tipos de máquinas diferentes.
Operadores
Máquinas 1 2 3 4
A 68.5 79.2 83.8 87.5
B 72.2 80.6 89.3 95.3
C 73.3 80.2 88.0 94.1
D 81.1 88.8 95.2 100.5
Solución:
7-21
Usando un paquete de computadora como Excel, se procede como:

Tools → Data Analysis → Analysis Tools → Anova: Two Factors Without
Replication (Aquí, sin embargo, hay que instalar el módulo de Data Analysis)
Las pruebas de hipótesis para los operadores y las máquinas se establecen de la
siguiente manera:
Ho: Los operadores no difieren con respecto al promedio de productividad por
tiempo, contra H1: Los operadores si difieren con respecto al promedio de
productividad por tiempo
Ho: Las máquinas no difieren con respecto al promedio de productividad por
tiempo, contra H1: Las máquinas si difieren con respecto a la productividad
Usando el programa Excel da los siguientes resultados mostrados abajo.
TABLA 7.16. Tabla mostrando el análisis de varianza con dos factores.
Anova con dos factores
RESUMEN Conteo Suma Promedio Varianza

Máquina A 4 319 79.75 67.77667
Máquina B 4 337.4 84.35 102.03
Máquina C 4 335.6 83.9 82.3
Máquina D 4 365.6 91.4 70.03333
Operador 1 4 295.1 73.775 28.0625

Operador 2 4 328.8 82.2 19.70667
Operador 3 4 356.3 89.075 22.1825
Operador 4 4 377.4 94.35 28.57
Tabla de ANOVA
Fuente de variación SS gl MS Fcalc. Valor de p Fcrítica
Maquinaria 280.26 3 93.42 54.93499 .00000414 3.862548
Operadores 951.115 3 317.0383 186.4322 .00000002 3.862548
Error 15.305 9 1.700556
Total 1246.68 15
7-22
Conclusión:
Con respecto a la maquinaria, debido a que el valor de la Fcalc. = 54.9 >>> Fcrítica se
rechaza Ho: Esta decisión es mucho muy significativa, al juzgar por el valor de p =
.000004. Las máquinas sí difieren muy significantemente, con respecto a la
productividad. Con respecto a los operadores, debido a que el valor de Fcalc. = 186.4
>>>> Fcrítica se rechaza Ho: Esta decisión es mucho, mucho muy significante al
juzgar por el valor de p = 2x10-8. Los operadores sí difieren muy
significantemente, con respecto a la productividad de tiempo. Esto es apoyado,
muy contundentemente, por el valor tan bajo de la probabilidad p.
Ejemplo #7. Este es un ejemplo relacionado con un experimento de bloques
aleatorios completos para determinar los efectos corrosivos de cuatro sustancias
químicas diferentes, v.g., HCl, H2SO4, HNO3 y HF. Es decir, ácidos gaseosos que
entran en el flujo de aire (flujo transportador que entra al equipo de control, el cual
se genera de un procesamiento industrial), que pasan por los filtros, es decir, en las
telas usadas en los filtros o baghouses (hechas de fibra de vidrio, asbestos, dacron,
nilón, polietileno), para controlar la contaminación del aire. Para tales fines se
seleccionan cinco muestras de telas y se aplica un diseño aleatorio por bloques
completos, por medio de probar cada sustancia química, en un orden aleatorio,
sobre cada una de las muestras de las telas. Sacar las conclusiones debidas. Los
datos se dan en la tabla de abajo. Hacer lo siguiente:
(a) Probar la hipótesis nula de igualdad de promedios
(b) Hacer una tabla de análisis de varianza de diseño aleatorizado por bloques
completos. Sacar las conclusiones apropiadas
7-23
TABLA 7. 17. La respuesta de los índices de corrosividad de las cuatro sustancias

químicas en las muestras de telas. (Elaboración propia)
Tipos de telas
_________________________________________
Sustancias químicas Vidrio asbestos dacron nilón polietileno
HCl 1.8 2.1 1.1 1.7 1.6
H2SO4 2.7 2.9 0.8 2.5 2.5
HNO3 2.3 2.3 1.1 2.0 1.8
HF 4.4 4.8 2.5 4.4 3.9
Los resultados usando el paquete de Excel se dan abajo.

TABLA 7.18. Resultados de las resistencias a la corrosión de las telas usando un
diseño aleatorizado de bloques completos.
Anova de dos factores sin replicaciones
Resumen Conteo Suma Promedio Varianza

HCl 5 8.4 1.68 0.157
H2SO4 5 11.4 2.28 0.712
HNO3 5 9.5 1.9 0.245
HF 5 19 3.8 0.605
Vidrio 4 11.2 2.8 1.273333

Asbestos 4 11.2 2.8 0.54
Dacron 4 5.5 1.375 0.5825
Nilón 4 10.6 2.65 1.47
Polietileno 4 9.8 2.45 1.083333
Tabla de ANOVA
Valor de
Fuente de variación SS gl MS Fcalc. p Fcritica
Debido a los ácidos 13.7095 3 4.569833 48.18805 5.75E-07 3.490295
Debido a las telas 5.738 4 1.4345 15.12654 0.000123 3.259167
Error 1.138 12 0.094833
Total 20.5855 19
Debido a que el valor de la Fcalc. = 48.19 > F0.05,3,12 = 3.49 se rechaza la hipótesis
7-24
nula de igualdad de tratamientos, y se dice que hay una diferencia muy

significativa en la acción de los ácidos, en cuanto el efecto que tienen sobre la
resistencia promedio de las telas. Esta contención está muy bien sustentada por el
valor tan pequeño de p = 5.75x10-7.
Por otra parte, en cuanto a modelos estadísticos para controlar la variación,
existe otro tipo de diseño para reducir el error experimental llamado cuadrados
latinos. Aún, cuando el diseño en bloques aleatorizados es muy efectivo para
reducir el error experimental (residual), al eliminar una fuente de variación, los
cuadrados latinos son muy útiles para reducir dos fuentes de variación, mientras se
reduce el número de combinaciones. Este diseño, sin embargo, no se discutirá en
este texto.
Clasificaciones cruzadas: Análisis de varianza en dos sentidos
El análisis de varianza en dos direcciones o de dos clasificaciones o de dos
sentidos es útil para estudiar dos tipos diferentes de tratamientos. La característica
del diseňo factorial en dos sentidos es que, cada nivel de un factor, se usa en
combinación con cada nivel del otro factor. Por ejemplo, considérese el caso de n
réplicas de las combinaciones del tratamiento que se determinan por a niveles del
factor A y b niveles del factor B. En este aspecto, las observaciones se estructuran
por medio de un arreglo rectangular, donde los renglones representan los niveles
del factor A y las columnas representan los niveles del factor B. Siendo así, hay ab
celdas, cada una de las cuales contenienen n observaciones (tamaňo de la muestra).
Por ejemplo, si un ingeniero agrónomo investiga el comportamiento de dos
tipos de semillas, por medio de variar el nivel del fertilizante, digamos, a tres
niveles, alto, mediano y bajo, un factor sería el tipo de semilla y el segundo factor
sería el nivel de fertilizante. Este sería un ejemplo factorial con dos factores, el
7-25
cual consistiría en usar seis tratamientos formados por medio de usar cada tipo de
semilla con cada nivel de fertilizante.
Otro ejemplo, de ANOVA de dos factores está relacionado con la medición
de las concentraciones de contaminates del aire emitidos por una fuente industrial.
Aquí para un factor se pueden seleccionar diferentes niveles distancias de la fuente
emisora y, para el otro factor, se pueden seleccionar diferentes alturas donde están
situados los muestreadotes (porque la altura afecta las concentraciones).
Interacción con ANOVA de dos factores
Cuando se estudian experimentos factoriales es importante determinar si los
factores principales tienen una influencia en la respuesta, sino también analizar lo
que se llama interacción (no aditividad) entre los factores. El texto de Dunn et al.
(1974) aplica un experimento de dos clasificaciones, para explicar el concepto de
la interacción. Por ejemplo, en la Figura 7.2, en un experimento que involucra tres
niveles de agua y tres niveles de fertilizante, las líneas son paralelas, lo que indica
que no hay interacción, o sea que hay independencia en los datos. Sin embargo, en
la Figura 7.3 se observa qué, en ambas gráficas hay una respuesta promedio con
interacción, es decir, que hay dependencia. Por ejemplo, en la primera gráfica un
nivel alto de fertilizante interacciona positivamente con un nivel alto de agua;
mientras que en la segunda gráfica niveles altos de agua y fertilizante resultan en
una respuesta baja, en comparación con la respuesta a niveles bajos y medianos de
agua. En términos simples, se dice que hay interacción entre dos factores (digamos
A y B), si el cambio en uno de los factores (digamos factor B) produce un cambio
en respuesta a un nivel (digamos nivel 1) del otro factor (digamos A) diferente de
aquél producido en los otros niveles (digamos nivel 2) de este segundo factor A,
donde un nivel es uno de los tratamientos dentro de un factor.
7-26
Figura 7.2. Gráfica indicando una respuesta promedio sin interacción (aditividad),
o sea que hay independencia en los datos. (Dunn et al. 1974).
Figura 7.3. Gráficas indicando una respuesta promedio con interacción (no
aditividad) o sea que hay dependencia entre los datos. (Dunn et al. 1974).
Cuando ocurre una interacción en algún experimento es importante
investigar porque ocurrió. Por ejemplo, cuando se establece la tabla de análisis de
varianza, se estudian los comportamientos de los efectos principales y también, la
posible interacción entre los dos factores bajo estudio. En términos estadísticos, si
la F calculada es mayor que la F crítica eso indica que los factores están
7-27
interactuando. No obstante, la interacción puede ocurrir por mera casualidad. Pero

también la interacción puede ocurrir, causalmente, debido a algún valor extremo o
a algún factor que no se ha podido controlar. La interacción, también se puede
deber a algún problema en los datos o a una respuesta errónea. De cualquier
manera cuando los datos obtenidos indican que existe una interacción grande, los
efectos principales correspondientes serán de poca utilidad.
De esta manera, en el ejemplo #7 de abajo, hay interacciones entre las
alturas y las distancias. Cuando se modelan las emisiones de contaminantes
atmosféricos, hay muchas variables que pueden afectar los resultados. En este
ejemplo, tal vez hubo cambios metereológicos imprevistos, emisiones fugitivas o
diferencias en los tipos de terreno por donde pasa la pluma de la chimenea. Esto
pudo contribuir a la interacción de los dos factores estudiados en ese ejemplo.
Situaciones similares pueden ocurrir en estudios de agricultura. Por ejemplo,
si el ingeniero agrónomo desea estudiar los rendimientos agrícolas usando dos
factores, como el tipo de semilla y la cantidad de fertilizante aplicado, tiene que
analizar si hubo interacción entre los factores semilla-fertilizante. Si hay
interacción entre estos dos factores, esto pudo deberse a que, en las parcelas
seleccionadas para los cultivos experimentales, no había uniformidad de variables
como humedad, tipos de suelos, o de cantidad de nutrientes. Para remediar esta
situación se tendría que hacer un experimento por bloques aleatorizados, es decir,
teniendo cuidado de que las parcelas agrícolas fueran todas uniformes en las
variables anteriormente descritas.
De cualquier manera, la tabla de abajo muestra el formato que se usa para
experimentos factoriales en dos sentidos o con dos tratamientos.
7-28
La TABLA 7.19 de abajo muestra el formato que se sigue para los análisis de
varianza en dos sentidos.
TABLA 7. 19. Tabla de análisis de varianza en dos sentidos. (Elaboración propia)
Fuente de SS g.l. MS Fcalc. Ftab.
variación
Efecto principal
Debido a A SSa a-1 MSa= SSa/(a-1) F1 = MSa/s2e F[1-α;a-1,ab(n-1)]
Debido a B SSb b-1 MSb = SSb/(b-1) F2 = MSb/s2e F[1-α;b-1,ab(n-1)]
Interacción de
dos factores
Debido a AB SSab (a-1)(b-1) MSab = SSab/(a-1)(b-1) F3 = MSab/s2e F[1-α;(a-1)(b-1),ab(n-1)]
Residual SSe ab(n-1) s2e=SSe/[ab(n-1)]
Total SSt abn-1
Donde:
a
Σ ( y i.. - y …)2
SSa = bn i=1 (7-11)
b
Σ ( y .j. - y ... )2
SSb = an J=1 (7-12)
a b
SSab = n i=1 Σ ( y ij. - y i.. - y .j. + y …)2
Σ j=1 (7-13)
a b n
SSe = i=1
Σ Σ Σ (yijk - y ij.)2
j=1 k=1
(7-14)
a b n
SSt = i=1
Σ Σ Σ (yijk – y …)2
j=1 k=1
(7-15)
7-29
A = variación debido al primer factor A

B = variación debido al segundo factor B
AB = interacción entre el factor A y B (interacción que ocurre cuando no hay
aditividad)
s21, s22, s23 y s2e son la formación de los cuadrados medios y se obtienen
dividiéndolos entre sus correspondientes grados de libertad
y = suma de las observaciones en la (ij)-ésima celda
ijk
y i.. = promedio de las observaciones para el i-ésimo nivel del factor A
y … = promedio de todas las abn observaciones

y .j. = promedio de las observaciones para el j-ésimo nivel del factor B
y ij. = promedio de las observaciones en la (ij)-ésima celda
yijk = k-ésima observación en el i-ésimo nivel del factor A y el nivel j-ésimo nivel
del factor B
a = número de muestras del primer factor
b = número de muestras del segundo factor
n = número total de casos
En el análsis de varianza de dos sentidos, para el modelo bajo estudio se

divide cada observación yijk en cuatro partes y la quinta en las desviaciones de las
observaciones del promedio poblacional (Dunn et al. 1974). Esto es:
yijk = µ + αi +βj + (αβ)ij + εijk para i = 1,…. , a; j = 1,…., b; k = 1,..., n, (7-16)
Donde:
a b a b
Σ αi = Σ βj = Σ (αβ)ij = Σ (αβ)ij = 0 (7-17)
i=1 j=1 i=1 j=1
Y donde:
7-30
µ = respuesta promedio del conjunto o la respuesta promedio de las poblaciones

ab; αi = el efecto del i–ésimo nivel del factor A promediado sobre b niveles del
factor B; βj = efecto j–ésimo nivel del factor B; (αβ)ij = interacción entre el i–ésimo
nivel del factor A y el j–ésimo nivel del factor B y; εijk = desviación de las
observaciones yijk de la respuesta del promedio poblacional para la ij-ésima
población.
Aquí, es importante recapitular las suposiciones del model de ANOVA en
dos direcciones, es decir:
1. Los errores εijk deben ser independientes
2. Los residuales εijk deben estar normalmente distribuidos
3. Los residuales εijk deben de venir de una población con la misma varianza
De no cumplirse con estas suposiciones, el diseño será incierto.
Ejemplo #8. Para estudiar los efectos de la altura y la distancia en las
concentraciones de contaminantes atmosféricos (SO2) emitidos por una chimena
industrial se instalaron tres muestreadores, a tres alturas diferentes (3 niveles de A)
y, a cuatro distancias diferentes (4 niveles de B) viento abajo de la fuente emisora.
Para esto se dan los siguientes avances informativos: SSa = 7.00, SSb = 20.00, SSe
= 7.0 y SSt = 45.00. Asumiendo un nivel de significancia de α = 0.05, resolver los
siguientes enunciados:
(a) Establecer una tabla de análisis de varianza.
(b) Hacer pruebas de F para demostrar que ninguno de los valores de F para
interacciones de la altura y la distancia es significativo. Probar la hipótesis nula
H’o: de que no hay diferencias en las concentraciones promedio de SO2 en las
distancias, cuando se usan tres alturas diferentes, en las cuales fueron situados los
muestredores que están midiendo las concentraciones del bióxido de azufre.
7-31
Además, probar la hipótesis nula H’’o: de que no hay diferencia en las

concentraciones promedio en las cuatro distancias a las que se situaron los
sensores. Finalmente, probar la hipótesis nula H’’’o: de que no hay interaccion
entre las diferentes alturas y las diferentes distancias de los sensores.
(c) Ver cuales efectos principales son significativos.
(d) Calcular los valores de p.
Solución:
(a) La tabla de ANOVA con los valores sustituidos se da abajo.
TABLA 7.20. Tabla de ANOVA para el problema de los efectos de la altura y la
distancia en las concentraciones de contaminantes del aire.
__________________________________________________________________
Fuente de Suma de los g.l. Cuadrado medio Fcalc. Ftab. Valor p
variación cuadrados (SS) (MS)
______________________________________________________________________________
Debido a la 7.00 2 3.50 6.03 3.89 .001 < p < .01
altura (A)
Debido a la 20.00 3 6.67 11.50 3.49 p << .001
distancia (B)
Debido a la 11.00 6 1.83 3.16 3.00 .01 < p < .05
interacción de AB
Debido al error 7.00 12 0.58
Total 45.00 23
____________________________________________________________________________
(b) Las tres pruebas de hipótesis nulas se establecen de la siguiente manera:
H’o:α1 = α2 = α3 = 0 (no hay diferencias en las concentraciones promedio de SO2
cuando se sitúan los sensores a las diferentes alturas)
H’’o: β1 =β2 = β3 = β4 = 0 (no hay diferencias en las concentraciones de SO2, en las
7-32
cuatro distancias de la fuente emisora)

H’’’o: (αβ)11 = (αβ)12 = ….. = (αβ)24 = 0 (no hay interacción entre las diferentes
alturas y las diferentes distancias
Las pruebas de hipótesis alternativas son:
H’1: Cuando menos una de las concentraciones αi (por la altura) difiere de cero
H’’1: Cuando menos una de las concentraciones βi (por la distancia) difiere de cero
H’’’1: Cuando menos una de las (αβ)ij (interacción altura-distancia) difiere de cero
Conclusión: Se rechaza H’o: y se concluye que las concentraciones de SO2 por el
efecto de la altura son diferentes, a aquéllas debidas al efecto de la distancia. Esta
contención es apoyada por el valor de p = .022. Análogamente, H’’o: también se
rechaza con un valor muy significativo de p << .001. La interacción entre la altura
y la distancia, es decir, Fcalc. = 3.16 > Ftab. = 3.00 está en el umbral de la
interacción, con un valor de p = .05. Esto indica que la interacción debe de
considerarse. Esto quiere decir que tienen que considerarse variables como el tipo
de terreno, cambios imprevistos en las condiciones meteorológicas, sensores mal
situados, mal funcionmiento del equipo, emisiones fugitivas, cuerpos de agua, y asi
sucesivamente.
(c) y (d) explicados por el inciso (a). De acuerdo a la tabla todos los efectos son
significativos, especialmente, debido a la distancia.
Ejemplo #9. El libro Applied Statistics: Análisis of Variance and Regresión de
Dunn, et al. (1974) hace un estudio de ANOVA de dos clasificaciones relacionado
con el rendimiento de cebada. En este experimento se involucran dos tipos de
semillas (1 y 2), cada uno de estos factores usados en tres niveles de fertilizantes,
es decir, bajos, medianos y altos. La tabla de abajo muestra la información
requerida para este problema.
7-33
TABLA 7.21. Producción de cebada en fanegas por acre. (Dunn et al. 1974)
Nivel de fertilizante
Tipo de semilla Bajo Mediano Alto
1 14.3 18.1 17.6
14.5 17.6 18.2
11.5 17.1 18.9
13.6 17.6 18.2
y 11. = 13.475 y 12. = 17.600 y 13. = 18.225 y 1.. = 16.433
----------------------------------------------------------------------------------------------------
2 12.6 10.5 15.7
11.2 12.8 17.5
11.0 8.3 16.7
12.1 9.1 16.6
y 21. = 11.725 y 22. = 10.175 y 23. = 16.625 y 2.. = 12.842
y .1. = 12.600 y .2. = 13.888 y .3. = 17.425 y … = 14.638
Con a = 2, b = 3 y n = 4
2
SSa = bn Σ ( y i.. - y …)2 = (3)(4)[16.443 - 14.638)2 + (12.842 - 14.638)2]
i=1
= (12)[3.258 + 3.226] = 77.80

3
SSb = an Σ ( y .j. - Y …)2 = (2)(4)[(12.600 - 14.638)2 + (13.89 - 14.638)2
j=1
+ (17.43 - 14.638)2 ]
= (8)[4.153 + 0.550 + 7.795) = 99.9

2 3
SSab = n Σ Σ ( Y ij. - Y i.. - Y .j. + Y ...)2
i=1 j=1
= (4) {[(13.475 - 16.433 - 12.600 + 14.638)2 + (17.600 - 16.433 - 13.888 + 14.638)2

+ (18.225 - 16.433 - 17.425 + 14.638)2] + [(11.725 -12.842 - 12.60 + 14.638)2
+ (10.175 - 12.842 - 13.888 + 14.638)2 + (16.625 - 12.842 - 17.425 + 14.638)2]}
= (4)(0.8464 + 3.706 + 0.990 + 0.848 + 3.675 + 0.992) = 44.229
7-34
a b n
SSe = i=1
Σ Σ Σ (yijk - y ij.)2
j=1 k=1
= {[(14.3 – 13.475)2 + (14.5 – 13.475)2 + (11.5 – 13.475)2 + (13.6 – 13.475)2]

+ [(18.1 – 17.600)2 + (17.6 – 17.600)2 + (17.1 – 17.600)2 + (17.6 – 17.600)2]
+ [(17.6 – 18.225)2 + (18.2 – 18.225)2 + (18.9 – 18.225)2 + (18.2 – 18.225)2]
+ [(12.6 – 11.725)2 + (11.2 – 11.725)2 + (11.0 – 11.725)2 + (12.1 – 11.725)2]
+ [(10.5 – 10.175)2 + (12.8 – 10.175)2 + (8.3 - 10.175)2 + (9.1 – 10.175)2]
+ [(15.7 – 16.625)2 + (17.5 – 16.625)2 + (16.7 – 16.625)2 + (16.6 – 16.625)2}
= (3.900 + 0 + 0.5 + 0.141 + 11.668 + 1.629) ≈ 22.0
a b n
SSt = i=1
Σ Σ Σ (yijk – y …)2 = SSa + SSb + SSab + SSe = 243.93
j=1 k=1
Ahora, se sustituyen todos los cálculos hechos manualmente, para obtener la tabla
de debajo de dos clasificaciones cruzadas o de doble sentido.
TABLA 7.22. Tabla de análisis de varianza para el experimento agrícola de dos
tipos de semillas con tres niveles diferentes de fertilizantes. (Dunn et al. 1974)
Fuente de variación SS g.l. MS Fcalc. Ftab. Valor de p

Debido a las semillas (A) 77.80 1 77.8 64.8 4.41 <<<< .001
Debido a los niveles (B) 99.90 2 49.9 41.6 3.55 <<< .001
del fertilizante
Interacción de semilla 44.23 2 22.1 18.4 3.55 << .001
y fertilizante (AB)
Residual 22.0 18 1.2
Total 243.93 23
En conclusión, debido a que la Fcalc. es mucho mayor que la Ftab., es decir, 64.8 >>
4.41 se rechaza la hipótesis de que no hay diferencia entre las semillas, y nos
inclinamos por la hipótesis alternativa, es decir, H1:µ1 ≠ µ2 ≠ µ3 ≠ µ4. Esta
7-35
decisión es apoyada por un valor de p muy sigificativo. Situación similar ocurre

con los niveles de fertilizantes. Sin embargo, en cuanto a la interacción se ve que
los factores semilla y niveles de fertilizante están interactuando, esto es debido a
que 18.4 > 3.55. Por lo tanto, se concluye que hay interacción entre el tipo de
semilla y el nivel de fertilizante. En este caso la interacción pudo ocurrir por mera
casualidad, pero también pudo ocurrir por algun valor extremo o por algún
problema relacionado con el diseño experimental.
Análisis de varianza de tres sentidos: diseño completamente aleatorio
Por otra parte, cuando se habla de análisis de varianza con clasificaciones cruzadas
o diseños factoriales, hay también experimentos que involucran más de dos
factores, lo cual nos lleva a análisis de varianza de clasificaciones en tres sentidos.
Aquí, es necesario decir, que en el caso de modelos de ANOVA factoriales en tres
clasificaciones pueden ser los tres fijos, los tres aleatorios, uno aleatorizado y dos
fijos, o dos aleatorizados y el otro fijo. Sin embargo, aquí se considerarán
unicamente experimentos con tres factores fijos A, B y C, en los niveles a, b y c,
respectivamente en diseños experimentales completamente aleatorizados.
Los números de los niveles de los tres factores están representados por I, J y
K, respectivamente, y Lijk es igual al número de observaciones hechas con el factor
A al nivel i, factor B al nivel j y factor C al nivel k. Aquí, sin embargo, es necesario
afirmar que el análisis factorial es muy complicado cuando los valores de Lijk no
son todos iguales, por lo tanto, en este estudio esto se limitará a Lijk = L.
En el experimento de la producción de cebada, teníamos dos niveles, es
decir, el factor semilla y el factor fertilizante, pero si este experimento se hiciera
con un análisis de varianza de tres sentidos, se le pudiera agregar otro factor más,
es decir, dos niveles de agua. Bajo estas condiciones hubiera 12 combinaciones de
7-36
tratamientos, y se asumiría que 48 parcelas fueran asignadas aleatoriamente a los

12 combinaciones de tratamientos.
Otro experimento relacionado con la ingeniería ambiental atmosférica sería
usando tres factores para medir las concentraciones de gases y partículas
contaminantes, como por ejemplo, SO2, NO2, Pb, Cd, etc. Es decir, para ver los
efectos que tendrían factores como diferentes elevaciones, diferentes distancias y
diferentes tipos de sensores, diferentes tipos de terrenos o condiciones
metereológicas. Las clasificaciones cruzadas con tres factores, tradicionalmente, se
diseňaron para experimentos agrícolas, pero también tienen muchas aplicaciones
en otras áreas. La TABLA 7.23 muestra el formato usado para experimentos
factoriales de tres factores fijos.
TABLA 7.23. Tabla de ANOVA con tres factores fijos. (Elaboración propia)
Fuente de SS g.l. Cuadrado Fcalc. Ftab.
variación medio
Efectos principales
A SSa a–1 MSa = SSa/(a-1) MSa/s21 F1[1-α;a-1,abc(n-1)]
B SSb b–1 MSb = SSb/(b-1) MSb/s22 F2[1-α;b-1,abc(n-1)]
C SSc c–1 MSc = SSc/(c-1) MSc/s23 F3[1-α;c-1,abc(n-1)]
Interacción de
dos factores
AB SSab (a-1)(b-1) MSab = SSab/(a-1)(b-1) MSab/s24 F4[1-α;(a-1)(b-1),abc(n-1)]
AC SSac (a-1)(c-1) MSac = SSac/(a-1)(c-1) MSac/s25 F5[1-α;(a-1)(c-1),abc(n-1)]
2
BC SSbc (b-1)(c-1) MSbc = SSbc/(b-1)(c-1) MSbc/s 6 F6[1-α;(b-1)(c-1),abc(n-1)]
Interacción de
tres factores
ABC SSabc (a-1)(b-1)(c-1) MSabc = SSabc/[(a-1)(b-1)(c-1)] MSabc/s27 F7[1-α;(a-1)(b-1)(c-1),abc(n-1)]
Residual SSe abc(n-1) s2e = SSe/[abc(n-1)]
Total SSt abcn-1
_____________________________________________________________________________________
7-37
Donde:
a
SSa = bcn Σ ( y i... – y ....)2 (7-18)
i=1
b
SSb = acn Σ ( y .j.. – y ….)2 (7-19)
j=1
c
SSc = abn Σ ( y ..k. – y ....)2 (7-20)
k=1
a b
SSab = cn Σ Σ ( y ij.. – y i… - y .j.. + y ….)2 (7-21)
i=1 j=1
a c
SSac = bn Σ Σ ( y i.k. – y i… - y ..k. + y ….)2 (7-22)
i=1 k=1
b c
SSbc = an Σ Σ ( y .jk. – y .j.. – y ..k. + y ….)2 (7-23)
j=1 k=1
a b c
SSabc = n Σ Σ Σ ( y ijk. – y ij.. – y i.k. – y .jk. + y i… + y .j.. + y ..k. – y ….)2 (7-24)
i=1 j=1 k=1
a b c n
SSe = Σ Σ Σ Σ (yijkl – y ijk.) (7-25)
i=1 j=1 k=1 l=1
a b c n
SSt = Σ Σ Σ Σ (yijkl – y ....) (7-26)
i=1 j=1 k=1 l=1
La simbología usada en las fórmulas anteriores se define de la siguiente manera:

y i… = promedio de las observaciones para el i-ésimo nivel del factor A
y .... = promedio de todas las abcn observaciones
y .j.. = promedio de las observaciones para el j-ésimo nivel del tratamiento B
y ..k. = promedio de las observaciones para el k-ésimo nivel del tratamiento C
7-38
y ij.. = promedio de los casos para el i-ésimo nivel del factor A y el j-ésimo nivel del
factor B
yijkl = denota la l-ésima observación de la combinación del tratamiento ijk-ésimo
Los investigadores estadísticos Dunn et al. (1974) proporcionan el modelo
para el análisis de varianza en tres sentidos, esto es:
yijkl = µ + αi + βj + (αβ)ij + (αγ)ik + (βγ)jk + (αβγ)ijk + εijkl (7-27)
Donde:
µ = promedio total de los tres tratamientos abc
αi = efecto promedio del nivel i-ésimo del factor A
βj = efecto promedio del nivel j-ésimo del factor B
γk = efecto promedio del nivel k-ésimo del factor C
(αβ)ij = interacción de los factores A y B, es decir, del nivel i-ésimo del factor A con
el nivel j-ésimo del factor B
(αγ)ik = interacción de los factores A y C, es decir, del nivel i-ésimo del factor A
con el nivel k-ésimo del factor C
(βγ)jk = interacción de los factores B y C, es decir, del nivel j-ésimo del factor B
con el nivel k-ésimo del factor C
(αβγ)ijk = interacción de los factores A, B y C, es decir, las interacciones entre el
nivel i-ésimo del factor A con el nivel j-ésimo del factor B y con el nivel k-ésimo
del factor C
Interacción con ANOVA de diseños factoriales de tres clasificaciones
En cuanto al impacto de interacciones, cuando se diseñan análisis de varianza en
tres sentidos, es importante estar consciente de esta situación, porque la interaccion
puede impactar la interpretación que se hace con respecto a los efectos principales.
7-39
Además, la presencia de interacción puede descubrir situaciones importantes que

pueden ayudar a modificar el diseño experimental original, para hacerlo más
representativo. Las interacciones usualmente ocurren cuando los efectos
principales son muy grandes, pero pueden desaparecer cuando el investigaor
estadístico aminora las diferencias entre los niveles de un tratamiento, haciendo,
con esto, que los efectos principales sean menos pronunciados (Dunn et al. 1976)
Con relación a las mediciones de la contaminación del aire usando modelos
de difusión atmosférica, es decir, para validar estudios de difusión atmosférica, o
para hacer estudios de impacto ambiental, una aplicación sería medir las
concentraciones que ocurren a lo largo de la pluma. Para un diseño factorial con
tres tratamientos, se puede agregar otro factor más al ejemplo de la difusión
atmosférica con dos tratamientos, explicado anteriormente. En este caso, además
de los factores distancia y altura, le podemos agregar un tercer factor relacionado
con diferentes marcas de muestreadores.
En cuanto el efecto de interacción, en estudios de impacto ambiental usando
modelos de difusión atmosférica, la interacción de los factores, bajo estudio, puede
descubrir situaciones que puedan afectar el estudio. Aunque si bien, los modelos de
difusión atmosférica asumen condiciones climatológicas uniformes, no obstante,
emisiones fugitivas o las diferencias en los tipos de terrenos como arena, arcilla,
piedras, agua, tipo de vegetación, etc., por donde pasa la pluma de la chimenea
pueden ocasionar que los factores bajo estudio, interactúen.
Situaciones similares pueden ocurrir con diseños factoriales aplicados a la
agricultura cuando se aplican dos factores como tipos de semilla y niveles de
fertilizantes. Aquí se le puede agregar otro factor más, digamos, el nivel de agua
para hacer un diseño factorial, es decir, con tres factores. Sin embargo, si hay
7-40
interacción, tal vez los tipos de suelos de las parcelas no tienen las mismas
características, es decir, de humedad, de tipos de suelos, tipos de temperaturas,
tipos de nutrientes, etc., en cuyo caso hay que remitirnos a los diseños de bloques
completamente aleatorizados.
Ejemplo #10. En un estudio hipotético de difusión atmosférica, es decir, usando un
modelo de difusión atmosférica, se hicieron mediciones en cuatro distancias
diferentes a lo largo de la pluma (500, 1000, 1200 y 1500 metros), en dos alturas
diferentes, (500 y 800 metros), con cuatro marcas diferentes de sensores, y con
tamaños de muestras de 3 observaciones para cada una de las combinaciones de
niveles de los tres factores. Para esto se da una avanzada de los valores en la
siguiente forma: Suma de los cuadrados del factor A = SSa = 1.50, suma de los
cuadrados del factor B = SSb = 19.35, suma de los cuadrados del factor C = SSc =
147.00, suma de los cuadrados de la interacción de factores A y B = SSab = 0.006,
suma de los cuadrados de la interacción de factores A y C = SSac = 4.83, suma de
los cuadrados de la interaccion de B y C = SSbc = 2.64, suma de los cuadrados de la
interacción de los factores A, B y C = SSabc = 0.75, suma total de los cuadrados =
SSt = 183.70. Asumir un nivel de significancia de 0.05. Probar las hipótesis de los
efectos principales, sólo si todas las interacciones no son significativas. Hacer lo
siguiente:
(a) Asignar los simbolismos apropiados para cada uno de los componentes de la
fuente de variación
(b) Hacer una tabla de análisis de varianza que incluya la F crítica y los valores de
p
(c) Hacer pruebas de significancia sobre los efectos principales
(d) Hacer una prueba de significancia sobre todas las interacciones.
7-41
Solución:
(a) La distancia de los muestreadores situados a lo largo de la pluma, es decir,
viento abajo, es el factor A con i = 4. Las alturas a las que están situado los
muestreadores es el factor B con j = 2. Finalmente, los muestreadores son el factor
C con k = 4. El número de casos es n = 3. Por lo tanto el número de
combinaciones es 4x2x4 = 32 y el número total de observaciones es 32x3 = 96.
(b) La tabla de análisis de varianza se da abajo.
TABLA 7.24. Tabla mostrando los datos y el llenado de los faltantes en la tabla, de
acuerdo a los datos proporcionados por el problema. (Elaboración propia).
Fuente de SS g.l. Cuadrado del Fcalc. Ftab. Valor p
Variación promedio
__________________________________________________________________
Efectos principales
Debido a A 1.50 3 .50 4.17 2.76 .009
Debido a B 19.40 1 19.40 161.17 3.94 p <<< .001
Debido a C 147.00 3 49.00 408.33 2.76 p <<< .001
Interacción de dos factores
Debido a AB 0.006 3 0.002 0.02 2.76 p > .100
Debido a AC 4.83 9 0.54 4.50 1.97 p < .001
Debido a BC 2.64 3 0.88 7.33 2.76 p < .001
Interacción de tres factores
Debido a ABC 0.75 9 0.08 0.67 1.97 p > .100*
Error 7.59 64 0.12
Total 183.72 95
__________________________________________________________________
7-42
(c) Conclusión: los efectos principales son significantes sustentados con valores de
p muy pequeños de .009 y p <<< .001. Al juzgar por estos valores de p, existen
efectos principales muy fuertes de distancia, altura y sensores. Por otro lado,
debido a que F7 = MSabc/s27 = 0.67 < F7[0.05;9,64] = 1.97, las interacciones entre los
factores distancia, altura y sensores no son de importancia. Sin embargo, las
interacciones AC y BC son variables importantes del experimento.
En el tópico de análisis de varianza, también hay lo que se llama diseños
factoriales con todos los factores a dos niveles. Aquí se incluyen tópicos como
combinaciones ortogonales lineales, diseños de replicaciones fraccionales, diseños
anidados o jerárquicos, cuadrados latinos, etc. Estas funciones, sin embargo, no se
discutiran aquí.
El análisis de varianza, también se puede aplicar a problemas de regresión
lineal y múltiple para evaluar la significancia total de la ecuación de regresión, es
decir, probando la hipótesis nula de que todos los coeficientes poblacionales del
modelo de regresión son iguales a cero. Este tema, sin embargo, se discute en el
capítulo dedicado a regresión múltiple.
Ejemplo #11. Este es un problema relacionado con un experimento factorial con
dos factores de efectos fijos (A y B) y con tamaños de muestras iguales. Por
ejemplo, el factor A tiene a niveles, mientras que el factor B tiene b niveles. Este
experimento está relacionado con un estudio de difusión atmosférica para medir las
concentraciones del contaminante del aire SO2 provenientes de una fuente emisora
industrial. Para tales fines se situaron dos sensores, al azar a cuatro diferentes
distancias viento abajo de la chimenea industrial, es decir, a 500, 1000, 1500 y
2000 metros y a dos alturas diferentes, es decir, a 100 y 200 metros. Usar un
7-43
paquete de computadora, para tales fines. La tabla de abajo proporciona los datos
pertinentes. Usar un nivel de significancia de α = 0.05 y hacer lo siguiente:
(a) Construir una tabla de análisis de varianza fijo en dos clasificaciones
(b) Analizar los efectos principales de la distancia y la altura
(c) Analizar el efecto de interacción y dar explicaciones al respecto
(d) Hacer un análisis residual para evaluar lo apropiado del modelo de ANOVA
(e) Hacer estudios objetivistas de estadística para evaluar la fidelidad del modelo
de ANOVA
TABLA 7.26. Tabla mostrando las concentraciones de SO2 (en ppm) en función de
cuatro distancias viento abajo de la chimenea y de las alturas de los sensores.
Distancias viento abajo de la fuente emisora
__________________________________________________
Alturas de los sensores 500 m 1000 m 1500 m 2000 m
_________↓______________________________________________________________
100 m 500 300 180 90
510 305 185 91
495 320 179 89
499 299 190 88
200 m 450 290 170 70

449 270 160 70
438 260 155 69
455 275 165 68
____________________________________________________________________________
7-44
Solución:
Usando el programa Minitab se procede a diseñar la matriz o la entrada de los
datos mostrada en la tabla de abajo.
TABLA 7.26. Tabla mostrando la matriz o disposición ordenada de los datos en la
página del Minitab para la información de este problema.
_____________________________________________________________
Concentración de SO2 (ppm) Distancias (m) Alturas (m)
(Columna C1) (Columna C2) (Columna C3)
_____________________________________________________________
500 500 m 100 m
510 500 m 100 m
495 500 m 100 m
499 500 m 100 m
300 1000 m 100 m
305 1000 m 100 m
320 1000 m 100 m
299 1000 m 100 m
180 1500 m 100 m
185 1500 m 100 m
179 1500 m 100 m
190 1500 m 100 m
90 2000 m 100 m
91 2000 m 100 m
89 2000 m 100 m
88 2000 m 100 m
450 500 m 200 m
449 500 m 200 m
438 500 m 200 m
455 500 m 200 m
290 1000 m 200 m
270 1000 m 200 m
260 1000 m 200 m
275 1000 m 200 m
170 1500 m 200 m
160 1500 m 200 m
155 1500 m 200 m
165 1500 m 200 m
70 2000 m 200 m
70 2000 m 200 m
69 2000 m 200 m
68 2000 m 200 m
7-45
Después de ingresar los datos de arriba a la página del Minitab procede como:
Stat → ANOVA → Two-Way…
En la ventana que aparece de “Two-Way Análisis of Variance” y dentro de la
ventanilla de “Response” poner, en la columna C1, todos los valores de la variable
de respuesta, es decir, en este caso, las concentraciones de SO2. Enseguida, en la
ventanilla de “Row factor” del factor A (renglones), poner los valores de las
distancias y meter en la ventanilla de “Column factor” la información del factor B
(columnas), es decir, las alturas. Esta información se da en la Tabla 7.26.
Una vez que se introducen todos los términos siguiendo las instrucciones
anteriores, irse a: Stat → ANOVA → Two-Way…, y el programa generará la tabla
de debajo de ANOVA correspondiente a la pregunta del inciso (a).
TABLA 7.27. Tabla mostrando los resultados de ANOVA dados por el Minitab.
Two-way ANOVA: Conc. SO2 (ppm) versus Distancias (m), Alturas (m)
Source DF SS MS F P Ftab.
Distancias (m) 3 695696 231899 4501.07 0.000 3.01
Alturas (m) 1 8001 8001 155.30 0.000 4.26
Interacción 3 1399 466 9.05 0.000 3.01
Error 24 1237 52
Total 31 706333
__________________________________________________________________
s = 7.178 R-Sq = 99.82% R-Sq(adj) = 99.77%
(b) De acuerdo a la tabla de ANOVA de arriba, los efectos principales del factor A
(distancias) y el factor B (alturas) son mucho muy significantes.
7-46
(c) Existe una interacción significante entre los factores A (distancia) y B (alturas).
La interacción en este caso, pudo ocurrir por mera casualidad o tal vez pudo
deberse a algún problema en los datos, es decir, en términos de causa y efecto.
Físicamente hablando, algún factor que no se pudo controlar pudo ocasionar la
interacción entre los dos factores. Por ejemplo, pudo ocurrir algún mal
funcionamiento de los sensores, que no midieron bien las concentraciones de SO2
en un momento dado. Otras razones pudieron relacionarse con algún cambio
meteorológico inusitado (aunque el modelo de difusión asume condiciones
meteorológicas constantes), emisiones fugitivas, terreno no uniforme por donde
pasa la pluma, etc. Estadísticamente hablando, las interacciones también pueden
ocurrir cuando los efectos principales son muy grandes (como el factor A en este
caso, aunque si bien, esto se puede corregir aminorando las diferencias entre los
niveles de un tratamiento, para hacer los efectos principales menos acentuados).
(d) Las gráficas de abajo muestran los resultados para este inciso.
Residuals Versus the Order of the Data Residuals Versus the Fitted Values
(response is Concentracion de SO2 (m))
20
20
15 15
10 10
Residual
5
Residual
0 0
-5 -5
-10 -10
-15 -15
2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 100 200 300 400 500
Observation Order Fitted Value
Figura 7.10. Graficas mostrando los valores residuales en función del número de
observación y de los valores ajustados.
7-47
Normal Probability Plot of the Residuals Individual Value Plot of Conc. SO2 (ppm) vs Distancias (m), Alturas (m)
99
500
95
90 400
Conc. SO2 (ppm)

80
70
Percent
60 300
50
40
30
20 200
10
5
100
1
-15 -10 -5 0 5 10 15 20 Alturas (m) 100 m 200 m 100 m 200 m 100 m 200 m 100 m 200 m
Residual Distancias (m) 1000 m 1500 m 2000 m 500 m
Figura 7.11. Figuras mostrando la prueba de normalidad y la gráfica de las

concentraciones versus alturas y distancias
(e) Los análisis objetivistas estadísticos indican un coeficiente de determinación

muy alto, es decir, R2 = 99.82% con s = 7.18, lo que sugiere un buen ajuste de los
datos. Además, La Figura 7.10 muestra, aproximadamente, el mismo número de
casos positivos y negativos, lo cual indica que el modelo es apropiado.
Similarmente, la Figura 7.11 muestra un buen ajuste de los datos con la prueba de
normalidad. Finalmente, la Figura 7.11 con la gráfica de las concentraciones versus
las distancias y las alturas muestra las interacciones que ocurren cuando Fcalc. > Ftab.
Ejemplo #12. Este es un ejercicio relacionado con un experimento de análisis de
varianza de tres sentidos. Este ejemplo está encaminado a ilustrar, cómo se
estructura una matriz con los datos, que se introducen en el programa Minitab, para
construir una tabla de ANOVA de tres clasificaciones o tres sentidos y sus gráficas
correspondientes. Asumir un nivel de significancia de α + 0.05. Sacar
conclusiones. Los datos se dan en la tabla de abajo.
7-48
TABLA 7.29. Tabla mostrando la información para este ejercicio.

_____________________________________________________________
Factor B1 Factor B2
_________________________________________________
Factor C1 Factor C2 Factor C1 Factor C2
_________________________________________________
Factor A1 20.0 11.0 13.0 13.0

20.0 12.0 12.0 12.0
17.0 10.0 12.0 13.0
19.0 12.0 13.0 13.0
Factor A2 20.0 16.0 14.0 11.0

20.0 19.0 17.0 10.0
19.0 17.0 12.0 8.0
20.0 18.0 13.0 8.0
Factor A3 17.0 22.0 20.0 14.0

18.0 22.0 22.0 15.0
18.0 22.0 21.0 14.0
18.0 21.0 21.0 16.0
_____________________________________________________________
Solución:
Aquí, el factor A tiene tres niveles (i = 1,…, a = 3); el factor B tiene dos niveles (j
= 1,…, b = 2) y el factor C tiene dos niveles (k = 1,…, c = 2) o sea 3x2x2 = 12
combinaciones de tratamientos. Además hay l = 1,…, n = 4 observaciones en cada
uno de las abc combinaciones de tratamientos (celdas) o sea abcn = 3x2x2x4 = 48
observaciones.
7-49
Procedimiento para construir una tabla de ANOVA de tres factores o en tres

sentidos usando el programa Minitab
1. Primeramente, se definen claramente los tratamientos (en columnas y
renglones), es decir el factor A, y los factores B y C con sus correspondientes
niveles de cada uno de estos factores, como se describió arriba. Además, hay que
determinar n o sea el número de datos en cada celda.
2. Una vez hecho lo anterior, hay que generar la matriz de datos que se introducirá
en la hoja del Minitab. Para hacer esto, irse a:
Calc → Make Patterned Data → Simple Set of Numbers
Haciendo esto aparece una ventana que se llena así:
En la ventanilla de “Store Patterned Data in” poner A (o sea el factor A)
En la ventanilla “From First Value” poner 1 (el punto de partida de la secuencia)
En la ventanilla “To Last Value” poner 3 (a = 3 niveles del factor A)
En la ventanilla “In Steps of” poner 1
En la ventanilla “List Each Value” poner 1
En la ventanilla de “List the Whole Sequence” poner 16 (o sea el producto de bcn
= 2x2x4 = 16)
Enseguida, poner OK y presionar la tecla f3 para borrar todo lo anterior y proseguir
con el siguiente paso.
2. Ahora, irse a:
Calc → Make Patterned Data → Simple Set of Numbers.
Haciendo esto aparece una ventana y se llena así:
En la ventanilla de “Store Patterned Data In” poner B (el factor B)
En la ventanilla de “From First Value” poner 1 (punto de partida)
En la ventanilla “To Last Value” poner 2 (b = 2 niveles de B)
7-50
En la ventanilla “In Steps of” poner 1

En la ventanilla “List Each Value” poner 3 (a = 3)
En la ventanilla de “List the Whole Sequence” poner 8 (o sea el producto de cn =
2x4 = 8)
Poner OK y luego presionar la tecla f3 para borrar todo lo anterior y proseguir con
el siguiente paso.
3. Ahora, irse a:
Calc → Make Patterned Data → Simple Set of Numbers
Haciendo esto aparece una ventana y se llena así:
En la ventanilla de “Store Patterned Data In” poner: C (el factor C)
En la ventanilla de “From First Value” poner: 1 (punto de partida)
En la ventanilla “To Last Value” poner: 2 (c = 2 niveles de C)
En la ventanilla “In Steps of” poner: 1
En la ventanilla “List Each Value” poner: 6 (el producto de ab = 3x2 = 6)
En la ventanilla de “List the Whole Sequence” poner 4 (n = 4)
Poner OK y presionar la tecla f3 para borrar todo lo anterior y proseguir con el
siguiente paso.
4. Después de todo lo anterior, una vez que ya están llenas las columnas C1, C2 y
C3 (Factores A, B y C, respectivamente), se trata de meter los datos de la variable
de respuesta, Y (Columna C4). Esto se puede hacer manualmente poniendo cada
valor de Y, (usando los datos de la TABLA 7.29) en su correspondiente posición
de A, B y C, como se muestra en la tabla de abajo.
7-51
La TABLA 7.30. Tabla mostrando los datos.

____________________________
A B C Y
____________________________
1 1 1 20.0
2 1 1 20.0
3 1 1 17.0
1 2 1 13.0
2 2 1 14.0
3 2 1 20.0
1 1 2 11.0
2 1 2 16.0
3 1 2 22.0
1 2 2 13.0
2 2 2 11.0
3 2 2 14.0
1 1 1 20.0
2 1 1 20.0
3 1 1 18.0
1 2 1 12.0
2 2 1 17.0
3 2 1 22.0
1 1 2 12.0
2 1 2 19.0
3 1 2 22.0
1 2 2 12.0
2 2 2 10.0
3 2 2 15.0
1 1 1 17.0
2 1 1 19.0
3 1 1 18.0
1 2 1 12.0
2 2 1 12.0
3 2 1 21.0
1 1 2 10.0
2 1 2 17.0
3 1 2 22.0
1 2 2 13.0
2 2 2 8.0
3 2 2 14.0
1 1 1 19.0
2 1 1 20.0
3 1 1 18.0
1 2 1 13.0
2 2 1 13.0
3 2 1 21.0
1 1 2 12.0
2 1 2 18.0
3 1 2 21.0
1 2 2 13.0
2 2 2 8.0
3 2 2 16.0
_____________________________
5. Una vez introducidos los datos de Y mostrados en la TABLA 7.18, irse a:
7-52
Stat → ANOVA → General Linear Model

Esta orden genera la ventana “General Linear Model”.
En la ventanilla de “Responses” poner: Y
En la ventanilla de “Model” poner: ABC A*B A*C B*C A*B*C
En la ventana de “General Linear Model Comparisons” puntear: “Pairwise
Comparisons o Tukey”, etc.
En la ventana de “General Linear Model Results” puntear: “In addition
Coefficients for all Terms”, etc.
En la ventana de “General Linear Model-Factor” entrar en la ventanilla de “Main
Plot Effects” y poner: A B C
En la ventanilla de “Interaction Plots” poner: A B C, etc.
Todos estos movimientos generaran la Tabla 7.31 de ANOVA y las gráficas.
TABLA 7.31. Tabla mostrando los resultados de ANOVA de tres sentidos.
General Linear Model: Y versus A, B, C
Factor Type Levels Values
A fixed 3 1, 2, 3
B fixed 2 1, 2
C fixed 2 1, 2
Analysis of Variance for Y (Respuesta), using Adjusted SS for Tests.
Source DF Seq SS Adj SS Adj MS F P Fcrítica

_____________________________________________________________________________
A 2 210.875 210.875 105.438 87.76 0.000 3.23
B 1 172.521 172.521 172.521 143.60 0.000 4.08
C 1 93.521 93.521 93.521 77.84 0.000 4.08
A*B 2 62.542 62.542 31.271 26.03 0.000 3.23
A*C 2 16.792 16.792 8.396 6.99 0.003 3.23
B*C 1 7.521 7.521 7.521 6.26 0.017 4.08
A*B*C 2 167.792 167.792 83.896 69.83 0.000 3.23
Error 36 43.250 43.250 1.201
Total 47 774.813
_____________________________________________________________________________
7-53
s = 1.09608 R-Sq = 94.42% R-Sq(adj) = 92.71%
Term Coef SE Coef T P

Constant 15.9375 0.1582 100.74 0.000
A
1 -2.0625 0.2237 -9.22 0.000
2 -0.8125 0.2237 -3.63 0.001
B
1 1.8958 0.1582 11.98 0.000
C
1 1.3958 0.1582 8.82 0.000
A*B
11 -0.6458 0.2237 -2.89 0.007
21 1.6042 0.2237 7.17 0.000
A*C
11 0.4792 0.2237 2.14 0.039
21 0.3542 0.2237 1.58 0.122
B*C
11 -0.3958 0.1582 -2.50 0.017
A*B*C
111 2.3958 0.2237 10.71 0.000
211 -0.2292 0.2237 -1.02 0.313
Graficas de los efectos principales A, B y C

A B
19.5
18.0
16.5
Mean of Y (respuesta)
15.0
1 2 3 1 2
C
19.5
18.0
16.5
15.0
1 2
Figura 7.12. Gráfica mostrando los efectos principales de A, B y C.
7-54
Grafica de las interacciones de los factores A,B,C

1 2
20
A
1
2
16
A 3
12
20
B
1
2
16
B
12
20
C
1
2
16
C
12
1 2 3 1 2
Figura 7.13. Gráficas mostrando los efectos de interacción entre los factores A, B y
C. Se le pide al lector interpretar estas interacciones.
7-55
Residual Plots for Y

Normal Probability Plot of the Residuals Residuals Versus the Fitted Values
99
Standardized Residual
90 2
Percent
50
0
10
-2
1
-3.0 -1.5 0.0 1.5 3.0 10 15 20
Standardized Residual Fitted Value
Histogram of the Residuals Residuals Versus the Order of the Data

16
12 2
Frequency
8
0
4
-2
0
-2 -1 0 1 2 3 1 5 10 15 20 25 30 35 40 45
Standardized Residual Observation Order
Figura 7.14. Gráficas mostrando la prueba de normalidad, los residuales

estandaraizados, en función de los valores ajustados, histograma de los residuales y
los residuales en funcion de los órdenes observados. Aquí es de notarse que, de
acuerdo a estos gráficos subjetivos, el modelo ajusta bien los datos.
7-56
7.1. Los siguientes datos se obtuvieron de un muestreo atmosférico de óxidos de
azufre (SO2) proveniente de 4 lugares diferentes. Hacer un análisis de varianza con
un nivel de significancia de α = 0.05. Ver si hay diferencias entre los 4 sitios. Usar
la prueba de comparaciones múltiples para ver cuales son iguales y cuales son
desiguales si es que así es.
Tabla mostrando los datos del SO2. (Elaboración propia)
__________________________________________________________________
Sitio #1 Sitio #2 Sitio #3 Sitio # 4

__________________________________________________________________
20 25 28 31
17 25 31 15
18 26 34 12
10 14 17 24
Tabla mostrando los resultados usando un paquete de computadora como EXCEL.

Llenar los faltantes de la tabla. (Elaboración propia)
__________________________________________________________________
Fuente de SS g. l. Cuadrado del Fcalc. Ftab. Valor de p
variación promedio
Debido al 261.69 3 1.93
tratamiento
Residual 543.75 45.31
(Error experimental)
Total 15
7.2. Un investigador desea estudiar el efecto de cuatro fertilizantes diferentes para

ver sus efectos en la producción de maíz. Para esto, se dividió una zona agrícola en
24 parcelas del mismo tamaño y forma. Usar un nivel de significancia de 0.05.
7-57
Probar que no hay diferencia entre los cuatro tratamientos. Usar el programa
Minitab.
Tabla mostrando la producción de maíz bajo cuatro diferentes tratamientos de
fertilizantes. (Elaboración propia)
__________________________________________________________________
Tratamientos Rendimientos
Sin aplicación de fertilizante (1) 99 40 61 72 76 84
Con aplicación de fertilizante (2) 96 84 82 104 99 105
Las suposiciones son que las 4 poblaciones del rendimiento de maíz están
normalmente distribuidas, con las varianzas de las poblaciones iguales y con las
observaciones independientes.
7.3. Para comparar la efectividad de 3 muestreadores de gases, es decir, usando
métodos A, B y C se seleccionaron muestras de tamaño cuatro y se registraron los
siguientes resultados en ppm.
Tabla mostrando la información requerida. (Elaboración propia)
Método A Método B Método C

__________________________________________________________________
71 90 72
75 80 77
65 86 76
69 84 79
Probar la hipótesis de que no hay diferencias entre los tres promedios

poblacionales con α = 0.05. Usar los programas de EXCEL, NCSS o SAS y
completar los faltantes de la tabla.
7-58
Tabla de análisis de varianza. (Elaboración propia)

Fuente de g.l. Suma de los Cuadrado del Fcalc. Ftab. Valor p
variación cuadrados (SS) promedio
Debido al tratamiento 2 228.0 15.78
(variación entre
los grupos)
Residual (error) 130.0 14.4
(variación dentro de
los grupos)
Total 11 586.0
0 Ftab. = 4.3 Fcalc. = 15.78
Gráfica mostrando las áreas de aceptación y rechazo para el problema de arriba.

7.4. Supóngase que cuatro laboratorios ambientales están analizando una muestra
de un filtro con partículas de plomo atmosférico provenientes de un complejo
industrial. Para esto, se quiere saber la efectividad entre los métodos de análisis
usados por estos cuatro laboratorios diferentes. Hacer los siguientes cálculos:
7-59
(a) Probar la hipótesis nula Ho:µ1 = µ2 = µ3 = µ4 es decir que no hay diferencias en

los promedios poblacionales de los resultados de los análisis de los 4 métodos
diferentes usados por los laboratorios. Establecer la hipótesis alternativa de este
problema.
(b) Calcular el valor de la probabilidad p.
La tabla de abajo muestra los valores obtenidos por los 4 laboratorios por los tres
métodos usados por estos cuatro laboratorios. Este es un ejemplo de análisis de
varianza con dos factores.
Tabla mostrando las estimaciones de los cálculos de los 12 resultados por los 3
métodos diferentes usados por los cuatro laboratorios distintos. (Elaboración
propia)
Método de análisis Suma de los renglones

————————————————————
Laboratorio 1 2 3 Ti
1 16 19 24 59
2 21 20 21 62
3 18 21 22 61
4 13 20 25 58
Suma de las 68 80 92 240
columnas (Tj)
Sacar las conclusiones debidas de la hipótesis para los tres métodos de análisis y
decir si se rechaza o se retiene la hipótesis.
7.5. La tabla de abajo muestra una información que se recabó de un muestreo de un
contaminante atmosférico (ozono) proveniente de 5 muestreadores localizados en
cinco lugares diferentes. Hacer los siguientes cálculos.
7-60
(a) Probar la hipótesis nula de que no hay diferencias entre las 5 poblaciones
muestreadas, Ho: µ1 = µ2 = µ3 = µ4 = µ5, con un nivel significante de α = 0.05.
(b) Hacer una tabla de ANOVA.
(c) Calcular el valor de la probabilidad p.
Tabla con los datos de ozono con los números de los muestreadores. (Elaboración
propia)
1 2 3 4 5
551 595 639 417 563
457 580 615 449 631
450 508 511 517 522
731 583 573 438 613
499 633 648 415 656
632 517 677 555 679
7.6 Supóngase que 15 personas han sido seleccionados aleatoriamente de una

población de obesos y han sido separados al azar dentro tres grupos. Cada grupo de
obesos fue alimentado con tres tipos de comidas diferentes para perder peso, es
decir, alimentos (1), (2) y (3). Después de algún tiempo, los pesos que perdieron
los participantes de los tres grupos se registraron. Los pesos se dan en la tabla de
abajo:
Tabla mostrando los pesos perdidos (gramos) de los participantes. (Elaboración
propia)
Tipos de comidas
__________________________________________________________________
Tipo (1) Tipo (2) Tipo (3)
42 112 70
96 96 17
81 88 49
95 135 24
76 119 40
7-61
Estos datos están en conformidad con un factor de un diseño completamente

aleatorio. Un factor es el alimento dado a los obesos. Esto es un diseño
completamente aleatorio, porque las unidades experimentales, de los 15 sujetos,
han sido asignadas aleatoriamente a los tres tipos de comidas. Probar la hipótesis
nula de Ho: µ1 = µ2 = µ3 y la hipótesis alternativa de que, cuando menos uno de los
promedios es diferente de los otros. H1:µ1 ≠ µ2 ≠ µ3. Si la hipótesis nula es cierta,
entonces las tres poblaciones de los pesos perdidos por los obesos son iguales.
Sugerencia: para estimar el promedio del cuadrado dentro de los tratamientos o del
error experimental usar las relaciones:
k n
s P = Σ Σ (Xij - X i)2 / k(n - 1)
2
i=1 j=1
Hacer la tabla del análisis de varianza para los obesos y sacar conclusiones al
respecto. Además, revertir este problema a un diseño de bloques aleatorios y ver si
hay alguna mejoría en el error experimental.
7.7. Los datos de abajo representan el número de horas de alivio paliativo dado por
5 tabletas diferentes A, B, C, D, E, para el dolor de cabeza, que se les
administraron a 25 sujetos quienes experimentaban dolores de cabeza (migrañas).
Hacer un análisis de varianza para probar la hipótesis al nivel de significancia de
0.05 de que el número promedio de horas de alivio paliativo dado por las tabletas
es el mismo para las cinco tabletas usadas. Calcular el valor de la probabilidad p.
Los datos se dan en la tabla de abajo. Calcular la tabla de análisis de varianza.
7-62
Tabla mostrando las horas de alivio con las 5 tabletas de aspirinas. (Elaboración
propia)
Tipos de tabletas
—————————————————————————————————
A B C D E
—————————————————————————————————
5 9 3 2 7
4 7 5 3 6
8 8 2 4 9
6 6 3 1 4
3 9 7 4 7
7.8. En un estudio de contaminación de corrientes, con el objeto de revisar que no

hubiera descargas industriales, previo a un proyecto de dilución, se analizó la
demanda bioquímica de oxígenos de 5 días (DBO)5 en mg/L y se obtuvieron los
siguientes datos (mostrados en la tabla de abajo) del muestreo que se hizo a lo
largo de la corriente, es decir, en 4 lugares diferentes. Hacer un análisis de varianza
usando un nivel de significancia de 0.05. Ver si hay diferencias entre las
concentraciones de DBO de los cuatro lugares muestreados (¿De acuerdo a
estudios de contaminación de corrientes, con qué objeto se tendría que hacer esto?)
Además, usar la prueba de comparaciones múltiples para ver cuales sitios de
muestreo son iguales y cuales son desiguales, si es que esto es así. Sugerencia:
Usar el paquete de EXCEL o el programa MINITAB para resolver este problema.
7-63
Tabla mostrando los resultados del muestreo del DBO en mg/L. (Elaboración
propia).
Sitio #1 Sitio #2 Sitio #3 Sitio #4
20 25 28 31
17 25 31 15
18 26 34 12
10 14 17 24
7.9. Se dan los siguientes datos mostrados en la tabla de abajo.

Hacer una tabla de ANOVA y sacar todas las conclusiones debidas.(Fcalc. = 4.39,
Ftab. = 3.89)
Tabla mostrando las temperaturas del cuerpo (oF) clasificadas por edades.
18 a 20 años 21 a 29 años Mayores que 30 años
__________________________________________________________________
98.0 99.6 98.6
98.4 99.5 98.6
97.7 99.0 98.0
98.5 98.8 97.7
97.1 97.9 97.5
7.10. Se hace un estudio entre el nivel de acidez en términos de pH (Factor A) y la

concentración de cloro (factor B) en el agua. Aquí se asume un análisis de varianza
de dos vías con un diseño aleatorio completamente aleatorizado. Los datos se dan
7-64
en la tabla de abajo. Hacer una tabla de análisis de varianza y sacar las

conclusiones debidas.
Tabla mostrando los datos de este problema del pH y la concentración de cloro.
__________________________________________________________________
Nivel del pH
_________________________________________
pH = 7.0 pH = 7.2 pH = 7.4 pH = 7.6
Nive de concentración de cloro
____________________________________________________________________
Baja 22 17 8 6
Mediana 9 11 7 4
Alta 8 8 6 5
7.11. En un estudio de ingeniería del aire, en un esfuerzo por proteger el medio

ambiente (entre menos combustible consuma un auto, menos se deteriora el
ambiente), se estudiaron cuatro modelos de autos (A, B, C, D), para probar el
consumo de gasolina. Para cada auto, exactamente, un galón de gasolina se puso en
el tanque y el auto se manejó hasta que se consumió toda la gasolina. Las
distancias en millas dadas por cada coche se dan en la tabla de abajo. Con un nivel
de significancia de 0.01 probar que todos los promedios poblacionales son iguales.
Calcular el valor de la probabilidad p. Si Usted quisiera proteger nuestros recursos
naturales o ser activista el medio ambiente ¿Sería, para Usted igual que se
seleccionara cualquiera de los 4 modelos? (Fcalc. = 23.5, Fcrítica = 2.87, p = 1.3x10-8)
7-65

Modelos A B C D
—————————————————————————
Millas 14 3 17 16
16 5 20 18
18 12 22 20
14 8 24 17
22 7 26 21
9 6 18 16
6 9 22 17
4 11 21 22
7 11 20 19
16 9 18 16
——————————————————————————————
7.12. Se estudia el deterioro causado a 4 tipos de telas (1, 2, 3, 4) usadas en el

equipo de control de filtros. Los filtros o baghouses, para el control de partículas se
tienen que sacudir periódicamente, cuando hay caída de presión debido a la
obstrucción de los orificios de las telas. Si no se hace esto, cuando hay mucha
caída de presión, la tela se deteriora prematuramente, esto es, dependiendo del tipo
de partículas y demás variables manejadas.
Tabla mostrando los datos de este problema. (Elaboración propia).
Tipo de tela Caída de presión (libras por pulgada cuadrada)

(1) 3129 3000 2865 2890
(2) 3200 3300 2975 3150
(3) 2800 2900 2985 3050
(4) 2600 2700 2600 2765

(a) Probar la hipótesis nula de Ho:µ1 = µ2 = µ3 = µ4, contra la hipótesis alternativa
de H1:µ1 ≠ µ2 ≠ µ3 ≠ µ4, es decir, de que no hay diferencias entre los promedios
poblacionales de las 4 telas usadas. Usar un nivel significante de α = 0.5
7-66
(b) Hacer una tabla de análisis de varianza que incluya los valores de la F
calculada, la F tabulada y el valor de p.
7.13. El libro de Montgomery et al. Probabilidad y Estadística Aplicadas a la
Ingeniería discute una investigación para determinar el consumo de gasolina (en
millas por litro) de 4 coches. Para esto, se agrupan los 4 tipos de autos tratando de
homogenizar o de control las variables que pudieran afectar el consumo de
gasolina (bloqueo para eliminar las variables no deseables). Las variables
controladas son caballajes del motor, mismo rodaje de llantas, mismo tipo de
carburador, mismo tipo de aceite, mismo tipo de mantenimiento, mismo peso,
mismas temperaturas ambientales, mismo millaje, edad del motor, tamaño del
motor, etc. Probar la hipótesis de que no hay diferencias en el millaje de los coches
probados usando α = 0.01. Calcular el valor de p. (Montgomery, 1996).
Tabla de datos de los millajes por litro de los 4 coches probados.
Millaje Totales por Promedios por
Coche no. tratamiento tratamiento
1 2 3 4 5 Yi. Yi.
(1) 1.3 1.6 0.5 1.2 1.1 5.7 1.14
(2) 2.2 2.4 0.4 2.0 1.8 8.8 1.76
(3) 1.8 1.7 0.6 1.5 1.3 6.9 1.38
(4) 3.9 4.4 2.0 4.1 3.4 17.8 3.56

_________________________________________________________________
(Fuente: Montgomery et al. 1996)
7.14. El libro de Montgomery et al. Probabilidad y Estadística Aplicadas a la
Ingeniería (1996) de la página 672, cita un artículo publicado en el American
7-67
Industrial higiene Association Journal (vol. 37, 1976, pags. 418-422), la cual
describe una prueba de campo para detectar la presencia de arsénico en muestras
de orina. La prueba ha sido propuesta para su uso entre trabajadores forestales
debido al uso cada vez mayor de arsénicos orgánicos en dicha industria. El
experimento compara los resultados obtenidos con la prueba al ser efectuada por
un inexperto y un entrenador experimentado con el análisis efectuado en un
laboratorio remoto. Para la prueba se escogen cuatro sujetos, los cuales son
considerados como bloques. La variable de respuesta es el contenido de arsénico
(en ppm) en la orina del sujeto. Los datos son los siguientes:
Tabla mostrando los datos del problema.
Sujeto
___________________________________________________
Prueba 1 2 3 4
__________________________________________________________________
Inexperto 0.05 0.05 0.04 0.15
Experto 0.05 0.05 0.04 0.17
Laboratorio 0.04 0.04 0.03 0.10
__________________________________________________________________
Fuente: Montgomery et al. Probabilidad y Estadística Aplicadas a la Ingeniería
(1996)
(a) ¿Existe diferencia alguna en el procedimiento de prueba de arsénico?

(b) Analizar los residuos de este experimento
7.15. Cuatro niveles de fertilizantes fueron usados en un experimento agrícola con
dos niveles de agua, es decir frugal y abundante. Los ocho tratamientos fueron
asignados aleatoriamente a ocho parcelas. La respuesta es en toneladas por
hectárea. La tabla de abajo da la información requerida.
7-68
Tabla mostrando los datos de este problema.
Nivel de fertilizante
_______________________________________
Nivel de agua Nada Bajo Mediano Alto
__________________________________________________________________
Poca agua 3.0 3.3 3.7 3.1
Mucha agua 2.3 4.0 4.3 5.0
__________________________________________________________________
(a) Usar el modelo más apropiado de ANOVA.

(b) Hacer una tabla de análisis de varianza
(c) Decir si hay efectos significativos en los fertilizantes y los niveles de agua
(d) Decir si hay una interacción significante
7.16. Se hace un estudio hipotético de difusión atmosférica situando los sensores
para medir la calidad del aire con respecto a SO2 a tres diferentes distancias y a tres
diferentes alturas. Los datos se dan abajo. Asumiendo α = 0.05 hacer lo siguiente:
(a) Usar el modelo de ANOVA más apropiado para este problema
(b) Analizar la gráfica de los datos para estudiar la interacción posible que pudiera
ocurrir entre las distancias y las alturas.
Tabla mostrando las concentraciones (ppm) de SO2 para este problema.
_________________________________________________________________
Distancias en metros
__________________________________________
Alturas 1000 1500 2000
_________________________________________________________________
A nivel del mar 350 250 100
300 metros 280 210 90
500 metros 250 190 70
________________________________________________________________
7-69
7.17. En un estudio de análisis de varianza de tres vías se dan los siguientes datos:
SSa = 22.63, SSb = .003, SSc = .40, SSab = .40, SSac = .07, SSbc = .0.063, SSe =
.001 y SSt = .90. Para el factor A se usaron cuatro niveles, para el factor B se
usaron dos niveles y para el factor C se usaron 2 niveles. Asumir dos muestras con
cada nivel. Usando α = 0.05, hacer lo siguiente:
(a) Construir una tabla de ANOVA
(b) Identificar las interacciones significativas e interpretarlas acordemente
7.18. Este es un estudio del texto de Applied Statistics: Análisis of Variance and
Regression de Dunn y Clark. Esta investigación está relacionada con un estudio de
la inteligencia de los niños con síntomas cardiacos de tipos acianóticos y
cianóticos. Para esto, los cambios en el coeficiente de inteligencia se midieron, es
decir, después de operarse y antes de operarse. Los resultados se dan como sigue:
Tabla mostrando los resultados de los cambios en el coeficiente de inteligencia.
_________________________________________________________________
Operación Acianóticos Cianóticos
_________________________________________________________________
No 9 2
-1 1
-10 -4
3 -5
-2 0
Si -7 5
-7 10
-12 9
-13 2
-12 15
__________________________________________________________________(
a) Usar el modelo de ANOVA más apropiado para este estudio
7-70
(b) Construir una tabla de ANOVA y analizar los resultados

(c) Sacar todas las conclusiones al respecto
7.19. En un experimento agrícola se estudió el rendimiento de trigo usando tres
niveles diferentes de fertilizantes fosfatados, es decir, bajo, mediano y alto. Como
segundo factor se usaron tres variedades diferentes de semillas de trigo (1, 2, 3)
haciendo, con esto, un total de 9 combinaciones de tratamientos. De esta manera
cada combinación de tratamiento se asignó aleatoriamente a una de las 27 parcelas
(de extensiones de dos hectáreas), de tal manera que tres parcelas recibieron cada
tratamiento. Los rendimientos de trigo, en toneladas métricas se dan abajo.
Tabla mostrando el rendimiento de la cosecha de trigo en toneladas métricas.
________________________________________________________________
Nivel del fertilizante
___________________________________________
Variedad de la semilla Bajo Mediano Alto
________________________________________________________________
1 7 10 12
10 10 14
9 12 12
2 8 12 17
10 14 16
8 13 17
3 9 14 16
10 14 18
12 16 21
__________________________________________________________________
Aplicar la función de ANOVA más apropiada para este experimento y sacar las
7-71
7.20. Este estudio está encaminado para que el lector adquiera destreza en el
cumplimiento del llenado de tablas de análisis de varianza. Para esto completar la
siguiente tabla de ANOVA y decir que diseño se usó.
__________________________________________________________________
Fuente de SS g.l. MS Fcalc. Ftab. Valor p
Variación
__________________________________________________________________
Debido a los 2000 10
tratamientos
Debido a las 1200
columnas
Debido a los 7400 5
renglones
Residual 25
_________________________________________________________________
Total 12000 40
7.21. Completar la siguiente tabla de ANOVA y decir qué diseño se usó.

_________________________________________________________________
Fuente de SS g.l. MS Fcalc. Ftab. Valor p
Variación
_________________________________________________________________
Debido a A 12.0 2
Debido a B 19.5
Interacción AB 8.5 7
Tratamientos 39.7 12
Residual 11
Total 84.7 35
____________________________________________________________
7.22. Se realiza un diseño de dos factores en un diseño completamente
aleatorizado, en el cual se aplican cuatro niveles del factor A y tres niveles del
factor B. Los datos dados son SSa = 15.00, SSb = 41.00, SSab = 23.05, SSt = 92.8 y
7-72
n = 2. Con esta información hacer una tabla de análisis de varianza y sacar las
7.23. Se hace un estudio hipotético relacionado con la medición de concentraciones
de partículas atmosféricas emitidas por una fuente industrial, esto es, usando un
modelo de difusión atmosférica. Para tales fines se seleccionaron dos tipos
diferentes de muestreadores, cuatro diferentes alturas y cuatro diferentes distancias
viento abajo de la fuente emisora. Por ejemplo, llamemos las cuatro distancias el
factor A (es decir I = 4 distancias de 500, 1000, 1500 y 2000 metros). Las
concentraciones se midieron con dos tipos marcas diferentes de sensores, cuyo
factor lo llamaremos B (es decir, J = 2). Además, se seleccionaron cuatro alturas
diferentes cuyo factor lo denominaremos C (K = 4 alturas de 100, 200, 300 y 500
metros). Para todo esto, se hicieron L= 3 observaciones para cada una de las 32
combinaciones de niveles de los tres factores (4 x 2 x 4) y para un total de 96
observaciones. La tabla de abajo muestra los resultados de las mediciones. Asumir
α = 0.05. Para esto, hacer los siguientes cálculos:
(a) Establecer el modelo apropiado con las suposiciones
(b) Hacer pruebas de significancia sobre los factores principales, v.g., distancia,
marcas de sensores y posición de los sensores
(c) Hacer pruebas de significancia sobre todas las interacciones
7-73
Tabla mostrando las concentraciones de partículas atmosféricas (en ppm) emitidas

por la chimenea industrial, en función de la distancia, altura y marcas de sensores.
_________________________________________________________________
Muestreador marca B1 Muestreador marca B2
Alturas 100 m 200 m 300 m 500 m 100 m 200 m 300m 500 m

__________________________ __________________________
Distancias
500 m 450 300 295 290 465 301 297 288
459 307 290 279 470 310 291 280
460 310 285 260 470 300 285 270
1000 m 350 280 278 200 345 275 255 250

346 256 270 186 334 265 250 210
339 256 268 159 300 259 257 210
1500 m 300 270 262 198 310 250 230 200

289 263 256 160 300 243 225 195
299 260 265 179 305 260 245 180
2000 m 160 167 150 141 155 145 138 139

160 145 140 134 150 137 134 129
148 139 152 124 147 152 130 125
__________________________________________________________________________________
7.24. El texto Applied Linear Statistical Models de los autores Kutner, Nachtsheim,
Meter y Li explica un problema relacionado con un fabricante de automóviles,
quien desea estudiar los efectos entre diferentes conductores de autos (factor A, i =
7-74
4) y las diferencias entre autos (factor B, j = 5) relacionado con el consumo de

gasolina. Para esto, se seleccionaron cuatro conductores aleatoriamente. De la
misma manera se seleccionaron aleatoriamente cinco autos del mismo modelo con
transmisión manual. Cada conductor manejó cada auto dos veces en una prueba de
40 millas y las millas por galón dadas se registraron. Asumiendo un modelo de
ANOVA aleatorio y tamaños de muestras iguales, procesar los datos de la tabla de
abajo.
Tabla mostrando la descripción de los dos factores usados en el estudio.
_________________________________________________________________
Factor B (autos)
______________________________________________
Factor A (choferes) j=1 j=2 j=3 j=4 j=5
________________________________________________________________
i=1 25.3 28.9 24.8 28.4 27.1
25.2 30.0 25.1 27.9 26.6
i=2 33.6 36.7 31.7 35.6 33.7

32.9 36.5 31.9 35.0 33.9
i=3 27.7 30.7 26.9 29.7 29.2

28.5 30.4 26.3 30.2 28.9
i=4 29.2 32.4 27.7 31.8 30.3

29.3 32.4 28.9 30.7 29.9
_________________________________________________________________
Fuente: Kutner et al. 2002
(a) Construir una tabla de ANOVA

(b) Revisar los efectos de los factores A y B.
(c) Analizar la interacción de los factores A y B
7-75
7.25. Este es un problema adaptado del libro Probabilidad y Estadística para

Ingenieros de los autores Walpole et al. (1998) el cual da un ejemplo que incluye
tres factores denominados factor A, factor B y factor C, con todos los efectos fijos.
Asumir α = 0.05. La tabla de abajo muestra la información requerida para este
problema.
Tabla mostrando los datos pertinentes para este problema.
________________________________________________________________
C1 C2 C3
______________
B1 B2 B3 B1 B2 B3 B1 B2 B3
________________________________________________________________
A1 15.0 14.8 15.9 16.8 14.2 13.2 15.8 15.5 19.2
18.5 13.6 14.8 15.4 12.9 11.6 14.3 13.7 13.5
22.1 12.2 13.6 14.3 13.0 10.1 13.0 12.6 11.1
A2 11.3 17.2 16.1 18.9 15.4 12.4 12.7 17.3 7.8

14.6 15.5 14.7 17.3 17.0 13.6 14.2 15.8 11.5
18.2 14.2 13.4 16.1 18.6 15.2 15.9 14.6 12.2
__________________________________________________________________
Fuente: Walpole et al. (1998)
(a) Generar la matriz de datos, introducirlos al programa Minitab y construir una
tabla de análisis de varianza y hacer pruebas de significancia sobre los efectos
principales (Factores A, B y C)
(b) Hacer pruebas de significancia sobre todas las interacciones
(c) Explicar porque una interacción significativa encubre el efecto del factor C
Respuestas:
(a) A: F = 0.54; no significativa. B: F = 6.85; significativa. C: F = 2.15; no
significativa.
7-76
(b) AB: F = 3.83; significativa. AC: F = 3.79; significativa. BC: F 1.31; no

significativa. ABC: F = 1.63; no significante.
7.26. En los accidentes industriales, cada año se pierden muchos miles de millones
de dólares debido a accidentes de trabajo. Por lo tanto, la industria invierte mucho
dinero en programas relacionados con higiene industrial y seguridad. Una
compañía desarrolló dos nuevos programas de higiene industrial y seguridad, para
entrenar a sus trabajadores en sistemas de seguridad. Para determinar la eficiencia
de estos programas, se ensamblaron tres grupos de obreros. Cada grupo de obreros
tomó un programa de entrenamiento diferente. Después, los trabajadores fueron
asignados a tareas idénticas. El número horas-hombre mensuales perdidas, como
resultado de accidentes laborales, se registró para los siguientes 12 meses. Esta
data se muestra en la tabla de abajo.
Tabla mostrando las Horas-hombre perdidas mensualmente. (Elaboración propia)

Programas de entrenamiento de higiene industrial y seguridad
_________________________________________________
Meses 1 2 3
Enero 28 28 30
Febrero 35 26 28
Marzo 32 27 26
Abril 12 10 6
Mayo 16 10 12
Junio 9 12 10
Julio 15 9 11
Agosto 18 15 16
Septiembre 22 13 11
Octubre 27 20 18
Noviembre 27 17 19
Diciembre 31 23 21
Sacar conclusiones acerca de la efectividad de estos tres programas
7-77
7.27. Este es un problema que involucra un experimento de ANOVA de dos

sentidos, en el cual se usaron seis niveles para el factor A y cinco niveles para el
factor B. Para esto se da una avanzada de los datos: SSa = 79, SSb = 66 y SSt = 184.
Construir una tabla de ANOVA y sacar todas las conclusiones pertinentes.
7.28. Se da la tabla de ANOVA de abajo llenar todos los faltantes y decir si hay
interacciones y, si éstas son importantes. ¿A qué niveles están cada uno de los
factores?
Tabla de análisis de varianza incompleta. Llenar los faltantes. (Elaboración propia)
_________________________________________________________________
Fuente de Suma de los Grados de Promedio de los Fcalc. Ftab. Valor de p
variación cuadrados libertad cuadrados
____________________________________________________________________________
Factor A 46.0 1
Factor B 11.0 5.5
Factor C 3.0
AB 8.0 1
AC 0.1 1
BC 1.6 1
ABC 5.0 0.83
Residual 6
Total 94.0 15
_____________________________________________________________________________
7.29. Este es un problema adaptado del texto Statistics for Environmental

Engineers de Berthoux y Brown (1994). Este ejercicio es un análisis de varianza de
4 clasificaciones, y está relacionado con la operación de un incinerador municipal,
en el cual se utilizaron dos tipos diferentes de muestreadores que tomaron muestras
simultáneas durante cuatro periodos de 3.5 horas sobre un periodo de tres días.
Cada muestreador fue analizado para cinco grupos de sustancias tóxicas peligrosas,
es decir, pesticidas (hidrocarburos hetercíclicos los cuales ocurren como impurezas
tóxicas persistentes en herbicidas) y de líquidos inflamables (C4H4O) usados en
7-78
síntesis orgánicas. Las especies de cada grupo fueron clorinadas a grados

diferentes, es decir, con 4, 5, 6, 7 y 8 átomos de cloro por molécula. Asumir α =
0.05. En este análisis de varianza se usaron cuatro factores, como sigue:
1. Dos tipos de muestreadores (S)
2. Cuatro periodos de muestreo (P)
3. Dos grupos de sustancias tóxicas (DF), como las descritas arriba
4. Cinco niveles de clorinación dentro de cada uno de los dos grupos (Cl).
Esto da un total de n = 2x4x2x5 = 80 mediciones.
La tabla de abajo muestra la información requerida.
Tabla mostrando las emisiones de las 10 sustancias tóxicas, enumeradas abajo, en
unidades de ng/m3 de gas seco normal en porcentajes reales de CO2.
__________________________________________________________________
Periodos de muestreo 1 2 3 4
___________ ____________ ___________ ____________
Muestreador A B A B A B A B
_____________________________________________________________________________
Pesticidas
Sum TCDD 0.4 1.9 0.5 1.7 0.3 0.7 1.0 2.0
Sum PeCDD 1.8 28 3.0 7.3 2.7 5.5 7.0 11
Sum HxCDD 2.5 24 2.6 7.3 3.8 5.1 4.7 6.0
Sum HpCDD 17 155 16 62 29 45 30 40
OCDD 7.4 55 7.3 28 14 21 12 17
Líquidos
Inflamables
Sum TCDF 4.9 26 7.8 18 5.8 9 13 13
Sum PeCDF 4.2 31 11 22 7.0 12 17 24
Sum HxCDF 3.5 31 11 28 8.0 14 18 19
Sum HpCDF 9.1 103 32 80 32 41 47 62
OCDF 3.8 19 6.4 18 6.6 7.0 6.7 6.7
______________________________________________________________________________
Fuente: Berthouex, P. Mac y L. C. Brown. Statistics for Environmental Engineers
Lewis Publishers. CRC Press, Inc. (1994).
7-79
(a) Generar una matriz con los datos de la tabla de arriba e introducirlos en el
programa Minitab.
(b) Hacer una tabla de análisis de varianza
(c) Hacer pruebas de significancia sobre los cuatro factores principales, v.g.,
periodos de tiempo, muestreadores, grupos de sustancias tóxicas y niveles de
clorinacion
(d) Hacer pruebas de significancia sobre todas las interacciones
(e) Sacar todas las conclusiones pertinentes
7.30 Se hace un estudio del control de la contaminación del aire, es decir, usando
sistemas de control de partículas para hornos de cemento. Para esto se usan
diferentes tipos de precipitadores electrostáticos (factor A), es decir, precipitadores
de placa de alambre, precipitadores de placa plana y precipitadores tubulares.
Además se usaron enfriadores de aspersión y colectores mecánicos (factor B). La
finalidad de este experimento factorial fue para ver la eficiencia de colección de las
partículas usando los anteriores factores. Construir una tabla de análisis de
varianza tomando en consideración la siguiente información: Cuadrado medio del
primer factor fue igual a 2.30; el cuadrado medio del segundo factor medio fue
igual a 5.00; cuadrado medio de la interacción fue de 0.12; cuadrado medio del
error fue de 0.075. Asumir α = 0.05. Completar la tabla de ANOVA de abajo
calculando los siguientes valores.
(a) Los valores de Fcalc. para los efectos principales y para el efecto de interacción
(b) Los valores de Ftab. para los dos factores principales y para la interacción
(c) Los valores de p para cada uno de los factores principales y para la interacción
(d) Decir si los efectos principales afectan la eficiencia de los factores A y B
7-80
(e) Decir si hay interacción entre los factores bajo consideración y, si la hay,
explicar porque ocurrió así.
Tabla de análisis de varianza para el experimento de los precipitadores
electrostáticos.
Fuente de g. l. Suma de Cuadrado Fcalc. Ftab. Valor
variación cuadrados medio de p
Primer factor 2.30
Segundo factor 5.00
Interacción 0.12
Error 12 0.075
Total
7-81
CAPITULO 8
Regresión lineal simple y múltiple
Suposiciones del modelo de regresión lineal.- Ecuaciones normales para
calcular el intercepto en la ordenada a y la pendiente b de la curva o línea de
regresión.- Coeficiente de determinación múltiple R2 de la muestra que estima
a ρ2 el coeficiente de determinación poblacional.- Coeficiente de correlación R
de la muestra que estima a ρ, el coeficiente de correlación poblacional.-
Intervalo de confianza para el coeficiente poblacional β componente de la
línea de regresión µY|X = α + βX, estimado por b, la pendiente de la línea.-
Intervalo de confianza para el parámetro poblacional α, el intercepto de la
ordenada de la línea de regresión µY|X = α + βX, cuyo estimador es a.- Hipótesis
nula de Ho:β = βo contra las hipótesis alternativas de H1:β < 1 y H2:β > 1.-
Hipótesis nula de Ho:α = αo contra las hipótesis alternativas de H1:α ≠ αo, H2:α
> αo, y de H3: α < αo.- Intervalo de confianza para µY|X de la línea de regresión
poblacional estimada por Y.- Regresión y correlación múltiple.- Métodos para
validar el modelo de regresión lineal simple y múltiple: a través de estadística de
inferencias y a través del análisis gráfico de los residuales estandarizados.
El objetivo de estudiar regresión lineal simple es para obtener el modelo de
regresión más apropiado, es decir, una ecuación de regresión lineal simple o
múltiple para fines de predicción y estimación. Los componentes de esta ecuación
de regresión lineal, con solo una variable independiente, también llamado modelo
lineal de primer orden, son la variable dependiente Y´ o función de respuesta y, la
variable independiente X. El modelo de esta ecuación, que describe la relación de
la variable X con la variable Y, se llama la ecuación de regresión de Y sobre X y, la
gráfica de esta función, se llama la curva de regresión.
8-1
El modelo de regresión lineal poblacional que describe la relación entre la

respuesta o variable dependiente Y y, la variable independiente o regresora X es:
Y = βo + β1x1 + ε i = 1, 2, …., n (8-1)
Donde:
Y = variable dependiente poblacional (también se usa la anotación y)
βo = intercepto en la ordenada
β1 = pendiente de la línea
x1 = variable independiente
ε = error aleatorio con promedio de 0 y varianza σ2 constante. Este valor de ε es la
diferencia entre el valor teórico de Yi y el valor de Y calculado u observado. Las
condiciones de ε son de que este parámetro debe estar normalmente distribuido; sus
valores deben de ser independientes uno del otro y la varianza de ε es Var(ε) = σ2ε
n = número de (x, y) pares de observaciones
La ecuación de la línea de regresión muestral que estima a modelo de regresión
poblacional (8-1) de arriba se da como:
Y = a + bx + e (8-2)
Donde:
Y = valor de la variable dependiente de la muestra
a = intercepto en la ordenada
b = pendiente de la línea
e = error o residual de la muestra denotado por ei = yi - Yi. Esta estadística es la
estimadora del parámetro ε
8-2
Suposiciones del modelo de regresión lineal

1. Los valores de Y son independientes uno del otro, es decir, no deben de estar
correlacionados.
2. Las distribuciones condicionales de probabilidad de Y dado X son normales.
3. La varianza del error es σ2 y es constante.
4. Los coeficientes βo y β1 son desconocidos y deben de estimarse.
Para estimar la ecuación de regresión lineal simple y múltiple se usa lo que
se llama el método de los cuadrados mínimos que ajusta los datos de la muestra a
la línea de regresión. Esta es una de las técnicas más usadas en investigaciones
científicas, para encontrar la relación entre dos o más variables que están
casualmente relacionadas.
En esta sección veremos el problema de regresión lineal de una variable
dependiente (Y) otra independiente (X), con fines de predicción y estimación. Sin
embargo, una vez que se obtiene la ecuación de regresión lineal, ésta se tiene que
evaluar o validar para ver qué tanta confiabilidad se le puede poner al modelo para
usos de predicción. Esto se hace usando enfoques objetivos y subjetivos. Por
ejemplo, el enfoque objetivo se hace haciendo pruebas estadísticas de inferencia.
Este enfoque se complementa usando enfoques subjetivos, es decir, analizando las
gráficas de los residuales estandarizados o no estandarizados, a través de
inspecciones visuales.
Por ejemplo, las condiciones o suposiciones requeridas para validar el
modelo, subjetivamente, se hace a través de los análisis de los residuos crudos o
estandarizados (para diferenciarlos de los residuos estandarizados). Los llamados
residuos se definen como las diferencias entre el valor actual de Y y el valor
pronosticado de Y por el modelo de regresión estimado. Los residuos se denotan
por ei, esto es, ei = Yi – Yí. En verdad, las gráficas de los residuos dan información
8-3
muy importante, acerca de la naturaleza y fuerza de la relación entre las variables.

La figura de abajo muestra los residuos que son las diferencias entre los valores de
Y1, Y2, Y3,…,Yk y los valores observados de Y´1, Y´2, Y´3,…,Y´k de la línea de
regresión de la muestra. Por otra parte, los residuos estandarizados se obtienen
dividiéndolos por sus respectivas desviaciones estándares.
Figura. 8.0. Gráfica mostrando los residuos de un ejemplo. (Elaboración propia)
Las suposiciones de los valores residuales son:

(a) Los residuales ei están normalmente distribuidos (εi están normalmente
distribuidos).
(b) Los residuos tienen la misma varianza (εi son constantes).
(c) Los residuales ei no están correlacionados, es decir, son independientes.
Otro método menos popular que el análisis de los residuos, para evaluar la
ecuación de regresión es comparando el diagrama esparcido de los puntos, con
respecto a la línea de regresión, con la gráfica de los puntos con respecto al
promedio de y . Esto se debe a qué, sin importar el valor de X, el promedio y
siempre permanece constante (línea horizontal trazada en el diagrama esparcido de
la gráfica). De esta manera, si la dispersión de los puntos con relación a la línea de
8-4
regresión es mucho menor, que la dispersión de los puntos con respecto a la línea
horizontal de y , entonces, se puede concluir que la ecuación de la línea de
regresión da un buen ajuste para los datos de la muestra (Daniel et al. 1989).
Como se dijo antes, el enfoque objetivista es la otra manera que se usa para
evaluar el modelo de regresión lineal, esto es, a través de análisis estadísticos. Para
esto, se pueden usar las siguientes funciones estadísticas:
(a) Coeficiente de determinación lineal R2 (o r2), el coeficiente de correlación lineal
R, s y PRESS.
(b) Análisis de varianza simple (ANOVA), para probar los coeficientes del modelo
de regresión (β), para ρ, etc.
(c) Intervalos de confianza para ρ2, para βo, βi, µy|x, etc.
Tipos de correlación lineal
1. Correlación simple que consiste de dos variables, una dependiente (Y) y la otra
independiente (X). Dentro de esta categoría tenemos:
(a) Correlación directa. Esta correlación consiste en el incremento en una variable la
cual es acompañada por el incremento de otra variable (correlación positiva).
(b) Correlación inversa. Esta correlación consiste en el incremento de una variable la
cual es acompañada por el incremento de otra (correlación negativa).
(c) Correlación no lineal. En esta correlación no hay ninguna asociación entre las dos
variables.
2. Correlación múltiple. Aquí, hay más de dos variables. Una variable es
dependiente (Y), mientras que las otras son independientes X1, X2,…, Xk, etc.
Las figuras de abajo representan varios tipos de correlaciones.
8-5
Fig. 8.1. Diagramas esparcidos con líneas de cuadrados mínimos. La Figura (a)
representa una línea recta con X fija; la Figura (b) representa línea no recta con X fija;
la Figura (c) representa una distribución adjunta con línea recta; la Figura (d)
representa una distribución adjunta con línea no recta; la Figura (e) representa un
diagrama donde no hay asociación entre las dos variable y; la Figura (f) representa
una relación causal. Las otras dos gráficas representan correlaciones perfectas.
8-6
Tipos de curvas más comunes
Figura 8.2. La figura (a) representa la función exponencial; la figura (b) representa la
función de potencia, la figura (c) representa una función recíproca y, la figura (d)
representa una función hiperbólica. (Elaboración propia)
8-7
Ecuaciones normales para calcular el intercepto en la ordenada a y la pendiente

b de la curva o línea de regresión
Las variables a y b se obtienen de las ecuaciones normales de abajo, es decir,
resolviéndolas simultáneamente:
ΣY = a n + b ΣX (8-3)
ΣXY = a ΣX + b ΣX (8-4)
Al resolverse simultáneamente dan el intercepto, a en la ordenada y, la pendiente de
la línea, b:
Intercepto = a = Y – b X (8-5)
Pendiente = b = [n ΣXY – (ΣX)(ΣY)] / [n ΣX 2 – (ΣX)2 ] (8-6)
= Σxy / Σx2 (8-7)
Donde:
Σxy y Σx2 se dan por las ecuaciones (8-8) y (8-9) de abajo.
Nota 1. Las siguientes ecuaciones son muy importantes.
Σx2 = Sxx = ΣX 2 – (ΣX)2 / n (8-8)
Σxy = Sxy = ΣXY – ΣXΣY / n (8-9)
Σy2 = Syy = ΣY 2 – (ΣY)2 / n (8-10)
Nota 2. Es muy importante notar las diferencias entre el uso de las variables
minúsculas y las mayúsculas en las ecuaciones de arriba.
Coeficiente de determinación R2 de la muestra que estima a ρ2 el coeficiente de
determinación poblacional
El cálculo del coeficiente de determinación múltiple R2 es una prueba objetivista
de estadística. Esta es una función estadística muy importante, para validar el
modelo de regresión lineal. Este coeficiente R2 mide la proporción de variación en
la variable dependiente Y explicada por la variable independiente X. Los valores de
R2 varían de 0 a 1. Por ejemplo, un valor cercano a 0 indica que no hay una
8-8
relación lineal entre Y y X, mientras que un valor cercano a uno indica un ajuste
lineal perfecto. Aquí, sin embargo, es necesario aclarar que, un valor alto de R2, no
necesariamente indica un buen ajuste del modelo de regresión, sino hasta que se
hacen todas las pruebas objetivistas y subjetivas. La función que calcula R2 es:
R2 = (Σxy)2 / Σx2Σy2 (8-11)
= 1 – SSe / SSt (8-12)
Donde Σxy, Σx2 y Σy2 se dan por las ecuaciones (8-8), (8-8) y (8-10) descritas para
la ecuación (8-11). Además, para la ecuación (8-12) SSe es la suma de los
cuadrados del error o residual y SSt es la suma de los cuadrados del total, mismos
que se describen en el formato de la tabla de ANOVA.
También hay el llamado coeficiente R2 de determinación ajustado. Esta es
una versión ajustada de R2, el cual busca remover la distorsión debida a un tamaño
de muestra pequeño. Se define como:
R2ajustada = 1 – [(1 – R2) (n – 1)/(n – 2)] (8-13)
Donde R2 ya se definió y n es el tamaño de la muestra
Coeficiente de correlación R de la muestra que estima a ρ, el coeficiente de
correlación poblacional
El coeficiente de correlación R, que estima a ρ, también se llama coeficiente de
correlación de Pearson. Este coeficiente es un índice de la fuerza de la asociación
lineal entre las variables X e Y. El coeficiente de correlación R es:
R= ∑ xy (8-14)
∑x ∑ y
2 2
Donde: Σxy, Σx2 y Σy2 se dan por las ecuaciones (8-8), (8-9) y (8-10)
Nota: El coeficiente de correlación R explica el grado de asociación entre las
variables X e Y. Este coeficiente R varía de –1 a 0, si la correlación es negativa, es
8-9
decir, con pendiente negativa. Pero, si la correlación es positiva, entonces, R varía

de 0 a 1. Así, a medida que R se aproxima a ±1, mejor asociación habrá entre las
variables X e Y. Nótese que, en caso de la regresión lineal múltiple, tenemos lo que
se llaman coeficientes parciales de regresión usados para medir la relación lineal
entre la variable dependiente y la variable independiente especificada.
línea de regresión µY|X = α + βX, estimado por b, la pendiente de la línea.
∑x ∑x
2 2
b – t[1-α/2;n-2] s / < β < b + t[1-α/2;n-2] s / (8-15)
Donde:
b = Σxy / Σx2
t[1-α/2;n-2] = valor de la distribución de t de Estudiante
Σx2 = ΣX2 – (ΣX)2 / n
(∑ y − b∑ xy )
2
s= (8-16)
n−2
∑ y − (∑ y )
2 2
= SSE/(n – 2) = - (bΣXY - ΣXΣY/n)] / n-2

n
La ecuación de la varianza es: s2 = (Σy2 – bΣxy) / (n – 2) (8-17)

β = coeficiente poblacional de la pendiente de la línea, el cual es estimado por b =
Σxy / Σx2 o sea el coeficiente de la línea de regresión muestral.
ordenada de la línea de regresión µY|X = α + βX, cuyo estimador es a
(8-18)
Donde:
8-10
a ya se definió anteriormente
t[1-α/2;n-2] = a un valor usando la distribución de t de estudiante con ν = n – 2 grados
de libertad
s = de la ecuación (8-16)
Sxx = Σxy (de la ecuación (8-9))
Hipótesis nula Ho:β = βo contra las hipótesis alternativas H1:β < 1 y H2:β > 1.
Para esta prueba también se usa la distribución de t de Estudiante con ν = n – 2
grados de libertad, es decir:
t = (b – βo) / s/Σx2 (8-19)
Donde:
t = la estadística de la distribución de t de Estudiante
βo = un valor dado
Hipótesis nula Ho:α = αo contra las hipótesis alternativas H1:α ≠ αo, H2:α > αo,
y H3: α < αo
Aquí, nuevamente, se usa la distribución de t de Estudiante con grados de libertad,
ν = n – 2. Para esto se usa la fórmula de abajo:
(8-20)
8-11
Donde:
αo = un valor dado
s = ya definida anteriormente
Intervalo de confianza para µY|X de la línea poblacional estimada por Y

El intervalo de confianza para el valor de µY|X se hace es usando la fórmula (8-21) de
abajo:
1 1
Yo’– t[α/2;ν] s + (Xo - X )2/Σx2 < µY|X < Yo’+ t[α/2;ν] s + (Xo - X )2/Σx2 (8-21)
n n
Donde:
Yo’ = a + b Xo = valor de la línea de regresión con un valor de Xo dado (8-22)
t[α/2;n-2] = valor de la distribución de t con un nivel de significancia de α = .05 o bien
0.01 con ν = n – 2 grados de libertad
a = ya definida anteriormente
Xo = un valor dado
X = promedio de la muestra
Hipótesis nula Ho:β = 0 contra las hipótesis alternativas H1:β > 0 y H2:β < 0
Para hacer esta prueba usamos la distribución de t de Estudiante con ν = n – 2 grados
de libertad. La función estadística usada para tales fines es:
∑x
2
t = (b – bo) / s / (8-23)
Donde:
8-12
b = intercepto en la ordenada Y
bo = un valor dado
Σy2 = ΣY2 – (ΣY)2/n
Σxy = ΣXY – ΣXΣY/n
βo = 0
Aquí, también se tienen que calcular las regiones críticas usando la distribución
de t, es decir, t[1-α/2;ν], donde α es el nivel de significancia deseado y, ν es el número de
grados de libertad, es decir, n - 1. Después de esto, se compara el valor de tcalc., con el
valor crítico de ttab. y se sigue el mismo procedimiento para cualquier prueba de
hipótesis.
Hipótesis nula de Ho:α = αo contra las hipótesis alternativas H1:α > 0 y H2:α < 0
Para hacer esta prueba de hipótesis se usa la estadística de t de Estudiante mostrada
abajo:
(8-24)
Donde:
Donde:
Σy2 = ΣY2 – (ΣY)2/n
b = ya definida anteriormente
Aquí, también se tiene que establecer las regiones críticas usando la distribución de t
de Estudiante. Estas regiones críticas son: t[1-α/2;ν], donde α es el nivel de significancia
usado.
8-13
Pruebas de hipótesis Ho:ρ = 0, contra la hipótesis alternativas H1:ρ ≠ 0, para el

coeficiente de correlación poblacional ρ estimado por R. (Dunn et al. 1974)
Para estos fines se usa la estadística de t de Estudiante:
2
t=√ν R/ 1− R (8-25)
Donde:
∑x ∑ y
2 2
R = Σxy / (8-26)
ν = n – 2 grados de libertad
Aquí, nuevamente, para calcular las regiones críticas se usa la t de Estudiante, es
decir, t[α/2;n-2].
Ejemplos de problemas usando regresión y correlación lineal simple
Ejemplo #1. Este problema está relacionado con un estudio acerca de la cantidad de
precipitación pluvial y la cantidad de contaminación atmosférica.
___________________________________________________________________
Lluvia (0.026”) | 18 7 14 31 21 5 11 16 26 29
Remoción de contaminación | 55 17 36 85 62 18 33 41 63 87
Hacer las siguientes estimaciones:

(a) Identificar la variable dependiente y la variable independiente. Hacer una gráfica
que vaya en función de la variable dependiente Y, y la variable independiente X.
(b) Calcular los valores de la estadística descriptiva de los datos.
(c) Obtener la ecuación de regresión lineal simple y trazarla en la gráfica.
(d) Validar la confiabilidad del modelo de regresión, es decir, a través de la emisión
de un juicio subjetivo analizando los valores de los residuos estandarizados, de la
siguiente manera:
1. Hacer una gráfica que muestre la prueba de normalidad.
8-14
2. Hacer una gráfica con los residuales estandarizados versus valores ajustados de Y .
(El valor predecido o ajustado de Y i es el valor de Y que se esperaría cuando se usa la
línea de regresión. En otras palabras, los valores ajustados de Y 1, Y 2,.., Y n se obtienen
sustituyendo, sucesivamente, x1, x2, .., xn en la ecuación de la línea de regresión
estimada: Y i = βo + β1xi, .., βo + β1xn.
3. Hacer un histograma de residuales.
4. Hacer una grafica que muestre los residuales estandarizados versus renglones.
(e) Complementar la evaluación del modelo con inferencias estadísticas, como:
1. Cálculo del coeficiente de determinación R2 y el coeficiente de correlación R.
2. Hacer una tabla de análisis de varianza (ANOVA).
3. Hacer una tabla con los coeficientes, los errores estándares, las pruebas de t, los
valores de p, y los intervalos de confianza para el intercepto y la pendiente.
Solución:
(a) La variable dependiente es la remoción de contaminantes (Y) y la variable
independiente es la cantidad de lluvia (X). La figura de abajo muestra esta solución:
Figura 8.3. Gráfica mostrando Y versus X, con una línea recta horizontal
correspondiente al valor del promedio de Y = 49.7000. (Elaboración propia)
(b) Los valores de la estadística descriptiva son:
X = 17.8000, Y = 49.7000. Los valores máximos y mínimos de los valores de Y son
8-15
87.000 y 17.000, respectivamente. Los valores máximos y mínimos de los valores de

X son 31.000 y 5.0000, respectivamente. Cuadrado medio del error = s2y|x = 26.667;
error cuadrático medio es sy|x = 5.164
(c) Usando un programa de computadora se estiman los valores del intercepto en la
ordenada y la pendiente. Estos son: intercepto = a = 1.0213, pendiente de la línea = b
= 2.7348. Sustituyendo estos valores dan la línea de regresión muestral (misma que se
ve en la Figura 8.3), da.
Y = a + bX
Y = 1.0213 + 2.7348(X)
(d) Para este inciso la Figura 8.4 muestra la información requerida.
Residual Plots for Remocion de contaminatnes (Y)

99
5
90
Residual
Percent
0
50
-5
10
1 -10
-10 -5 0 5 10 20 40 60 80
Residual Fitted Value

3
5
Frequency
2
Residual
1 -5
0 -10
-8 -4 0 4 1 2 3 4 5 6 7 8 9 10
Residual Observation Order
Figura 8.4. Gráficas mostrando las respuestas para el inciso (d).

Como se ve en la Figura 8.4 la figura superior izquierda muestra la prueba de
normalidad con todos los puntos formando una linea recta. Esto indica que la
8-16
distribución de los datos es normal. Igualmente, la figura superior derecha muestra

los residuales en función de los valores ajustados de Y. Aquí, hay aleatoriedad en
la distribución de los puntos con la misma cantidad de puntos negativos y
positivos, lo que indica que no hay correlacion de los datos. La figura inferior
izquierda muestra la frecuencia versus los residuales. Finalmente, la figura inferior
derecha muestra los residuales en función de los órdenes de las observaciones.
Aquí, en esta figura hay aleatoriedad y el mismo numero de puntos positivos y
negativos, lo que sugiere que no hay colinealidad o correlacion en serie de la
información suministrada.
(e) Para complementar el estudio objetivista, esto se hace haciendo pruebas
estadísticas de inferencia.
(1) Como se dijo antes, el coeficiente de determinación R2 es un enfoque objetivista,
que sirve para validar el modelo de regresión. Este coeficiente de determinación R2,
mide la fuerza relativa de la relación lineal entre X e Y (mide la proporción de
variación en Y que puede ser explicada por la variación en X) es dado por la ecuación
(8-11) y por las ecuaciones (8-6), (8-7) y (8-8), respectivamente:
R2 = 0.9620
El cálculo del coeficiente de correlación R es:
R= R 2 = 0.9808
(2) Para el análisis de varianza (ANOVA), que también sirve para validar el modelo
de regresión, es una función estadística objetivista que prueba la hipótesis nula de que
la pendiente es igual a 0. Aquí se verá que, un valor grande de F indica que el modelo
de regresión seleccionado es util. Sin embargo, es necesario analizar todos los demás
criterios antes de emitir un juicio final. La tabla de ANOVA de abajo da los
resultados.
8-17
TABLA 8.1. Tabla de análisis de varianza (ANOVA) para el ejemplo.

__________________________________________________________________
Fuente de Suma de los g.l. Cuadrado del Fcalc. Ftab. Valor de p
variación cuadrados promedio
__________________________________________________________________
Debido al 5,396.77 1 5,396.77 202.38 5.32 0.00001
tratamiento
Residual (error) 213.33 8 26.67
___________________________________________________________________
Total 5,610.1 9
El valor de Ftab. se saca consultando la tabla de la distribución de F, esto es Fα;ν1,ν2, el

cual da F.95;1,8 = 5.32. Aquí, debido a que el valor de Fcalc. = 202.38 >>> 5.32, se
rechaza la hipótesis sustentada de que Ho:β1 = 0 y se inclina por Ho:β1 ≠ 0. La
conclusión es de que la pendiente de la línea no es igual a 0 u horizontal.
(3) La tabla de abajo muestra los valores del intercepto en la ordenada, el gradiente
de la línea de regresión, los errores estándar, la pruebas de hipótesis usando la t de
estudiante, los valores de la probabilidad p y los intervalos de confianza (95%) para
βo (intercepto) y β1 (pendiente).
TABLA 8.2. Tabla mostrando los valores del intercepto, pendiente, pruebas de t de
Estudiante, valor del nivel de p y sus intervalos. (Elaboración propia)
__________________________________________________________________
Coeficiente Error Prueba t Valor p Límite Límite
estándar inferior superior
___________________________________________________________________
Intercepto 1.02 3.79 0.27 0.79 -7.772 9.76
___________________________________________________________________P
endiente 2.73 0.19 14.23 5.8x10-7 2.29 3.18
__________________________________________________________________
Aquí, nótese que el intervalo de confianza para el intercepto es muy amplio y la

hipótesis no se puede rechazar, puesto que el valor de t es muy pequeño y el valor de
8-18
p = 0.79 es grande. Esto es apoyado por el valor de 0.79 de p y por un error estándar
de 3.79, relativamente grande; lo contrario ocurre con las pruebas estadísticas de la
pendiente, cuyo valor de t es grande y cuyo valor de p es muy pequeño.
Ejemplo #2. En un estudio de microbiología ambiental, en muestras de agua, se
dieron los siguientes datos de la tabla de abajo. Estos datos se refieren al crecimiento
de una colonia de bacterias en un medio de cultivo.
Tiempo en días de | 3 6 9 12 15 18
inoculación (X)
__________________________________________________________________
No. bacterias (Y) | 115,000 147,000 189,000 235,600 257,900 286,400

(a) Calcular la línea de regresión.
(b) Calcular el coeficiente de determinación R2 y el coeficiente de correlación R.
(c) Con la ecuación de regresión, estimar el número de bacterias después de 20 días
(d) Encontrar los intervalos de confianza para α y β usando el paquete de EXCEL.
(e) Usar el programa Minitab y estimar los valores residuales y analizarlos
subjetivamente, para revisar por la calidad del modelo de regresión.
Solución:
(a) La ecuación de la línea de regresión es:
Y = 81,520.00 + 11,774.29 X
(b) El coeficiente de determinación lineal múltiple R2 es igual a 0.9880. El coeficiente
de correlación R es igual a 0.9940.
(c) Cuando X = 20 días, el número de bacterias es de:
Y = 81,520 + 11,774.29 (20) ≈ 317,006 bacterias
(d) En cuanto a los intervalos de confianza para α y β, el programa de computadora de
8-19
EXCEL arroja los siguientes resultados:

Intervalo de confianza de 95% para α: 61,259.45 < α < 101,780.6; valor de la
probabilidad p = 0.0004; Intervalo de confianza de 95% para β es: 10040.14 < β <
13508.43, con un valor de la probabilidad p = 0.000046
(e). Las figuras de abajo muestran las gráficas que tratan de validar el modelo de
regresión lineal, con del número de bacterias en función del tiempo de incubación.
Figura 8.5. Figuras mostrando los resultados del número de bacterias versus el tiempo
de incubación. La gráfica (a) muestra la relación entre Y y X, con la línea recta de Y ;
la gráfica (b) muestra los residuos crudos versus X; la gráfica (c) muestra los residuos
crudos versus los renglones y, la gráfica (d) muestra los residuos crudos versus
residuos rezagados (Elaboración propia).
8-20
Todas estas gráficas sugieren, subjetivamente, que el modelo de regresión lineal es

confiable. ¿Por qué?
Ejemplo #3. En un estudio de agricultura, relacionado con la siembra de algodón, en
cierto estado de la Unión Americana, la precipitación anual y el rendimiento de la
cosecha de algodón son como sigue.
Precipitación | 7.12 63.54 47.38 45.92 8.68 50.86 44.46
en pulgadas
(X)
Rendimiento de | 1037 380 416 427 619 388 321
la cosecha en
libras/acre
(Y)

(a) Calcular los valores del intercepto a y la pendiente b.
(b) Escribir la ecuación de la línea de regresión.
(c) Calcular el coeficiente de determinación R2 y el coeficiente de correlación R.
(d) Predecir el rendimiento de la cosecha de algodón, si la precipitación es de 30
pulgadas.
(e) Hacer una tabla de análisis de varianza.
Solución:
(a) Usando un paquete de computadora como el Excel da:
Intercepto en la ordenada = a = 880.40
Pendiente de la línea = b = -9.61
(b) Por lo tanto, la ecuación de la línea de regresión es:
Y = 880.40 – 9.61 (X)
(c) El coeficiente de determinación = R2 = 0.6991
8-21
El coeficiente de correlación = R = 0.8361

(d) Cuando la precipitación de lluvia es de 30 pulgadas, el rendimiento de la
cosecha se calcula usando el modelo de regresión obtenido, es decir sustituyendo el
valor de X = 30. De esta manera, usando la ecuación de regresión dada arriba y
sustituyendo el valor de X = 30 nos da:
Y = 880.4 – 9.61 (30) = 592.1
(e) La tabla de análisis de varianza dada por el paquete Excel se da abajo.
TABLA 8.5. Tabla de análisis de varianza (ANOVA). (Elaboración propia)
Fuente de variación g.l. SS MS Fcalc. Ftab. Valor de p
Debido a la Regresión 1 260,628.2 260,628.2 11.62 5.32 0.019
Residuo 5 112,165.5 22,433.11
Total 6 372793.7
En conclusión, al comparar el valor de la estadística calculada F con el valor crítico de

F se rechaza la hipótesis sustentada con un valor de p igual a 0.019.
Ejemplo #4. El libro Applied Statistics: Análisis of Variance and Regression de Dunn
y Clark (1974) describe un estudio de física, es decir, de óptica, donde se obtuvieron
los datos de abajo que muestran los diámetros de las fibras ópticas (en micras) en
función de la fuerza de rompimiento de éstas. Para este problema hacer los siguientes
cálculos
(a) Hacer todos los calculos preliminares y calcular la ecuación de la línea de
regresión muestral que estima a la ecuación de regresión poblacional µY|X = α + βX.
(b) Usando un paquete de computadora, encontrar el intervalo de confianza para el
coeficiente de regresión poblacional α (intercepto en Y), que estima a a.
(c) En forma análoga que con en el inciso (b), encontrar el intervalo de confianza para
el coeficiente de regresión β (la pendiente de la línea) cuyo estimador es b.
8-22
(d) Probar la hipótesis nula de Ho:β = βo, es decir, β = 0 contra la hipótesis alternativa
de H1:β > 0 y H2:β < 0. Calcular el valor de la probabilidad p.
(e) Hacer un intervalo de confianza para µY|Xo.
(f) Calcular los criterios evaluadores del modelo de regresion, v. g., R2, PRESS y s.
(g) Hacer una prueba de hipótesis para el coeficiente de correlación poblacional ρ.
(h) Graficar los datos y trazar la ecuación de la línea de regresión sobre la gráfica y
trazar la línea horizontal correspondiente al valor del promedio Y .
(i) Emitir un juicio subjetivo que ayude a validar el uso del modelo de regresión.
La tabla de abajo muestra los datos.
TABLA 8.6. Tabla mostrando el diámetro de fibras vs. fuerza de rompimiento.
Diámetro de la fibra (X) Log de la fuerza de rompimiento (Y)
22.5 .19
28.0 .62
27.5 .51
25.5 .53
22.0 .24
30.5 .87
23.0 .25
25.0 .25
23.5 .37
27.0 .32
21.5 .13
22.0 .35
29.0 .53
20.5 .22
27.0 .65
(Fuente: Dunn et al. 1974. Applied Statistics: Analysis of Variance and Regression)
Solución:
(a) Los cálculos preliminares son:
8-23
n = 15, ΣX = 374.5, (ΣX)2/n = 9,350.0, ΣY = 6.03, (ΣY)2/n = 2.42, ΣXY = 158.25, ΣX

2
= 9,482.75, ΣY 2 = 3.03, (ΣXΣY)/n = 2,258.24/15 = 150.55, X = 24.97, Y = 0.402,
Σx2 = ΣX 2 – (ΣX)2/n = 9,482.75 – 9,350.0 = 132.75, Σxy = ΣXY – ΣXΣY/n = 158.25
– 150.55 = 7.70, Σy2 = ΣY 2 – (ΣY)2/n = 3.03 – (6.03)2/15 = .6074
Para calcular la línea de regresión de la muestra, primero calculamos manualmente,
los coeficientes a y b de la línea de regresión muestral que estiman a α y β.
b = Σxy/Σx2 = 7.70/132.75
= .058
a = Y – b X = 0.402 – (0.058)(24.97) = -1.046
Por lo tanto, la línea de regresión muestral es:
y = a + b(X)
y = -1.046 + 0.058(X)
(b) El intervalo de confianza para α es usando la función (8-18) o usando un paquete
de computadora como Excel procediendo como: Tools → Data análisis → Regression
y OK. Enseguida, después de que los datos se introdujeron en las columnas A y B de
la hoja de Excel irse a la ventanilla de “Input Y Range” y “Input X Range”, lo que
genera la TABLA 8.7 de abajo.
TABLA 8.7. Tabla mostrando el valor del intercepto, la pendiente, los valores de t y p
y los intervalos de confianza para α y β.
Por lo tanto, el intervalo de confianza para el intercepto (α) se lee de la tabla como:
-1.5706 < α < -0.5224
(c) En forma análoga el intervalo de confianza para β se lee de la TABLA 8.7 como:
8-24
0.0788 > β > 0.0371

(d) Para probar la hipótesis nula Ho:β = βo es decir, β = 0, contra H1:β > 0 y H2:β < 0
usamos la distribución de t de estudiante con ν = n – 2 = 15 – 2 = 13 g.l. La fórmula
es: t = (b – βo) / s/√ Σx2. Sustituyendo todos los valores de βo = 0 y demás valores en
la fórmula de arriba da:
t = (0.058 – 0) / 0.12/ 132.73
= 5.8
Las regiones críticas son: t = ± 2.16.
En conclusión: debido a que tcalc. = 5.8 > ttab. = 2.16, se rechaza la hipótesis nula de
Ho:β = 0 y se inclina por H1:β > 0. El valor de la probabilidad se calcula usando la
fórmula de interpolación (6-10): (λ2 – λ1)/(t2 – t1) = (λ2 – X)/(t2 – tcalc.)
Sustituyendo los valores apropiados de la tabla de t nos da:
(.00001 - .00002)/(6.287 – 5.607) = (.00001 – X)/(6.287 – 5.8)
Lo que da X = p = .00002. Pero como la prueba es bilateral, lo multiplicamos por 2 y
da p = .00004. Este valor apoya, muy contundente, la hipótesis alternativa de H1:β >
0.
(e) El intervalo de confianza para la variable dependiente de la línea de regresión
poblacional, µY|X estimada por Y, con nivel de significancia de α = 0.05, dar varios
valores a Xo. Para hacer esto, se usa la función de abajo:
1 1
Yó - t[α/2;n-2] s +(Xo– X )2/Σx2 < µY|X < Y´ó + t[α/2;n-2] s +(Xo– X )2/Σx2 (8-28)
n n
Donde:
X = promedio
t[α/2;n-2] = valor de t con ν = n – 2 g.l.
t[.025;13] = ± 2.16
Xo = los diferentes valores que se le den a Xo para construir los límites o bandas de
8-25
confianza para µY|X

Ahora bien, con los valores de: a = -1.047, X = 24.97, Σx2 = 132.73, s = 0.12, t.0.25;13
= ± 2.16 y asignándole valores a Xo, digamos de 19, 28, 30.0, etc., se procede de la
siguiente manera:
Para Xo = 19.0; Y’o = -1.047 + 0.058(19.0) = 0.055, etc.
Enseguida, usando la fórmula (8-28) y sustituyendo los valores, es decir, para Xo = 19
da:
.055–2.16(0.12) 1 +(19.0-24.97)2/132.73 < µ < .055+2.16(0.12) 1 +(19.0-24.97)2/132.73

Y|19
15 15
El cual se simplifica a: 0.335 > µY|19 > 0.299
Así se puede continuar dando diferentes valores de Xo y sustituyéndolos, como se

hizo arriba, para, finalmente, hacer las bandas de confianza para µY|X.
(f) Para calcular los valores de R, R2, s y PRESS se pueden hacer con un paquete de
computadora. Por ejemplo, si se hace manualmente, el coeficiente R se calcula usando
la ecuacion (8-14), etc. De otra manera, si se usa el Mintab proceder como:
Stat → Regression → Regression
En la ventana de “Response” poner la variable dependiente, y en la ventana de
“Predictors” poner la variable independiente. También se pueden usar las ventanas de
“Graphs”, “Options” y “Results” para obtener información adicional. Por ejemplo los
valores de las estadísticas objetivistas de inferencia dadas por el programa son:
R2 = 73.6%, R = 0.858, s = 0.1112, PRESS = 0.2204. Por ejemplo, el valor de R =
0.8576 indica indica una correlación positiva que va de acuerdo con la pendiente
positiva de la curva de .058. Los valores tan pequeňos de s y de PRESS indican un
buen ajuste de los datos al modelo de regresión.
(g) Para la prueba de hipótesis Ho:ρ = 0, es decir, para el coeficiente de correlación
poblacional, ρ con α = 0.05, contra la hipótesis alternativa de H1:≠ 0, esto es, H2:ρ > 0
8-26
y H3:ρ < 0 se usan las siguientes estadísticas:

(1) Usando la estadística de t de Estudiante (8-25):
2
t= n − 2 R / 1− R
Donde:
R = ya definida
Para calcular las regiones críticas se usa la distribución de t, es decir, t[α/2;n-2] = t.025;13 =
± 2.16
Entonces, usando la fórmula de abajo y sustituyendo los valores da:
∑x ∑ y
2 2
R = Σxy / = 7.701 / (132.73)(0.6074) = 0.86
y R2 = 0.7396
Ahora, usando la estadística de abajo y sustituyendo da
2
t= n−2 R/ 1− R
t = 13 (0.86) / .2604
= 6.07
Si se desea sacar el valor de p se busca 6.07 en la tabla de la distribución de t con ν =
13 y con α = .05, lo que da .025 < p < .05.
(h) Para graficar los datos aunados a la ecuación de la línea de regresión con una línea
horizontal correspondiente al valor del promedio Y se hace usando un paquete de
computadora.
8-27
Figura 8.6. Gráfica mostrando la fuerza de rompimiento (log10) en función del

diámetro de la fibra, con la ecuación de la linea de regresión Y = -1.046 + 0.058(X) y
con el promedio Y = 0.402. (Elaboración propia).
(i) Emitir un juicio subjetivo que ayude a validar el uso del modelo de regresión. Para
responder a esta pregunta se hacen los siguientes gráficos:
Residuals Versus the Order of the Data

(response is Log fuer)
1
-1
-2
2 4 6 8 10 12 14
Observation Order
Figura 8.7a. Gráfica mostrando los residuos estandarizados versus el orden de la

observación. Esta es una gráfica que muestra todos los residuales en el orden en el
cual los datos fueron coleccionados. Aquí hay el mismo número de datos positivos
y negativos. Esta gráfica también sirve para encontrar errores no aleatorios,
especialmente, en efectos relacionados con el tiempo.
8-28
Residuals Versus the Fitted Values

1
-1
-2
0.1 0.2 0.3 0.4 0.5 0.6 0.7
Fitted Value
Figura 8.7b. Está gráfica muestra los residuales versus valores ajustados. Para que
el modelo de regresión sea aceptable, se requiere que: los puntos en la gráfica sean
aleatorios en ambos lados de 0; no debe haber series de puntos que aumenten o
disminuyan; no debe haber predominancia de residuales positivos o negativos, ni
tampoco debe haber patrones de residuales que aumenten con valores ajustados
que aumenten. Como se ve, todas estas condiciones están bien sustentadas.
Normal Probability Plot of the Residuals
1
Normal Score
-1
-2
-2 -1 0 1 2
Figura 8.7c. Gráfica mostrando la prueba de normalidad. Los datos deben formar
una línea recta si los residuales están normalmente distribuidos (situación que
ocurre aquí). De otra manera, la suposición de normalidad se inválida.
8-29
Como se observa en estas gráficas, la emision de un juicio subjetivo es aceptable,

porque el modelo de regresión seleccionado ajusta bien los datos. Esto se debe a que,
en la Figura 8.7a hay aleatoridad en los datos, es decir, con el mismo número de
valores positivos y negativos. Además, en la Figura 8.7b la descripción de ésta,
sugiere un modelo de regresión representativo de la información dada. Situación
similar ocurre con la descripción de la Figura 8.7c.
Ejemplo #5. En un estudio de ingeniería del agua relacionado con las reducciones de
los sólidos suspendidos, en función de la demanda química de oxígeno (DQO), se
sacó una muestra aleatoria, cuyos datos se dan en la tabla de abajo. Para lo siguiente:
(a) Identificar la variable dependiente y la independiente y hacer una gráfica de DQO
versus reducción de sólidos.
(b) Calcular la ecuación de la línea de regresión.
(c) Hacer una tabla de análisis de varianza que incluya la F crítica y el valor de p.
(d) Validar el modelo candidato, a través de estadísticas como R2, PRESS, s y de la
estadística de Durbin-Watson (para la prueba de autocorrelación de residuales).
(e) Evaluar la utilidad del modelo a través de gráficos subjetivos:
TABLA 8.8. Tabla mostrando las mediciones de sólidos y la demanda química de
oxígeno. (Elaboración propia)
__________________________________________________________________
Sólidos supendidos DQO
___________________________________________________________________
30 29 33 37 25 32 29 27 31 36 25 31
30 30 33 30 35 31 29 28 32 29 30 30
29 30 34 30 36 30 28 29 34 29 34 29
34 31 36 29 31 30 33 30 35 28 30 28
28 31 36 28 33 32 26 30 34 28 30 31
27 32 36 27 31 32 27 32 34 26 29 31
Solución:
8-30
(a) La variable dependiente es DQO y la variable independiente es reducción de

sólidos suspendidos. La figura 8.8 de abajo muestra las concentraciones de DQO
versus reducción de sólidos suspendidos.
Figura mostrando la grafica de DQO y solidos suspendios.
35
DQO (Y)
30
25
27 32 37
Solidos suspendidos (X)
Figura 8.8. Gráfica mostrando el DQO versus reducción de sólidos.

(b) La ecuación de la línea de regresión es:

DQO (Y) = 1.53 + 0.909 X(sólidos suspendidos)
La pendiente es igual a 0.909 y el intercepto es 1.53
(c) La tabla de abajo muestra la información de ANOVA.
TABLA 8.9. Tabla de ANOVA de sólidos suspendidos y DQO.

Fuente de SS g.l. MS Fcalc. Fcrítica Valor de p
Variación
Entre los grupos 32.00 1 32.00 4.35 3.98 0.04
Total 546.44 71
__________________________________________________________________
(d) s = 0.9039 R2 = 88.8% R2(ajustada) = 88.5%

PRESS = 31.8928 R2(predecida) = 87.13% Durbin-Watson statistic = 1.67
8-31
Aquí, el coeficiente de determinacion R2, mide, qué tan bien el modelo de

regresión ajusta los datos. Análogamente, el estadístico PRESS (suma de
cuadrados de error de predicción) mide la calidad del modelo de regresión. En
cuanto a la estadística Durbin-Watson, si está cercana a 2 no hay autocorrelaciones
en series positivas o negativas. La variación de los datos la da la estadística s.
(e) La Figura 8.9 da la información subjetiva para la evaluación del modelo.
(a)
(response is DQO (Y))
1
-1
-2
-3
-4
25 30 35
Fitted Value
(b)
1
Normal Score
-1
-2
-4 -3 -2 -1 0 1 2
Figura 8.9. La figura (a) prueba por la autocorrelación o falta de independencia de los
datos. Además, la figura (b) prueba por la normalidad de los datos.
8-32
Regresión y correlación lineal múltiple

Muchas aplicaciones del análisis de regresión involucran situaciones donde se tiene
más de una variable independiente. En la mayor parte de los problemas de
investigación se necesitan varias variables independientes para ver el efecto en la
variable dependiente. La variable dependiente o de respuesta (Y) puede estar
relacionada con muchas variables independientes o regresoras X1, X2, etc.
En el estudio de regresión lineal múltiple se pueden usar el enfoque matricial.
También se pueden hacer pruebas de hipótesis, intervalos de confianza, análisis
subjetivos (análisis de los gráficos) y análisis objetivos (estadística de inferencia),
como los cálculos de los coeficientes de determinación (R2) o de correlación (R),
como en el caso de la regresión lineal simple. Sin embargo, en este caso, se puede
calcular el coeficiente de correlación general y coeficientes de correlación parciales,
es decir, en forma análoga a como se hace con los coeficientes βo, β1, etc.
Cuando hablamos de regresión lineal múltiple tenemos las siguientes
situaciones:
1. Modelo de primer orden con dos variables regresoras o independientes.
2. Modelo de primer orden con más de dos variables independientes.
Modelo de regresión múltiple generalizado
Cuando este modelo general es lineal en los coeficientes se denomina modelo de
regresión múltiple. Por ejemplo, para el caso de k variables independientes x1, x2,
x3,..., xk, el promedio está dado por Y|x1, x2, x3,..., xk y se da por el modelo de
regresión múltiple poblacional:
Y = µY|x1, x2, x3,..., xk = βo + β1x1 + β2x2 + ...+ βkxk + εk (8-29)
Este modelo, también se puede expresar con otra anotación como:
Ŷ j = βo + β1X1j + β2X2j + ……. + βkXkj + εj (8-29a)
Los parámetros βj, j = 0, 1, 2, 3,.., k se conocen como coeficientes de regresión
8-33
poblacionales. Por ejemplo, el parámetro βj representa el cambio esperado en la

respuesta Y, por unidad de cambio en xj, cuando todos los demás pronosticadores xi
se mantienen constantes. Además, εi y ei son los errores aleatorios o residuos de
población y de la estadística asociados con la respuesta Yi.
El modelo de regresión lineal múltiple de la muestra que estima al modelo
poblacional de arriba es:
Y = bo + b1X1 + b2x2 + ... + bkXk + e (8-30)
Donde cada coeficiente de regresión parcial βi es estimado por bi. Esto se debe a
qué, cada coeficiente parcial βi mide el cambio esperado en Y por unidad de cambio
en x1, cuando x2 se mantiene constante, y β2 mide el cambio esperado en Y por
unidad de cambio en x2 cuando x1 se mantiene constante.
El modelo de primer orden con dos variables independientes es:
Yi = βo + β1Xi1 + β2Xi2 + ε (8-31)
Donde Yi, la variable dependiente que denota la respuesta en las -ésimas tentativas;
Xi1 y Xi2 son las dos variables independientes de la -ésima tentativa; βo, β1, β2 son los
coeficientes de regresión y, ε es el error o residuo.
Modelo de regresión múltiple con más de dos variables independientes
Yi = βo + β1Xi1 + β2Xi2 + … + βp-1Xi,p-1 + ε (8-32)
Cuando hablamos de regresión lineal múltiple, el principal objetivo es la obtención
de la ecuación de la línea de regresión muestral, para predicción y estimación, la
cual emula a la ecuación poblacional. Sin embargo, antes de poder usar el modelo
de regresión calculado, éste se tiene que evaluar, para ver qué tanta confiabilidad se
le pueda dar. La evaluación o validación del modelo de regresión estimado se hace
a través de análisis objetivos y subjetivos, en forma análoga como en la regresión
lineal simple. Por ejemplo, los análisis objetivistas se hacen a través de funciones
estadísticas de inferencia. Posteriormente, para que la validación del modelo sea
8-34
completa, el procedimiento se complementa usando enfoques subjetivistas, a través

de análisis de las gráficas de los valores residuales. Si la validación no es
satisfactoria, se procede con remediación del modelo, ya sea haciendo
transformaciones de los ejes o probando otros modelos más apropiados, como
cuadráticos o cúbicos, etc.
Aplicación de análisis subjetivos y objetivos para la evaluación del modelo de
regresión
Como se ha estado mencionando anteriormente, se sugieren dos maneras de revisar
la utilidad del modelo obtenido. Estas maneras son: (1) análisis de gráficas de
residuos y, (2) pruebas estadísticas de inferencia.
Por ejemplo, para validar el modelo de regresión aplicando análisis
subjetivos, es decir, a través de los gráficos de los residuos (ei), éstos se describen
como las diferencias entre los puntos y la línea de regresión. Siendo así, las
suposiciones son de que los residuos deben ser independientes y normalmente
distribuidos, con promedio igual a cero y con varianzas constantes. Más
explícitamente, las descripciones de las suposiciones son:
1. Los valores de la variable aleatoria estadística ei deben estar normalmente
distribuidos. Para lograr esto, se grafican los residuos (crudos o estandarizados) de
la variable dependiente en función de los valores de z o normales esperados. Para
que se reúna la condición de normalidad de los datos, todos los puntos deben de
estar dentro de las bandas de confianza y deben de estar muy cercanos a la línea de
regresión. Además, si los términos del error ei están normalmente distribuidos, los
residuales estandarizados o crudos deberán estar, aproximadamente, de acuerdo
con las reglas del 68%, 94% y 99%. Esto quiere decir qué, el 68% de los residuos
deberán estar entre z = ±1; el 95% deberán estar entre z = ±2 y, finalmente, el 99%
de los residuos deberán estar entre z = ±3.
8-35
2. Los valores de la variable aleatoria ei deben ser independientes uno del otro. No
debe haber colinialidad o correlación en serie. Esto se revisa graficando los
residuos (estandarizados o crudos) en función de los renglones. Si no hay,
aproximadamente, los mismos residuos positivos y negativos en la gráfica,
entonces, el modelo lineal calculado no es el apropiado y tendrán que buscarse
otras alternativas (como funciones polinomiales, cuadráticas, cúbicas, etc.). Aquí
cabe notar que la suposición de independencia es la más importante que se pueda
violar, porque es la base para las pruebas estadísticas como la R2, el error de lo
estimado (s dado por el programa Minitab), ANOVA, etc.
3. Los valores de la variable aleatoria ei deben de tener la misma varianza. Esto se
llama homoscedasticidad. Esto se puede revisar visualmente graficando los
residuales estandarizados o no estandarizados (crudos) contra cada valor de las
variables independientes (Xi). Aquí, nuevamente, tiene que haber la misma
cantidad de valores positivos y negativos expresados en la gráfica. Aquí, sin
embargo, existen otros métodos para revisar por el problema de
heteroscedasticidad que se retomarán en el capítulo de regresión polinomial.
Otros investigadores estadísticos (Devore, 2000) sugieren cuatro gráficos de
diagnóstico subjetivo, para la validación del modelo de regresión múltiple. Estos
gráficos de diagnóstico son:
1. El gráfico de los residuos estandarizados y/o crudos en la ordenada versus los
valores de Xi en la abscisa.
valores pronosticados (en la abscisa) por el programa de computadora usado.
3. El gráfico de los valores pronosticados en la ordenada versus los valores de Yi en
la abscisa.
4. Gráfico de normalidad de los residuos estandarizados versus los percentiles de z
8-36
(valores de z).
5. Histogramas.
Aplicación de análisis objetivos para la evaluación del modelo de regresión
Por otro lado, en cuanto al enfoque objetivista (estadística inferencial) para la
validación del modelo de regresión, éste está relacionado con el uso de estadísticas
como el coeficiente de determinación múltiple R2 (o r2), el coeficiente de
determinación ajustado R2ajustada, el error estándar de lo estimado, s, tablas de
análisis de varianza, pruebas de t de Estudiante, intervalos de confianza, el criterio
de Mallow de Cp, PRESS, etc.
De esta manera, cuando se habla de coeficientes en el modelo de regresión
múltiple, existen cuatro tipos de coeficientes:
(1) El coeficiente de determinación múltiple (R2)
(2) El coeficiente de correlación múltiple (R)
(3) El coeficiente de determinación ajustado (R2ajustada)
(4) El coeficiente parcial de correlación múltiple (Rij.k)
Por ejemplo, el coeficiente de determinación múltiple R2 es, tal vez, la
medida estadística más popular usada para medir, qué tan bien encaja el modelo de
regresión en los datos de la muestra. En realidad el uso de R2 es una técnica para
medir la adecuación de un modelo de regresión lineal múltiple. Esta estadística se
puede definir como una proporción o como un porcentaje. Como proporción, sus
valores varían de cero a uno. Por ejemplo, si el valor de R2 está cercano a cero, esto
indica que no hay una relación lineal entre Y y las X´s, mientras que, un valor
cercano a uno, indica una ajuste perfecto. Sin embargo, el valor de R2 no debe de
interpretarse ligeramente, sin el apoyo del error estándar de lo estimado (s), el
residual (PRESS), el criterio de Mallow (Cp) o los factores de variación inflados
(variance inflation factors, VIF). Además la validación del modelo debe estar
8-37
apoyada por los análisis de los gráficos subjetivos.

De acuerdo a la lógica del programa de NCSS, los siguientes enunciados dan
algunas calificaciones de la interpretación de R2.
1. El valor de R2 puede incrementarse agregando más variables independientes,
pero esto puede causar un aumento en el error del cuadrado medio, especialmente,
cuando la muestra es pequeña.
2. La magnitud de R2 está influenciada por el rango de cada variable independiente.
R2 aumenta a medida que el rango de las X´s aumenta y viceversa.
3. El valor de R2 no mide la magnitud de las pendientes.
4. La magnitud de R2 no mide la aptitud del modelo lineal; mide la fuerza lineal del
componente del modelo.
5. Un valor grande de R2 no necesariamente significa una predicción grande. Lo
opuesto también es correcto. Todo esto tiene que ser complementado o
corroborado por otras funciones estadísticas y por el análisis gráfico subjetivo.
6. El valor de R2 es altamente sensible al número de observaciones. Entre más
grande sea el tamaño de la muestra, más alto será el valor de R2. Más adelante, hay
lo que se llama el valor ajustado del coeficiente de determinación múltiple ajustado
(R2ajustada). Este coeficiente de determinación múltiple ajustado R2ajustada es una
versión ajustada de R2 la cual busca remover la distorsión causada por un tamaño
de muestra pequeño. Igualmente, también hay lo que se llama PRESS (predicted
sum of squares) que se usa para validar el modelo de regresión en términos de
predicción. Aquí, entre más pequeño sea el valor de PRESS, mejor será el modelo
candidato.
En forma análoga, también hay lo que se llama el coeficiente de correlación
múltiple R. Este coeficiente R mide la fuerza de la relación lineal entre la variable
dependiente Y y las variables independientes X1, X2, X3,…, Xk. En contraste con el
8-38
coeficiente de correlación lineal simple, el rango de este coeficiente de correlación

múltiple es de 0 ≤ R ≤ 1. Esto se debe a que R no indica la pendiente de la
ecuación de regresión debido a que no es posible indicar los signos de todos los
coeficientes de regresión que relacionan la variable dependiente Y a las variables
independiente Xi. Así como en el caso de la correlación lineal, la medición de R2 es
más fácil de interpretar que el coeficiente de correlación múltiple, R.
Otro tipo de correlación relacionado con regresión y correlación múltiple es
lo que se llama coeficiente parcial de correlación múltiple. Este coeficiente mide la
fuerza de la relación lineal entre la variable dependiente Y y las variables
independientes X1, X2, X3,…, Xk. Este coeficiente se puede expresar como Rij.k el
cual es el estimador del coeficiente de correlación múltiple poblacional ρij.k. Rij.k se
puede usar para ver la relación causal entre Y y una de las variables independientes,
manteniendo las demás constantes. Este coeficiente, también se puede usar para ver
la relación entre dos variables independientes.
Más adelante, dentro de la categoría de análisis objetivos de estadística
inferencial relacionados con regresión múltiple, tenemos lo que se llama análisis de
varianza (ANOVA) discutido en capítulos anteriores. En forma análoga como el
uso de R2, este análisis es un método complementario para revisar las suposiciones
del modelo de regresión. La confiabilidad de los resultados del ANOVA está
mancomunada a la suposición de que los residuales están normalmente
distribuidos. El uso de ANOVA prueba los promedios poblacionales donde se
analiza la variación total. ANOVA evalúa la utilidad del modelo de regresión
probando la hipótesis nula de que todos los coeficientes (βi) de la ecuación de
regresión (pendientes) son igual a cero. Los componentes del análisis de varianza o
de ANOVA, son parecidos a los del análisis de varianza simple explicados en
capítulos anteriores. Los componentes son la fuente de variación, los grados de
8-39
libertad, la suma de los cuadrados, el cuadrado del promedio, la prueba de F y el

nivel de probabilidad. Por ejemplo, la fuente de variación representa las particiones
de la variación en Y. Hay cuatro fuentes de variación es decir, el intercepto, el
modelo, el residuo o error y, el total ajustado. La prueba de inferencia con la
estadística F se usa para probar la hipótesis de todas las βi = 0.
Más importante todavía, es el cálculo del nivel de probabilidad p. El valor de
p es la probabilidad de obtener un estadístico de prueba, al menos tan
contradictorio o más extremo para Ho:, como el valor observado que se obtuvo,
asumiendo que Ho: es verdadera. Si el valor de p es menor qué, digamos α = 0.05,
la hipótesis nula se rechaza; de otra manera se retiene. Entre más pequeño sea el
valor de p, menos credibilidad tendrá la hipótesis nula.
Otros estadísticos objetivistas para validar el modelo de regresión son las
pruebas individuales de t de estudiante para probar la hipótesis de que β1, β2, β3, βk
son iguales a cero. Además se pueden usar los intervalos de confianza. Por
ejemplo, en regresión múltiple el valor de t de estudiante se usa para probar la
hipótesis de que uno de los coeficientes es igual a cero, después de remover la
influencia de los otros. Los investigadores Paffenberger et al. (1987) dan la función
para el intervalo de confianza para βi. Sin embargo, si se concluye que β1 o βk no
son igual a cero esto, no necesariamente, dice que el modelo de regresión es útil
para predicción. En verdad, para determinar si el modelo es apropiado, en lugar de
probar que β1 = 0 y β2 = 0, separadamente (usando la prueba de t), se usa una
prueba conjunta como el análisis de varianza (ANOVA). De cualquier manera, la
prueba de hipótesis bilateral para probar los coeficientes individuales βi se usa el
siguiente formato dado en la tabla de abajo.
8-40
TABLA 8.10. Tabla mostrando los mecanismos para una prueba de hipótesis
bilateral para los coeficientes individuales βi incluidos en el modelo de regresión
múltiple. (Elaboración propia)
Hipótesis nula: Ho:βi = 0, hipótesis alternativa: H1:βi ≠ 0
Valor del estadístico: t = bi / sbi
Regla de decisión:
Rechazar Ho: si t > tα/2;n-(k+1) o bien si t < -tα/2;n-(k+1).
No rechazar Ho: si tα/2;n-(k+1) ≤ t ≤ tα/2;n-(k+1)
Donde: βi son los coeficientes de regresión individuales.
bi = estimadores de βi
sbi = errores estándar
α = nivel de significancia deseado
k = número de variables independientes
t = función estadística de t de Estudiante
Ejemplos aplicando la regresión y correlación múltiple
Ejemplo #6. En la adsorción de tierra y sedimento, la magnitud de la acumulación
en forma condensada de los productos químicos en la superficie es una
característica importante que influye en la eficiencia de insecticidas y varios otros
productos químicos. El artículo “Adsorption of Phosphate, Arsenate,
Methanearsonate and Cacodylate by Lake and Stream Sediments: Comparison with
Soils” (J. of Environ. Qual., 1984, pp. 499-504) presenta los siguientes datos en la
tabla de abajo. Aquí se toma Y como la variable dependiente, la cual denota el
índice de adsorción de fosfato, X1 es una de las variables independientes
denotando la cantidad de hierro extraíble y, X2 es otra de las variables
independientes denotando la cantidad de aluminio extraíble. (Devore, 2000)
8-41
TABLA 8.11. Tabla mostrando los datos del ejemplo.

_________________________________________________________________
Observación X1 (Hierro extraíble) X2 (Aluminio extraíble) Y (Índice de adsorción)

__________________________________________________________________
1 61 13 4
2 175 21 18
3 111 24 14
4 124 23 18
5 130 64 26
6 173 38 26
7 169 33 21
8 169 61 30
9 160 39 28
10 244 71 36
11 257 112 65
12 333 88 62
13 199 54 40
________________________________________________________________

Hacer los cálculos pertinentes.
Solución:
Usando un paquete de computadora da: bo = -7.351, desviación estándar = 3.485,
b1 = 0.11273, desviación estándar = 0.02969, b2 = 0.34900, s = 0.07131
La ecuación de la línea de regresión lineal múltiple es:
Y = -7.351 + (0.11273)(X1) + (0.34900)(X2)
Enseguida, para ver, qué tan confiable es el modelo de regresión calculado,
primero procedemos a efectuar el análisis subjetivo, es decir, el análisis de las
gráficas de los residuos.
8-42
Figura 8.10 Figura mostrando las gráficas de los residuos estandarizados versus
valores esperados de z (1); gráfica mostrando el residuo estandarizado versus la
variable independiente X1 (2); gráfica mostrando el residuo estandarizado versus la
variable independiente X2 (3); gráfica mostrando el residuo estandarizado versus el
valor de Y pronosticado (4) y, finalmente, gráfica de Y pronosticada versus
adsorción (5). (Elaboración propia)
8-43
Figura 8.11 Esta gráfica muestra un enfoque un poco diferente al de la figura

anterior, es decir usando los residuos no estandarizados en contraste con la figura
8.10 que usa los residuos estandarizados. Gráfica mostrando la prueba de
normalidad (1). Gráfica mostrando la prueba de independencia de residuos versus
renglones (2). Gráfica mostrando los residuos versus valores pronosticados (3).
Gráfica mostrando los residuos versus variable independiente de hierro (4). Gráfica
mostrando los residuos versus variable independiente aluminio (5). (Elaboración
propia)
8-44
El valor del coeficiente de determinación múltiple es: R2 = 0.9480

El coeficiente de determinación ajustado es: R2ajustada = 0.9380
El coeficiente de correlación múltiple es: R = 0.9736
Los coeficientes parciales se pueden estimar si se desea saber la relación
entre el índice de adsorción y el aluminio extraíble, poniendo la variable
independiente, hierro constante. También, si se deseara saber la relación entre el
índice de adsorción y el hierro extraíble, se pondría la variable aluminio constante.
Similarmente, si se deseara saber la relación entre las variables aluminio y la
variable del hierro, se pondría la variable índice de adsorción fija.
TABLA 8.12. Tabla mostrando los coeficientes de regresión, valores de t de
Estudiante, niveles de p y decisiones tomadas en Ho: (Elaboración propia)
_________________________________________________________________
Variable Coeficiente Valor de t Nivel Decisión
independiente de regresión de p (5%)
_________________________________________________________________
Intercepto -7.35066 -2.1094 0.0611 Aceptar
Hierro 0.11273 3.7969 0.0035 Rechazar
Aluminio 0.34900 4.8944 0.0006 Rechazar
_________________________________________________________________

_________________________________________________________________
Fuente de g.l. Suma de los Cuadrado Fcalc. Valor Poder de
Variación cuadrados medio de p la prueba
_________________________________________________________________
Intercepto 1 11580.31 11580.31
Regresión 2 3259.90 1764.95 92.03 0.000 1.0000
Error 10 191.79 19.18
_________________________________________________________________
Total 12 3721.69 310.14
8-45
TABLA 8.14. Tabla mostrando el reporte de residuos. (Elaboración propia)

_________________________________________________________________
Renglón Valor Valor Residuo Error estándar
actual pronosticado
_________________________________________________________________
1 4 4.0630 -6.3052 5.0077
2 18 19.7066 -1.7066 4.9511
3 14 13.5387 0.4612 4.7055
4 18 14.6552 3.3447 4.6862
5 26 29.6406 -3.6406 5.1051
6 26 25.4141 0.5858 4.5996
7 21 23.2182 -2.2182 4.6488
8 30 32.9902 -2.9902 4.6623
9 28 24.2976 3.7024 4.5671
10 36 44.9352 -8.9352 4.7012
11 65 60.7097 4.2902 5.4250
12 62 60.9014 1.0986 5.4195
13 40 33.9292 6.0707 4.5649
_________________________________________________________________
TABLA 8.15. TABLA mostrando los intervalos de confianza para este problema.
_________________________________________________________________
Variable Límite inferior (95%) Límite superior (95%)
independiente
_________________________________________________________________
Intercepto -15.1149 0.4137
Hierro (X1) 0.0467 0.1789
Aluminio (X2) 0.1901 0.5079
__________________________________________________________________
8-46
TABLA 8.16. Tabla mostrando la estadística descriptiva. (Elaboración propia)

_________________________________________________________________
Variable Conteo Promedio Desviación Valor Valor
estándar mínimo máximo
_________________________________________________________________
Hierro (X1) 13 177.31 70.10 61 333
Aluminio (X2) 13 49.31 29.19 13 112
Índice de (Y) 13 29.85 17.61 4 65
adsorción
_________________________________________________________________
Conclusiones: El modelo de regresión obtenido es válido para predicción y

estimación. Los datos encajan bien con un modelo lineal múltiple. Esta contención
está basada en el análisis subjetivo de las gráficas de los residuos. Por ejemplo, en
la figura 8.10 y 8.11 la prueba de normalidad es buena, porque todos los puntos
están dentro de las bandas, y muy cercanos a la línea de regresión. Además, los
puntos están de acuerdo con la regla del 68%, 95% y 99%, es decir, el 68% de los
puntos están dentro de z = ±1, el 95% están dentro de z = ±2, etc. En la figura 8.11
de los residuos versus los renglones, esto satisface la suposición de independencia,
porque hay el mismo número de residuos positivos y negativos. Además, las
gráficas de los residuos versus las variables independientes no violan la suposición
de no linealidad, porque no hay tendencias definidas. Finalmente, la gráfica de
residuos versus valores pronosticados están de acuerdo con la suposición de
varianzas iguales (homoscedasticidad).
En cuanto a los análisis objetivistas, es decir, usando pruebas estadísticas,
nuevamente, presuponen un buen ajuste del modelo de regresión estimado. Esto se
debe a qué, el valor del coeficiente de determinación múltiple R2 está muy cercano
a uno. Además, el valor de R = 0.9736 indica muy buena correlación entre la
variable dependiente y las variables independientes. Con respecto a la tabla del
análisis de varianza, el valor de F es mucho menor que el valor crítico y esto está
8-47
demostrado por el valor de la probabilidad p el cual es mucho muy significante.

Las pruebas de t de estudiante, también son muy aceptables y demuestran que las
pendientes de βi no son iguales a cero. Los intervalos de confianza dan resultados
similares y sugieren que el modelo de regresión es buen pronosticador. Se pueden
seguir haciendo pruebas de hipótesis para todos los parámetros poblacionales y, sin
lugar a dudas, éstas también apoyarían la contención de que, el modelo de
regresión, es aplicable.
Ejemplo #7. Considerar los datos de la tabla de abajo. Usando el programa de
computadora Minitab obtener el modelo de regresión más apropiado, es decir, un
modelo múltiple lineal (Modelo 1); modelo con transformación en el eje vertical
(Modelo 2) y un modelo con transformaciones de los ejes horizontales y del eje
vertical (Modelo 3).
TABLA 8.17. Tabla mostrando los datos bivariados de regresión. (Elaboración
propia)
X1 | 4 4 4 6 3 6 3 2
X2 | 3 4 3 4 2 4 2 2
Y | 3 2 7 6 5 6 7 4
Solución:
Abajo se dan los resultados de los tres modelos. Al juzgar por los resultados, se le
pide al lector que decida cual modelo es el más apropiado.
8-48
TABLA 8.18. Resultados mostrando el resumen de los tres modelos.

_______________________________________________________________
Regression Analysis: Y versus X1, X2 (Modelo 1)
The regression equation is: Y = 6.00 + 2.00X1 – 3.00X2
Predictor Coef SE Coef T P

Constant 6.0000 1.803 3.33 0.021
X1 2.0000 0.7746 2.58 0.049
X2 -3.0000 1.183 -2.54 0.052
s = 1.414 R-Sq = 58.3% R-Sq(adj) = 41.7%

PRESS = 0.1274 R-Sq(pred) = 51.62%
Analysis of Variance
Source DF SS MS F P
Regression 2 14.000 7.000 3.50 0.112
Residual Error 5 10.000 2.000
Total 7 24.000
Regression Analysis: Log Y versus X1, X2 (Modelo 2)

The regression equation is: Log Y = 0.810 + =.225X1 – 0.348X2
Predictor Coef SE coef T P

Constant 0.8101 0.1622 4.99 0.004
X1 0.2248 0.0697 3.23 0.023
X2 -0.3479 0.1065 -3.27 0.022
s = 0.1272 R-Sq = 69.3% R-Sq(adj) = 57.0%

PRESS = 0.1274 R-Sq(pred) = 51.62%
Source DF SS MS F P
Regression 2 0.1824 0.0912 5.63 0.052
Total 7 0.2634
Regression Analysis: Log Y vs Log X1, Log X2 (Modelo 3)

The regression equation is: Log Y = 0.595 + 1.83 Log X1 – 2.16 Log X2

Constant 0.5949 0.2095 2.84 0.036
Log X1 1.8342 0.7288 2.52 0.053
Log X2 -2.1573 0.8332 -2.59 0.049
s = 0.1483 R-Sq = 58.2% R-Sq(adj) = 41.5%

PRESS = 0.3005 R-Sq(pred) = 0.00%
Source DF SS MS F P
Regression 3 0.1533 0.0767 3.48 0.113
Total 7 0.2634
8-49
TABLA 8.19. Tabla mostrando los datos originales del problema. (Elaboración
propia)
___________________________________________________________________________
C1 C2 C3 C4 C5 C6
___________________________________________________________________________
Y X1 X2 Log Y Log X1 Log X2
___________________________________________________________________________
1 3 4 3 0.477121 0.602060 0.477121
___________________________________________________________________________
2 2 4 4 0.301030 0.602060 0.602060
___________________________________________________________________________
3 7 4 3 0.845098 0.602060 0.477121
___________________________________________________________________________
4 6 6 4 0.778151 0.778151 0.060206
___________________________________________________________________________
5 5 3 2 0.698970 0.477121 0.301030
___________________________________________________________________________
6 6 6 4 0.778151 0.778151 0.602060
___________________________________________________________________________
7 7 3 2 0.845098 0.477121 0.301030
___________________________________________________________________________
8 4 2 2 0.602060 0.301030 0.301030
___________________________________________________________________________
Ejemplo #8. En estudios de química analítica, el uso del análisis de fluorescencia

de rayos X se usa como una herramienta para estimar los porcentajes de los
ingredientes de muchas mezclas. A menudo, la estimación de las concentraciones
depende en la habilidad para ajustar modelos de regresión. En una investigación
intitulada “Corrections for Matrix Effects in X-rays fluorescent Analisis Using
Multiple Regression Methods”, publicado por Analytical Chemistry (Vol. 37,
1965) mezclas contiendo 4 ingredientes (Xi) fueron preparadas. Las
concentraciones de los componentes variaron en las mezclas para producir tipos
estándares de calibración (Yi). (Walpole, 1992, p. 421). Los datos de este problema
se dan abajo.
8-50
TABLA 8.20. Tabla mostrando los datos del problema de arriba.
Yi X1 X2 X3 X4
0.5514 1.1240 0.8980 0.8219 0.9906

0.4426 0.9285 0.8872 0.9308 0.9944
0.5631 1.1214 0.8030 0.7668 1.1221
0.5624 1.1635 0.8706 0.9272 0.9832
0.4505 0.9415 0.8064 0.9026 1.1127
0.5290 1.0712 0.8404 0.8662 1.0836
0.4702 0.9561 0.8731 0.8206 1.0290
0.5001 1.0186 0.8431 0.8346 1.0591
0.4425 0.9039 0.8314 0.7596 1.0994
(Fuente: Walpole et al. 1992)
(a) Ajustar un modelo lineal de regresión múltiple a los datos de la tabla.
Enseguida, estimar las concentraciones del ingrediente A para una mezcla cuya
tasa de intensidades de rayos-X sean, respectivamente, X1 = 1.10, X2 = 0.900, X3 =
0.800 y X4 = 0.995.
Solución:
(a) Usando un paquete de computadora y asumiendo un modelo de regresión lineal
múltiple se obtiene la ecuación de regresión.
Y = -0.3004 + 0.5387X1 + 0.1770X2 – 0.0704X3 + 0.1506X4
Sustituyendo las variables independientes, se obtiene el valor de la respuesta Y, es
decir:
Y = -0.3004 + 0.538(1.10) + 0.1770(0.90) – 0.0704(0.80) + 0.1506(0.995)
= 0.50
Ejemplo #9. Montgomery y Peck (1992) describen el uso de un modelo de
regresión para relacionar la cantidad de tiempo que requiere un vendedor para dar
servicio a una máquina expendedora de artículos y el número de empaques
contenidos en la máquina y la distancia del vehículo (pies) de servicio del sitio
8-51
donde se encuentra la máquina. Este modelo de regresión múltiple fue utilizado

para diseñar la ruta, los horarios y la salida de los vehículos. La tabla de abajo
muestra 25 observaciones del tiempo de suministro, número de empaques y la
distancia, del vehículo.
TABLA 8.21. Tabla mostrando los datos de suministro.
No. de observación Tiempo de suministro No. de envases Distancia del vehículo
1 9.45 2 50
2 24.45 8 110
3 31.75 11 120
4 35.00 10 550
5 25.02 8 295
6 16.86 4 200
7 14.38 2 375
8 9.60 2 375
9 24.35 9 100
10 27.50 8 300
11 17.08 4 412
12 37.00 11 400
13 41.95 12 500
14 11.66 2 360
15 21.65 4 205
16 17.89 4 400
17 69.00 20 600
18 10.30 1 585
19 34.93 10 540
20 46.59 15 250
21 44.88 15 290
22 54.12 16 510
23 56.23 17 590
24 22.13 6 100
25 21.15 5 400
8-52
Para este problema calcular los siguientes enunciados:

(a) El modelo de regresión lineal múltiple poblacional.
(b) El modelo de regresión lineal múltiple de la muestra que estima al modelo
poblacional.
(c) Predecir el tiempo de suministro para pares de valores de las variables de
regresión, número de empaques (x1) y distancia (x2), cuando x1 = 1 empaque y la
distancia es igual a x2 = 25 pies.
(d) Evaluar el modelo de regresión obtenido usando técnicas objetivistas y
sujetivistas, como las descritas en este capítulo.
Discutir el razonamiento que se sigue en la validación subjetiva de los gráficos.
Solución:
(a) El modelo de regresión múltiple, para 2 variables independientes es:
µY|x1,x2| = βo + β1x1 + β2x2 + ε
(b) El correspondiente modelo de regresión lineal múltiple muestral es:
Y = bo + b1X1 + b2X2 + e
Donde:
Y = tiempo de suministro
X1 = no de envases
X2 = distancia del vehículo
El modelo de regresión de la muestra es:
Y = 1.74 + 2.78 (X1) + 0.013 (X2)
(c) Para predecir el tiempo de suministro (Y) en relación con el número de envases,
cuando X1 = 1 y con la distancia del vehículo, cuando X2 = 25 pies se obtiene
sustituyendo los valores en la ecuación de regresión, es decir:
Y = 1.74 + 2.78(1) + 0.013(25) = 4.85
(d) Los resultados objetivistas estadísticos son: R2 = 98.1%; R2ajustada = 97.9%; s =
8-53
2.32; PRESS = 159.89.

TABLA 8.22. Tabla mostrando los valores de T y de P. (Elaboración propia).
Predictor Coeficiente SE coeficiente T P
Constante 1.743 1.155 1.51 0.145
No. de envases 2.790 0.092 30.09 0.000
Distancia del vehículo 0.013 0.003 4.33 0.000
_________________________________________________________________
Fuente de g.l. SS MS F p
Variación
Debido a la 2 5984.8 2992.4 555.2 0.000
Regresión
Error 22 118.6 5.4
Total 24
Para la validación subjetiva del modelo de regresión, analizando las gráficas

de los residuos estandarizados, deben existir, aproximadamente, el mismo número
de residuos positivos y negativos. Además, en la prueba de normalidad, todos los
puntos deben estar dentro de las bandas de confianza. El estudiante deberá hacer
los diagnósticos subjetivos para complementar la refrendación o confiabilidad del
modelo de regresión.
Procedimiento de regresión múltiple usando el programa Minitab
Procedimiento:
1. Irse a: Stat → Regression → Regression
2. En la ventana de “Regression” aparecen las entradas de la variable
dependendiente (Y) y de las variables independientes X1, X2, en sus columnas
respectivas relacionadas con el problema
8-54
3. En la ventanilla de “Response” (de esta ventana de Regression) entrar la variable

dependiente y, en la ventanilla de “Predictors,” entrar las variables independientes
(que se copiaron en las columnas del programa).
4. Debajo de esta venta de Regression están las ventanillas de “Graphs, Options,
Results y Storage”. Por ejemplo si se desea usar Graphs se pueden seleccionar los
residuales regulares o los estandarizados. En la ventanilla de “Option residual
plots”, puntear las gráficas de las cuatro opciones, para el análisis subjetivista.
5. En la ventana de “Regression-Options” puntear las funciones deseadas, v.g.,
variance “Inflation factors, Durbin-Watson statistics, PRESS”, etc.
6. En la ventana de “Regression-Results” puntear las funciones deseadas de las
cuatro enlistadas, v.g., “In addition de sequential sum…..”
Ejemplo #10. Este es un ejemplo del libro Applied Statistics: Análisis of Variance
and Regresion de los autores Dunn y Clark. Esta es una investigación relacionada
con la temperatura, tomada como la variable de respuesta, en función de variables
regresoras como la altitud, longitud y latitud. La tabla de abajo muestra los
resultados. Usando el programa Minitab:
(a) Encontrar el modelo de regresión más apropiado
(b) Validar el modelo usando metodos estadísticos, es decir, estimando el
coeficiente de determinación múltiple R2, R2 ajustada, s, PRESS, tabla de ANOVA,
y gráficas subjetivistas, como residuos versus órdenes, residuos versus valores
ajustados y pruebas de normalidad.
(c) Hacer comentarios acerca de los resultados
8-55
TABLA 8.24. Tabla mostrando los valores de la temperatura en oF (Y), Altitud en

pies (X1), Longitud en grados (X2) y Latitud en grados (X3).
Temperatura (Y) Altitud (X1) Longitud (X2) Latitud (X3)
55.7 1083 112 33
37.8 457 86 38
56.4 312 118 34
51.0 305 90 32
34.5 5221 105 40
34.0 2842 116 44
36.7 807 94 41
33.4 4260 112 41
32.6 815 83 40
49.1 3920 106 32
46.6 1054 84 34
36.3 4397 120 39
18.2 830 93 45
36.7 465 90 39
13.3 1162 92 47
30.1 787 82 41
__________________________________________________________________
Solución:
(a) Se assume un modelo de regresión lineal
(b) La utilidad del modelo se da por los valores de R2, s, PRESS, etc. mostrados
por las Figuras 8.12 (a), (b) y (c).
Regression Analysis: (Y) Temperatura versus (X1) Altitud, (X2) Longitud (X3)
The regression equation is: (Y) Temperatura = 99.2 - 0.00138 (X1) Altitud + 0.299 (X2)
Longitud - 2.29 (X3) Latitud
Predictor Coef SE Coef T P VIF

Constant 99.24 10.79 9.20 0.000
(X1) Altitud -0.0013780 0.0005968 -2.31 0.040 1.7
(X2) Longitud 0.29877 0.07736 3.86 0.002 1.7
(X3) Latitud -2.2900 0.1779 -12.87 0.000 1.0
8-56
s = 3.12166, R-Sq = 94.6%, R-Sq(adj) = 93.2%, PRESS = 214.855, R-Sq(pred) = 90.08%
Analysis of Variance Table
Source DF SS MS F F crítica P
Regression 3 2048.54 682.85 70.07 F.05;3,12 = 3.49 <<< 0.001
Total 15 2165.48
Durbin-Watson statistic = 1.53384
(a) (b) (c)

Residuals Versus the Order of the Data Residuals Versus the Fitted Values Normal Probability Plot of the Residuals
(response is (Y) Temperatura) (response is (Y) Temperatura) (response is (Y) Temperatura)
2 2 99
95
90
1
1
80
70
Percent
60
0 0 50
40
30
20
-1 -1
10
-2 -2 1
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 20 30 40 50 60 -3 -2 -1 0 1 2 3
Observation Order Fitted Value Standardized Residual
Figura 8.12. La Figura (a) muestra los residuales vs. órdenes; la figura (b) muestra
los residuales vs. los valores ajustados y la figura (c) da la prueba de normalidad.
(c) En conclusión, de acuerdo a los valores del coeficiente de determinacion R2 =
95.6% hay un buen ajuste del modelo. El valor de F de la ANOVA rechaza la
hipótesis de igualdad de promedios (de altitud, longitud y latitud), con un valor de
p muy significativo. Las pruebas de T son significantes, lo que sugiere que no hay
problemas de multicolinealidad. Análogamente, los valores bajos de VIF sugieren
indican que no hay problemas de multicolinealidad. Esto, aunado, a los signos de
las variables regresoras de la ecuación de regresión, los cuales si están de acuerdo a
una lógica a posteriori. El valor de la función de Durbin-Watson Statistic o de
correlación en serie igual a 1.53384 indica que no hay problemas de
autocorrelación (aunque aquí, esto se puede ignorar porque el problema no
involucra series de tiempo). En cuanto a la Figura 8.12 la gráfica (a) muestra los
residuales versus los órdenes, en la cual hay aleatoriedad de los datos.
Análogamente, la gráfica de residuales vs. valores ajustados (b) indica alateoridad
8-57
o independencia de los datos, sin problemas de heteroscedasticidad (errores de

varianzas no constantes), etc. Finalmente, la gráfica de la prueba de normalidad (c)
indica que los datos están normalmente distribuidos (porque todos los puntos están
dentro de las bandas de confianza), aunque con sesgo positivo.
Nota: ¿Cree usted qué, eventualmente, el calentamiento global, debido a las
emisiones de gases de invernadero, generados por emisiones vehiculares e
industriales va a modificar las temperaturas que van en función de la latitud?
Ejemplo #11. Este es un ejemplo hipótetico mostrando la relación entre las
concentraciones de ozono artificial, a nivel del suelo (ppm) y las temperaturas (oF).
Este ejercicio está encaminado a calcular, manualmente, los residuales y de hacer
una gráfica mostrando los residuales crudos. Los datos se dan en la tabla de abajo.
TABLA 8.25 mostrando los datos de este problema.
__________________________________________________________________
Concentraciones de O3 (y)| 75 80 86 94 99 107
__________________________________________________________________
Temperatura (oF) (x) | 65 71 79 85 93 100

(a) Calcular el modelo de regresión y medir su adecuación estimando R2, R2(ajust.),
s, PRESS y la estadística Durbin-Watson
(b) Hacer una tabla mostrando el valor de la desviación entre los datos y el ajuste,
es decir, de los residuales regulares o crudos ei = yi – y i.
(c) Hacer una gráfica de O3 (y) y temperaturas (x) mostrando los residuales crudos
Solución:
(a) Usando un paquete de computadora da la ecuación de regresión:
Concentración de ozono ( y ) = 15.4 + 0.909 Temperatura (x)
s = 1.101, R2 = 99.3%, R2(ajust.) = 99.2%, PRESS = 9.42837, estadística Durbin-Watson = 3.33
(b) La TABLA 8.26 muestra los valores ajustados ( y i), los residuales y SSE.
8-58

____________________________________________________________________________________________
Residual crudo Suma de los cuadrados del error
i xi yi y i = 15.44 + 0.909 x ei = yi - y i SSE = (yi - y i)2
_________________________________________________________________________________________________________________________________________
1 65 75 y 1 = 74.53 75 – 74.53 = 0.48

0.2304
2 71 80 y 2 = 79.98 80 – 79.98 = 0.02
0.0004
3 79 86 y 3 = 87.25 86 – 87.25 = -1.25
1.5625
4 85 94 y 4 = 92.71 94 – 92.71 = 1.30
1.6900
5 93 99 y 5 = 99.98 99 – 99.98 = -0.98
0.9604
6 100 107 y 6 = 106.34 107 – 106.34 = 0.66
0.4356
Σ(yi - y i) = 4.8793
2
__________________________________________________________________________________________
(c) La Figura 8.13 de abajo muestra las concentraciones de ozono en función de las
temperaturas con los valores de los residuales ei.
8.13. Figura mostrando la medicion de cada uno de los valores residuales con la
línea de regresión. (Elaboración propia).
8-59
8.1. Los datos de abajo muestran las emisiones de óxidos de nitrógeno (NOx)
provenientes de calderas de plantas eléctricas.
Tabla mostrando los datos para el problema. (Elaboración propia)
__________________________________________________________________
MBtu/hr-ft2 (X) |100 125 125 150 150 200 200 250 250 300 300 350 400 400
NOx (Y) |150 140 180 210 190 320 280 400 430 440 390 600 610 570
(a) Calcular la ecuación de regresión de la muestra que estima a la verdadera ecuación

poblacional. (Y = -24.2 + 1.59X)
(b) Calcular el coeficiente de correlación R2 y R que estiman a ρ. (R2 = 0.95)
(c) ¿Cuál es la estimación esperada de la emisión de NOx cuando la tasa de liberación
es de 225 MBtu/hr-ft2? (333.67)
(d) Usar el programa de computadora de Minitab y analizar las gráficas de los
residuos para la prueba de normalidad y de los residuos en función del valor de X. (El
lector lo deberá hacer)
8.2. Este es un ejemplo del libro de Introducción al Analisis de Regresión Lineal de
Mongomery et al. (2001), donde habla de un ejemplo relacionado con las
concentraciones de ozono de debido al calor. Así, Davidson (“Update on Ozone
Trenes in California’s South COSAT Basin”, Air and Waste, 43, 226, 1993) estudio
las concentraciones de ozono en la cuenca aérea de la costa sur de California, durante
los años 1976 a 1991. Se cree que la cantidad de días en que las concentraciones de
ozono fueron mayores que 0.20 ppm depende del índice metereológico estacional,
que es el promedio estacional de la temperatura con 850 milibares. La siguiente
información muestra los datos.
8-60

___________________________________________________________________
Año No. de Días (y) Índice meteorológico
___________________________________________________________________
1976 91 16.7
1977 105 17.1
1978 106 18.2
1979 108 18.1
1980 88 17.2
1981 91 18.2
1982 58 16.0
1983 82 17.2
1984 81 18.0
1985 65 17.2
1986 61 16.9
1987 48 17.1
1988 61 18.2
1989 43 17.3
1990 33 17.5
1991 36 16.6
__________________________________________________________________
Fuente: Montgomery et al. 2001
(a) Estimar la ecuación de regresión
(b) ¿Qué tanta confiabilidad se le puede dar al modelo seleccionado? Usar enfoques
estadísticos y gráficos para justificar esta pregunta.
8.3. En un estudio agrícola, para ver los efectos de los cambios climáticos globales
relacionado, con los patrones pluviales alterados debido al calentamiento global, por
las emisiones de CO2, se estudió la precipitación pluvial anual y el rendimiento de la
cosecha de gramíneas. La tabla de abajo da los datos.
8-61

Precipitación pluvial Rendimiento de la cosecha
en pulgadas (X) en libras por acre (Y)
7.12 1037
63.54 380
47.38 416
45.92 427
8.68 619
50.86 388
44.86 321
___________________________________________________________________
Ver cuál modelo de regresión encaja mejor en los datos, al juzgar por las estadísticas
y por los análisis gráficos, es decir, usando una aproximación lineal, una logarítmica
y una aproximación de función de potencia de la forma de Ln (Y) = Ln(a) + b(LnX).
(a) Usar una aproximación lineal como Y = a + bX y, además, calcular el coeficiente
de determinación R2. (Y = 880.4 – 9.6 (X), R2 = 0.699)
(b) Usar una aproximación logarítmica como Y = a + b Ln (X) y además, calcular el
valor de R2. (Y = 1331.08 – 557.03 Lg X)
(c) Usando una aproximación de función de potencia de la forma de Ln (Y) = Ln (a)
+ b (Ln X) y, además, calcular R2 (R2 = 0.829)
8.4. En un estudio de química analítica, en la tabla de abajo se da la relación entre la
temperatura y la molaridad (en moles por litro) de una sustancia. Para esto hacer los
siguientes:
(a) Estimar el modelo de regresión más apropiado basado en análisis estadísticos de
R2, R2ajustada, PRESS, s, y Cp y en análisis gráficos subjetivos de los valores
8-62
residuales.
Tabla mostrando la información requerida.
_________________________________________________________________
Temperatura oC | 4.3 4.5 4.8 5.5 5.7 5.9 6.4 6.7 7.5 7.9
_________________________________________________________________
Molaridad | 12.1 12.5 12.9 13.0 13.1 14.0 14.2 14.8 15.0 15.5
_________________________________________________________________
8.5. El aluminio es el tercer elemento más abundante que ocurre en minerales, rocas
y barros. El aluminio se puede analizar con el método de absorción atómica
espectrométrica (método A), el cual está exento de interferencias como fluoruros y
fosfatos. El aluminio también se puede analizar por medio del método de
calorimetría de cianuro de Eriocromo R (método B), el cual es más simple que el
anterior. La tabla de abajo muestra los resultados de los análisis (en mg/L) de los dos
métodos usados. Hacer los siguientes cálculos usando el programa de computadora
de Minitab o SAS.
(a) Calcular e interpretar el coeficiente de determinación R2 y el coeficiente de
correlación R. (R2 = 0.9922, R = 0.9961)
Tabla mostrando los datos del ejemplo. (Elaboración propia)
Método A | 5 6 6 8 10 10 11 11
Método B | 8 9 9 11 13 13 14 14
8.6. El berilio (Be) y sus compuestos son extremadamente venenosos y capaces de

causar la muerte en concentraciones altas. La inhalación del Be causa una seria
afección llamada beriliosis. El berilio también puede causar dermatitis, conjuntivitis,
neumonía aguda y beriliosis pulmonar crónica. Este elemento químico se usa en los
reactores atómicos, aviones, cohetes y en combustibles para mísiles. Hay dos
8-63
métodos para el análisis (en µg/L) del berilio, es decir, el método espectrométrico de
absorción atómica (método 1) y el método aluminon (método 2). Los resultados de
los análisis de los dos métodos se dan en la tabla de abajo. Hacer los siguientes
cálculos:
(a) Hacer un estudio estadístico objetivista, es decir, estimando los valores de R2,
R2ajustada, PRESS, s y tablas de ANOVA. Complementar el estudio haciendo análisis
subjetivistas.
Tabla mostrando los resultados de los métodos 1 y 2 para la medición del berilio.
Método 1 | 0 3 4 5 9 12 15 17 20 20
Método 2 | 1 7 11 19 24 31 31 35 41 41
8.7. En investigaciones de toxicología existen estudios que han demostrado que la

probabilidad de qué, un fumador de 40 años de edad, quien ha sido fumador los
últimos 10 años contraiga el cáncer pulmonar en los próximos 20 años es alta
(asumiendo que continúe fumando al mismo ritmo). Esta relación va en función del
número promedio de cigarrillos que fuma. Asumir un modelo de regresión lineal. La
tabla de abajo presenta los datos de esta investigación de toxicología.
8-64

Número de cigarrillos Probabilidad de cáncer
fumados por día pulmonar
5 .100
10 .113
20 .225
30 .300
40 .450
50 .540
60 .700
80 .860
(a) Identificar la variable dependiente y la variable independiente.
(b) Describir la ecuación de regresión que mejor encaje en los datos. (Y = 0.0981 –
0.00002(X) + 0.0003(X 2))
(c) Calcular R2, R2ajustada, s, y PRESS. (R2 = 0.996, R2ajustada = 0.995 s = 0.019,
PRESS = 0.0038)
(d) Analizar e interpretar los componentes de la tabla de ANOVA como Fcalc., Fcrítica
y el valor de p.
(e) Discutir la relación existente entre R2, s, PRESS, Fcalc., y el valor de p.
(f) Validar el modelo de regresión subjetivamente, es decir, analizando los gráficos
de los residuos estandarizados.
8.8. Se realizó un estudio de química ambiental y se registraron las cantidades de
cloruro de sodio (NaCl), el cual, cuando se disolvió en 100 gramos de agua destilada,
a diferentes temperaturas (oC) dio los siguientes resultados:
8-65

___________________________________________________________________
Temperatura (X) NaCl disuelto en gramos de agua (Y)
0 8 6 8
15 12 10 14
30 25 21 24
45 31 33 28
60 44 39 42
75 48 51 44
Calcular los siguientes enunciados:

(a) Graficar los datos.
(b) Encontrar la línea de regresión y ponerla en la gráfica.
(c) Estimar la cantidad de NaCl que se disolverá a una temperatura de 300 K.
(d) A sabiendas de que, a medida que aumenta la temperatura, la disolución de las
sustancias, como las sales de sodio, aumenta proporcional al incremento de la
temperatura, entonces, siendo así, verificar de que hay una correlación casi perfecta
entre ambas variables.
(e) Hacer una prueba de hipótesis para el coeficiente de correlación muestral R, para
verificar que si existe una asociación lineal significante entre las dos variables.
Sugerencia: usar la estadística de t de Estudiante dada abajo:
t= R 2
con ν = n - 2 grados de libertad.
1− R n − 2
(f) Teóricamente, la disolución de muchas sales va en función directa a la

temperatura y, en teoría, el valor del coeficiente de determinación, R2 debería de ser
de 1.0. Siendo así, enlistar 2 factores (en el laboratorio de química) que pudieran
afectar la disolución de las sales y de no dar un valor menor que 1.0.
8.9. En un estudio de meteorología entre la cantidad de lluvia y la remoción de
8-66
contaminantes atmosféricos, se dio la siguiente información:

Precipitación (X) Remoción de partículas (Y)

(0.01 cm./día) (µg/m3)
4.3 126
4.5 121
5.9 116
5.6 118
6.1 114
5.2 118
3.8 132
2.1 141
7.5 108
(a) Calcular la remoción de contaminantes (Y) cuando el valor de la precipitación

pluvial es de X = 8.0. (102.44)
(b) Validar el modelo de regresión objetiva y subjetivamente.
8.10. En un estudio para evaluar la capacidad de los sistemas de flujo freático
(wetlands), usados para la degradación de la materia orgánica de las aguas residuales
se uso el parámetro de la demanda bioquímica de oxígeno (DBO) y varios otros
componentes quíٌ
micos. Este estudio dio como resultado los siguientes datos. Estos
resultados están relacionados con la carga de masa de DBO (en Kg./hectárea/día), la
cual se usó como la variable independiente (X) y, la degradación de la concentración
de masa carbonosa de DBO5 (en Kg./ha/día), la cual se uso como la variable
dependiente (Y). (Fuente de información es “Surface Floor Wetlands: A Performance
Evaluation”. Water Environ. Res., 1995, pp.244-247).
8-67
(X) | 3 8 10 11 13 16 27 30 35 37 38 44 103 142
(Y) | 4 7 8 8 10 11 16 26 21 9 31 30 75 90
(Fuente: Water Environ. Res., 1995)
(a) Graficar los datos

(b) Establecer el modelo de regresión más apropiado para este problema. Hacer los
mismos cálculos que el problema anterior.
(c) Validar el modelo de regresión seleccionado, objetivistamente, usando los
siguientes criterios o diagnósticos:
(1) Cálculo del coeficiente de determinación R2
(2) Cálculo del coeficiente de determinación ajustado, R2ajustado
(3) El coeficiente de correlación R
(4) La estadística PRESS
(5) El error estándar de lo estimado, s (Util para medir la utilidad del modelo. Se
selecciona el modelo que tenga el valor de s más pequeño)
(d) Evaluar el modelo candidato a través de los siguientes criterios gráficos:
(1) Prueba de normalidad
(2) Residuales en función de los ordenes
(3) Residuales en función de los valores ajustados
(e) Una vez que se haya seleccionado el modelo más apropiado, calcular la
remoción del DBO después de que el agua residual se degradó en el wetland cuando
la carga fue de 50 Kg./ha/día.
8-68
Nota: Los sistemas de flujo freático (áreas pantanosas) se usan como sistemas de
tratamiento natural, porque tienen la capacidad de degradar las concentraciones
carbonosas de DBO actuando como especie de lagunas de oxidación. En Minatitlán
y Coatzacoalcos, Veracruz, se usan estos tipos de tratamientos naturales.
Solución:
De acuerdo a la tabla de arriba se le pide al lector decidir, cuál modelo es superior.
8.11. El texto de Daniel, W.W., James C. Terrell Business Statistics (1989), p. 257
mencionan el problema del envenenamiento del ganado vacuno, por los insecticidas
el cual es un problema muy serio, porque los pesticidas tienen la facultad de
acumularse en los tejidos de los animales y, de ahí se pasan a aquellas personas que
los consumen. Así, en aňos recientes, los ambientalistas se han preocupado mucho
por los efectos, en el medio ambiente, debido al uso indiscriminado de insecticidas.
Es verdad que los insecticidas matan los insectos, pero también matan todo lo demás.
De esta manera, los insecticidas contaminan los frutos de las plantas, a los animales y
también a la gente. Los investigadores Mount y Oehmet estudiaron los efectos de los
insecticidas en las ovejas relacionada con la actividad enzimática en el cerebro.
Además, de otros análisis estadísticos, estos científicos derivaron una línea de
regresión que describe las relación entre la actividad enzimática en el cerebro de las
ovejas (Y) y el tiempo, en horas, después de que las ovejas has sido expuestas a los
insecticidas (X). La función de la línea de regresión estimada por estos científicos se
da abajo.
Y = 27.32 + 1.36 X
Basando el criterio en esta ecuación, estimar lo siguiente:
(a) Si después de que han pasado 30 horas, cuando las ovejas han sido expuestas a
los insecticidas, ¿Cuál sería el valor de la actividad enzimática? (68.12)
(b) Si el coeficiente de correlación muestral se da como R = 0.86 y, el coeficiente de
8-69
determinación es R2 = 0.74 (el que mide la fuerza de la relación lineal entre X e Y, es

decir, el % de asociación entre las dos variables), entonces, hacer una prueba de
hipótesis con Ho:ρ = 0, contra H1:ρ ≠ 0 (que es lo mismo que decir que no hay
asociación lineal entre X e Y). Asumir que el tamaño de la muestra es de n = 16 y el
nivel significante de α = 0.05.
Para esto, seguir las siguientes sugerencias:
Usar la distribución de t con ν = n – 2 grados de libertad y usar las regiones críticas
dadas por t[1-α/2;ν].
8.12. En estudios de química, la presión de un gas que corresponde a varios
volúmenes (de acuerdo a la ley de los gases de Boyle) se da en la tabla de abajo.
Asumir que el volumen del gas es (X) y la presión es (Y). Hacer los siguientes
cálculos:
(a) Hacer una gráfica con los datos.
(b) Estimar la línea de regresión de la muestra.
(c) Estimar el coeficiente de determinación R2 y el coeficiente de correlación R.
Interpretar los resultados.
(d) Predecir la presión del gas, cuando el volumen es .001 m3
(e) Predecir la presión del gas, en libras por pulgada cuadrada (lbs/in2) y, en
atmósferas (atm), cuando el volumen del gas es de 0.0528 cuartos (.05 L).
(f) En teoría, debido a que la relación entre el volumen del gas y la presión es
inversamente proporcional, el coeficiente de correlación debería ser de R = -1.0. Sin
embargo, si R difiriera del valor de -1.0, enlistar 3 factores que pudieran intervenir
para explicar esta situación.
8-70
Tabla mostrando los volúmenes y las presiones del gas. (Elaboración propia)
Volumen en cm3 | 50.0 60.0 70.0 90.0 100.0
Presión en Kg./cm2 | 64.7 51.3 40.5 25.9 7.8
Sugerencias: Se dan los siguientes factores de conversión: 1 atm = 14.7 lbs/in2 = 760
torr = 1.0668 kg/cm2; 1 cm2 = 0.16 in2; 1.0567 cuartos = 1 L; 1 pulgada cuadrada =
6.25 cm2; 1 m3 = 1000 L. = 106 cm3.
8.13. Se coleccionó una muestra de 33 casos de una descarga de aguas residuales
municipales. Esta muestra se analizó para la demanda bioquímica de oxígeno de 5
días (DBO5), en libras por día, y la demanda química de oxígeno, DQO (en libras por
día). La tabla de abajo muestra la información requerida.
Tabla mostrando las mediciones de DBO5 y DQO. (Elaboración propia)
Demanda química de oxígeno Demanda bioquímica de oxígeno
(lbs/día) (lbs/día)
494 486 216 202

444 556 200 240
528 600 238 280
396 428 164 184
532 440 230 194
308 291 116 134
350 490 150 215
456 545 190 246
440 582 190 292
544 368 248 177
309 386 120 193
538 400 226 165
480 347 200 160
500 278 222 125
396 304 176 137
8-71
Hacer lo siguiente:
(a) Ver su existe una correlación significante usando los valores R del DBO5 y el
DQO. (R = 0.9677, R2 = 0.9360)
(b) Interpretar el valor del coeficiente de correlación R y el coeficiente de
determinación R2. Usar el programa Minitab o EXCEL para hacer el cálculo pedido.
Nota. La demanda bioquímica de oxígeno de 5 días (DBO5) mide la concentración,

en mg/L o en libras por día de la materia carbonosa del agua residual. De hecho el
DBO mide la fracción biodegradable del drenaje, o del agua residual industrial o
doméstica, en términos del carbono. Usualmente, las unidades son en mg/L. Sin
embargo, esto se debe a que, anteriormente, se usaba indiscriminadamente las
unidades de ppm y mg/L. Después, se vio que, con los residuos tóxicos, la gravedad
específica era diferente a la de los residuos carbonosos. Por esta razón es mejor usar
las unidades de mg/L. Por otra parte, la prueba del DBO es de 5 días, para evitar la
nitrificación. En cambio, la prueba de la demanda química de oxígeno mide los
compuestos orgánicos biodegradables y los compuestos orgánicos tóxicos. Esto
quiere decir que, la demanda química de oxígeno (DQO) oxida la cantidad de
materiales totales oxidables presentes en el agua residual y varía con la composición
del agua, la temperatura, el periodo de contacto y otros factores más.
8.14. Considerar los datos de abajo relacionados con el peso del vehículo y el
rendimiento de gasolina. El peso del auto se da en toneladas y, el rendimiento del
combustible se da en millas galón. Los datos se dan abajo.
8-72
Tabla mostrando los datos del los modelos vehiculares en función del peso en
toneladas (X), y de millas por galón (Y).
________________________________________________________________
Modelo vehicular Peso (toneladas) Millas/galón
Buick Estate Wagon 4.36 16.9

Ford Country Squire Wagon 4.05 15.5
Chevy Malibu Wagon 3.61 19.2
Chrysler Le Baron Wagon 3.94 18.5
Toyota Corona 2.56 27.5
Datsun 510 2.30 27.2
Dodge Omni 2.23 30.9
Audi 5000 2.83 20.3
Volvo 99 GLE 3.14 17.0
Saab 99 GLE 2.80 21.6
Peugot 694 SL 3.41 16.2
Buick Century Special 3.38 20.6
Mercury Zephyr 3.07 20.8
Dodge Aspen 3.62 18.6
AMC Concord D/L 3.41 18.1
Chevy Caprice Classic 3.84 17.0
Ford LTD 3.73 17.6
Mercury Grand Marquis 3.96 16.5
Ford Mustang 2.59 26.5
Mazda GLC 1.98 34.1
Dodge Colt 1.92 35.1
VW Scirocco 1.99 31.5
Honda Accord LX 2.14 29.5
Buick Skylark 2.67 28.4
Chevy Citation 2.60 28.8
Oldsmobile Omega 2.70 26.8
Plymouth Horizon 2.20 34.2
Datsun 210 2.02 31.8
VW Dasher 2.19 30.5
Datsun 810 2.82 22.0
BMW 3210 2.60 21.5
VW Rabbit 1.93 31.9
(Fuente: Probabilidad y Estadistica Aplicadas a la Ingenieria. Montgomery et al.

1996)
Hacer los siguientes cálculos usando el programa Minitab.
(a) Estimar la línea de regresión entre las variables peso del vehículo y el
8-73
rendimiento de gasolina.
(b) Estimar el coeficiente de correlación de la muestra R (llamado también
coeficiente de correlación de producto-momento de Pearson) y el coeficiente de
determinación muestral R2.
(c) Hacer una gráfica que vaya en función de Y y X, trazarla en la gráfica y también
trazar la línea horizontal usando el valor del promedio de Y.
(d) Hacer una tabla de ANOVA.
(e) Estimar los intervalos de confianza para α y β las probabilidades
correspondientes para cada uno de éstos.
(f) ¿Qué otros factores tendrían que considerarse, para que el modelo de regresión
fuera más confiable?
8.15. Los metales pesados como el Hg, Cr, Pb, etc., pueden interferir con el
tratamiento biológico en las plantas municipales de aguas residuales domésticas. En
este estudio se hicieron mediciones mensuales en una planta modelo de tratamiento
de las concentraciones de cromo, Cr, en mg/L, tanto en el efluente como en la
entrada. Los resultados de las concentraciones de Cr se dan en la tabla de abajo.
Entrada (X) | 250 290 270 100 300 410 110 130 1100
(µg/L)
Efluente (Y) | 19 10 17 11 70 60 18 30 180
(µg/L)

(a) Hacer un diagrama de dispersión en papel aritmético.
(b) Hacer un diagrama esparcido en papel semilogaritmo y logaritmo completo
(transformación de los ejes).
(c) Calcular los modelos de regresión para las partes (a) y (b).
(Y = -9.06 + 0.17X; Y = -1.96 + 0.97X)
8-74
(d) Estimar Y cuando X = 350 en incisos (a) y (b).

(e) Calcular el coeficiente de correlación para (a) y (b). (R2 = 0.9425, R = 0.7469)
(f) Comentar sobre lo apropiado de Y y de R en cada caso.
8.16. En un estudio de microbiología ambiental relacionado con el cultivo de una
muestra de agua se dan los siguientes datos.
Tiempo en días desde | 3 6 9 12 15 18
la inoculación (X)
___________________________________________________________________
No. de bacterias (Y) | 115,000 14,700 23,900 35,600 57,900 86,400

(a) Trazar una curva Ln Yi versus Xi para ver qué tan bien se puede ajustar una curva
exponencial a los datos.
(b) Trazar una curva Yi versus Xi para ver que también se puede ajustar una línea
recta a los datos.
(c) Por interpolación, usando ambas gráficas estimar el número de bacterias después
de 20 días. Cuantificar las diferencias en ambos casos.
8.17. En el libro de J. L Devore, Probabilidad y Estadística para Ingeniería y
Ciencias se da una investigación relacionada con la temperatura (oC) y la
profundidad de la nieve acumulada en el suelo. Para esto se la tabla de abajo:
_______________________________________________________________
Temperatura (oF) | -62 -41 -36 26 -33 -56 -50 -66
_______________________________________________________________
Profundidad de la | 21 13 12 3 6 22 14 19
capa de nieve
_______________________________________________________________
(Fuente: Devore 2001) .
(a) Identificar la variable dependiente (Y) y la variable independiente (X).

8-75
(b) Estimar un modelo de regresión lineal. (Y = 5.71 – 0.202(X), R2 = 0.741, s =

3.759, PRESS = 409.02, F = 17.8, p = 0.006)
(c) Estimar un modelo cuadrático. (Y = 3.3 – 0.0943(X) + 0.0029(X 2), s = 0.019, R2
= 0.996, PRESS = 0.0038, F = 14.98, p = .008)
(d) Estimar un modelo cúbico. (Y = 9.96 – 0.139(X) + 0.0189(X 2) + 0.00022(X 3),
R2 = 0.914, s = 2.656, PRESS = 8007.75, F = 14.14, p = 0.14)
(e) De acuerdo a los resultados estadísticos, ¿Cuál de los tres modelos es superior?
8.19. La tasa de flujo en m3/min en un muestreador de alto volumen para medir la
calidad del aire, es decir, para partículas atmosféricas, depende de la caída de
presión, en pulgadas de agua, a través del filtro del muestreador. Siendo así,
supóngase que se coleccionó una muestra de 15 valores de caída de presión y la tasa
de flujo del aire a través del filtro del sensor. Los datos se dan en la tabla de abajo.
Tabla mostrando los datos para este problema. (Elaboración propia)
Tasa de flujo del aire con Caída de presión después de
3
las partículas (m /min) algún tiempo (pulgadas de agua)
2.00 5.0
1.99 6.0
1.88 7.0
1.76 7.8
1.68 8.4
1.57 9.6
1.46 9.9
1.40 10.6
1.39 11.7
1.20 14.0
1.15 15.9
1.07 19.0
1.01 24.0
1.00 28.0
0.95 35.0
(a) Calcular el modelo de regresión muestral que estime a la verdadera línea

8-76
poblacional. Para esto, identificar, primeramente, la variable dependiente y la

variable regresora. (Y = 1.95 – 0.0364 (X))
(b) Validar el modelo de regresión estimado en (a) usando enfoques subjetivos, es
decir, a través de gráficas con residuos estandarizados versus valores de caída de
presión. También hacer otra gráfica de residuos estandarizados versus los renglones.
Hacer otra gráfica más con los valores residuales versus los valores de z para la
prueba de normalidad.
(c) Complementar la validación del modelo de regresión usando métodos estadísticos
objetivistas. Para esto, estimar el coeficiente de determinación R2, el error estándar
de lo estimado (s dado por el Minitab) y PRESS. Usar el programa Minitab para
estos cálculos. (R2 = 76.0%, s = 0.1869, PRESS = 0.7405)
8.21. Se hace un estudio sobre la concentración de cadmio atmosférico, en ppm, yi y
su relación con Xi = la altura de los muestreadores y X2 = distancia de la fuente
emisora. La tabla de abajo muestra los datos. Hacer los siguientes cálculos:
(a) Ajustar el modelo de regresión que pueda ajustar a los datos del problema de la
concentración de Cd. (Y = 350.99 – 1.27X1 – 0.154X2)
(b) Validar el modelo usando enfoques de diagnóstico de estadística de inferencia
(objetivistas) y de análisis gráfico (subjetivistas).
(c) Usar el modelo de regresión lineal múltiple para predecir el la concentración de
cadmio, cuando la altura del muestreador es de X1 = 25 metros y la distancia de la
fuente emisora, es X2 = 851 metros. (188.2 ppm de Cd)
La tabla de abajo muestra los datos requeridos por este problema.
8-77

y (concentración de Cd) | 193 230 172 91 113 125
X1 (Altura del muestreador) | 1.6 15.5 22.0 43.0 33.0 40.0
X2 (Distancia) | 851 816 1058 1201 1357 1115
8.22. El texto Applied Statistics: Analysis de Variance and Regression de los

investigadores Olive Dunn y Virginia Clark, discuten un ejemplo para predecir el
rendimiento de la cosecha de cebada, en función de la precipitación pluvial X1 y la
temperatura X2. Para esto, hacer los siguientes cálculos:
(a) Enlistar el modelo de regresión lineal múltiple que mejor ajuste a los datos.
(b) Estimar la ecuación de los cuadrados mínimos que ajuste el rendimiento de trigo
(Y) a la precipitación pluvial (X1) y la temperatura (X2).
(c) Probar la hipótesis de Ho: β2 = 0 con α = 0.05.
(d) Estimar el coeficiente de correlación parcial ρ2y.1 y probar Ho:ρ 2y.1 = 0
(e) Validar el modelo de regresión derivado para ver, qué tanta confiabilidad se le
puede acreditar. Hacer esto, a través de juicios objetivistas, como los diagnósticos R2,
R2ajustada, R2predecida, s, PRESS y Cp. Complementar la evaluación del modelo usando
técnicas subjetivistas, como los análisis de los gráficos de residuales estandarizados y
estudiantizados, prueba de normalidad, etc.
8-78
Tabla mostrando los rendimientos de cebada como variable dependiente de la

precipitación pluvial y la temperatura.
Rendimiento de cebada (yi) Precipitación (x1) Temperatura (x2)
(fanegas/acre) (pulgadas) (oF)
21.0 45 54.1
20.0 47 61.6
21.0 33 50.8
24.0 39 52.1
20.0 30 50.2
12.5 28 57.1
19.0 41 55.7
23.0 44 57.6
23.0 31 50.1
19.0 29 38.0
21.0 34 56.2
12.0 27 51.5
21.0 42 54.1
27.0 35 46.7
17.5 43 60.8
26.0 39 56.9
11.0 31 60.3
24.0 42 54.6
26.0 43 53.5
18.5 47 64.0
15.5 25 45.7
(Fuente: Dunn et al. 1974. Applied Statistics: Analysis de Variance and Regression)
8.23. El texto Applied Statistics: Analysis de Variance and Regression de Dunn et al.
1974) hace un estudio médico relacionado con el cambio de la hemoglobina de la
sangre de operaciones de la glándula tiroides, el cual está relacionado con la duración
de la operación quirúrgica y el cambio en el porcentaje de la hemoglobina de la
sangre. Los datos se dan en la tabla de abajo.
8-79
Tabla mostrando los datos.

________________________________________________________________
No. de paciente | 1 2 3 4 5 6 7 8
Pérdida de sangre (x1) | 105 80 86 112 109 100 96 120
Duración en minutos (x2) | 503 490 471 505 482 490 513 464
% de cambio de
hemoglobina (y1) | -1.7 -4.6 -9.8 -1.1 -4.1 -3.3 0.4 -2.9
________________________________________________________________
Fuente: Dunn et al. 1974
(a) Encontrar el modelo de regresión múltiple para predecir el porcentaje del cambio
de la hemoglobina (y) en función de las variables independientes, es decir, duración
de la operación (x1) y de la pérdida de sangre (x2). (y = -84.002 + 0.129x2
+ 0.138x2)
(b) Predecir el % del cambio en la hemoglobina, cuando la duración en minutos de la
operación es de 80 y la pérdida de sangre es de 350 ml. (25.38%)
(c) ¿Discutir, qué tanta fidelidad se le puede otorgar al modelo de regresión múltiple
obtenido en este problema?
(d) Calcular el coeficiente de determinación múltiple. (R2 = 0.813)
(e) Calcular el coeficiente parcial de correlación, es decir, entre y y x1, con x2
constante. (0.793)
8.24. El libro de Jay L. Devore intitulado Probabilidad y Estadística para Ingeniería
y Ciencias discute el diseño eficiente de ciertos incineradores de desperdicios
municipales, los cuales requieren de información acerca del contenido energético de
los desperdicios. Acordemente, los autores del artículo “Modelling the Energy
Content of Municipal Solid Waste Using Multiple Regression Techniques (J. of the
Air and Waste Mgmt. Assoc., 1996, pp. 650-656) proporcionaron los siguientes datos
acerca de Y = contenido energético (Kcal/Kg.), en función de regresores % de
8-80
plásticos en peso, % de papel en peso, % de basura en peso y % de humedad de peso.

_______________________________________________________________________________________________
Obs. % Plástico (x1) % Papel (x2) % Basura (x3) % Humedad Contenido energético (y)
_______________________________________________________________________________________________
1 18.69 15.65 45.01 58.21 947
2 19.43 23.51 39.69 43.61 1407
3 19.24 24.23 43.16 46.63 1452
4 22.64 22.20 35.76 45.85 1553
5 16.54 23.56 41.20 55.14 989
6 21.44 23.65 35.56 42.24 1162
7 19.53 24.45 40.18 47.20 1466
8 23.97 19.39 44.11 43.82 1656
9 21.45 23.84 35.41 51.01 1254
10 20.34 26.50 34.21 49.06 1336
11 17.03 23.46 32.45 53.23 1097
12 21.03 26.99 38.19 51.78 1266
13 20.49 19.87 41.35 46.69 1401
14 20.45 23.01 43.59 53.57 1223
15 18.81 22.62 42.20 52.98 1216
16 18.28 21.87 41.50 47.44 1334
17 21.41 20.47 41.20 54.68 1155
18 25.11 22.59 37.02 48.74 1453
19 21.04 26.27 38.66 53.22 1278
20 17.99 28.22 44.18 53.17 1153
21 18.73 29.39 34.77 51.06 1225
22 18.49 26.58 37.55 50.66 1237
23 22.08 24.88 37.07 50.72 1327
24 14.28 26.27 35.80 48.24 1229
25 17.74 23.61 37.36 49.92 1205
26 20.54 26.58 35.40 53.58 1221
27 18.25 13.77 51.32 51.38 1138
28 19.01 25.62 39.54 50.13 1295
29 21.25 20.63 40.72 48.67 1392
30 21.62 22.71 36.22 48.19 1372
_____________________________________________________________________________________________
Fuente: Jay L. Devore. Probability and Statistics for Engineering and the Sciences
(2000)
(a) Obtener el modelo de regresión y validarlo acordemente, es decir, usando
diagnósticos subjetivos y después complementar la tarea usando diagnósticos
objetivos.
8.25. Treinta muestras del efluente de una planta de tratamiento se analizaron para la
8-81
medición del DBO5 y la demanda bioquímica de oxígeno (DQO). Los datos se

muestran en la tabla de abajo. Hacer lo siguiente:
(a) Calcular el promedio, s y el error estándar del DBO y del DQO. ( X DBO = 440.6,
s = 93.18, error estándar = 17.01; X DQO = 194.4, s = 45.3, error estándar = 8.27)
(b) Graficar los datos en papel de probabilidad.
(c) Determinar el DBO5 y el DQO que se excederá el 50% de las veces. (El DBO5
excederá 195 lbs/día el 50% de las veces. El DQO excederá 440 lbs/día el 50% del
tiempo)
(d) Determinar el DBO5 y el DQO que se excederá el 90% del tiempo.
Tabla mostrando las concentraciones de DQO y de DBO5. (Elaboración propia)
DQO | 494 494 528 396 532 308 350 456 440 544
(lbs/día) | 310 538 480 500 396 486 556 600 428 440
| 291 490 546 582 368 386 400 347 278 304
DBO5 | 216 200 238 164 230 116 150 190 190 248
(lbs/día) | 120 226 200 222 176 202 240 280 184 194
| 134 215 246 292 177 193 165 160 125 137
8.26. El director de la oficina de personal de una firma constructora desea saber si

la destreza, en determinado tipo de trabajo, dentro de la empresa, puede ser
pronosticada usando como pronosticadores las variables edad y experiencia de los
empleados. La tabla de abajo da la información de una muestra aleatoria de 15
empleados. (Adaptación del libro Business Statistics de Daniel et al. 1989, p. 577).
8-82

________________________________________________________________
Nivel de (y) Experiencia (x1) Edad (x2)
Destreza
15 0 21
15 0 18
21 0 22
28 1 24
30 1 25
35 1 25
40 1 26
35 2 34
30 2 25
45 2 38
50 3 44
60 3 51
45 4 39
60 4 54
50 5 55
________________________________________________________________
Fuente: Daniel et al. 1989. Business Statistics
(a) Encontrar la ecuación de regresión de los cuadrados mínimos.
(b) Computar R2y.12.
(c) Probar Ho:β1 = 0 y Ho:β2 = 0. Dejar que α = 0.05 y calcular el valor de p para
cada prueba.
(d) Computar el 95% de intervalo de confianza para β2.
(e) Dejar que x1 = 2 y x2 = 25 y calcular y.
(f) Encontrar el intervalo de 95% para y.
8.27. La capacidad de los ecologistas para identificar regiones de máxima riqueza
de las plantas podría tener un impacto sobre la preservación de la diversidad
genética. Esto es uno de los objetivos de los ecologistas quienes están preocupados
8-83
por el medio ambiente. El artículo “Prediction of Rarities from Habitat Variables:

Coastal Plain Plants on Nova Scotian Lakeshores” (Ecology, 1992, pp. 1852-1859)
usó una muestra de 37 lagos y se obtuvo la ecuación de regresión de abajo. Este
problema se sacó del libro del investigador J. L. Devore (2001).
y = 3.89 + .033x1 + .024x2 + .023x3 - .0080x4 - .13x5 - .72x6
Donde:
y = riqueza de especies de plantas
x1 = área de la cuenca
x2 = ancho de la playa
x3 = mal drenado (%)
x4 = color del agua
x5 = % de arena
x6 = alcalinidad.
El estudio reportó un coeficiente de determinación múltiple de R2 = 0.83. Realizar
una prueba de la utilidad del modelo de regresión. Sugerencia: usar la función
estadística: F = [R2/k] / [(1 - R2)/(n - (k + 1))], con región de rechazo para una
prueba de nivel de F ≥ Fα,k,n-(k+1), donde k es el número de pronosticadores usados.
Usar la tabla de la distribución F. Valorar la utilidad del modelo de acuerdo al
valor de la probabilidad p.
8.28. Este es ejercicio que involucra la selección de un modelo de regresión con 9
variables independientes o predictoras, es decir, x1, x2, x3, x4, x5, x6, x7, x8 y x9.
Basando el criterio en los diagnósticos R2, MSE y Cp (criterio de Mallow), decir
cuál modelo de regresión es el más apropiado. Esto es, seleccionando los mejores
subconjuntos posibles. Los datos se dan abajo.
8-84

________________________________________________________________
Subconjunto de predictores
1 2 3 4 5 6 7 8 9
Criterios _________________________________________________________
R2k | .354 .453 .511 .550 .562 .570 .572 .575 .575
MSEk | 2295 1948 1742 1607 1566 1541 1535 1530 1532
Cpk | 314 173 89.6 35.7 19.9 11.0 9.4 8.2 10.0
__________________________________________________________________
8.29. En un estudio de laboratorio para ver la relación entre los sólidos

suspendidos y las concentraciones de DBO se sacó una muestra con los datos que
se muestran en la tabla de abajo.
Sólidos suspendidos| 18 7 14 31 21 5 11 16 26 29
DBO5 | 55 17 36 85 62 18 33 41 63 87
(a) Hacer una gráfica que vaya en función de la variable dependiente y de la

(b) Obtener el modelo de la ecuación de regresión y trazarla en la gráfica. (Sólidos

suspendidos Y = 0.32 + 0.352 (X)
(c) Validar el modelo de regresión objetivamente, calculando el coeficiente de
determinaron R2, s y PRESS. (R2 = 0.962, s = 0.957, s = 1.85, PRESS = 42.38)
(d) Hacer una tabla de ANOVA que incluya el valor de F y p. (Completar la tabla
de abajo.
8-85
Tabla de ANOVA. (Elaboración propia)

__________________________________________________________________
Fuente g.l. SS MS Fcalc. Ftab. Valor p
__________________________________________________________________
Debido a la 1 694.16
regresión
Error 27.44 3.43
Total 9 721.60
__________________________________________________________________
(e) Hacer un diagnóstico gráfico para validar la autenticidad del modelo de

regresión seleccionado. Sugerencia: usar el programa Minitab.
8.30. Treinta casos del efluente de una planta de tratamiento se analizaron para el
DBO y el DQO. Los datos se muestran en la tabla de abajo. Hacer los siguientes
cálculos:
DQO (lbs/Día)| 494 444 528 396 532 308 350 456 440 544 310 538
| 480 500 396 486 556 600 428 440 291 490 546 582
| 368 386 400 347 278 304
DBO (lbs/Día | 216 200 238 164 230 116 150 190 190 248 120 226
| 200 222 176 202 240 280 184 194 134 215 246 292
| 177 193 165 160 125 137
__________________________________________________________________
(a) Determinar R2 y R. (R2 = 0.9350, R = 0.967)
(b) Graficar los datos en papel de probabilidad y determinar lo siguiente:
(1) Determinar los valores de DBO y el DQO que excederán el 50% y el 90% de
las veces. (195 lbs/Día y 440 lbs/Día)
(2) Determinar los valores de DBO y del DQO que se lograrán el 90% de las veces.
8-86
(3) Determinar los valores de DBO y del DQO que puedan ser excedidos el 10% de
(4) Calcular el promedio y la desviación estándar del DBO y del DQO.
(c) Evaluar el modelo de regresión aplicando enfoques subjetivistas, es decir, con
gráficas de los valores residuales en función de valores ajustados (para la prueba de
independencia), pruebas de normalidad, etc.
8.31. Este es un problema adaptado del libro Introducción al Análisis de Regresión
Lineal de los autores Montgomery, Peck y Vining (2001). Este proyecto está
relacionado con un estudio de energía solar en el Tecnológico de Georgia, Estados
Unidos. El proyecto involucra datos de pruebas de energía térmica con una
variable dependiente (y), que relaciona al flujo total de calor (Kwatts) y cinco
variables independientes que están relacionadas con la insolación (watts/m2), la
posición del foco en dirección del este (en pulgadas), la posición del foco en
dirección del sur (en pulgadas), la posición del foco en dirección norte (en
pulgadas) y la hora del día. Para esto, estimar los siguientes enunciados:
(a) Probar el modelo de regresión que mejor ajuste a los datos.
(b) Evaluar el modelo de regresión seleccionado, es decir, a través de criterios
estadísticos y complementar la decisión usando gráficos subjetivistas.
La tabla de abajo muestra la información requerida para solución todos los
enunciados requeridos por este problema.
8-87
Tabla mostrando los datos de las pruebas de energía solar térmica.

__________________________________________________________________________________
y x1 x2 x3 x4 x5
__________________________________________________________________________________
271.8 783.35 33.53 40.55 16.66 13.20
264.0 748.45 36.50 30.19 16.46 14.11
238.8 684.45 34.66 37.31 17.66 15.68
230.7 827.80 33.13 32.52 17.50 10.53
251.6 860.45 35.75 33.71 16.40 11.00
257.9 875.15 34.46 34.14 16.28 11.31
263.9 909.45 34.60 34.85 16.06 11.96
266.1 905.55 35.38 35.89 15.93 12.58
229.1 756.00 35.85 33.53 16.60 10.66
239.3 769.35 35.68 33.79 16.41 10.85
258.0 793.50 35.35 34.72 16.17 11.41
257.6 801.65 35.04 35.22 15.92 11.91
267.3 819.65 34.07 36.50 16.04 12.85
267.0 808.55 32.20 37.60 16.19 13.58
259.6 774.95 34.32 37.89 16.62 14.21
240.4 711.85 31.08 37.71 17.37 15.56
227.2 694.85 35.73 37.00 18.12 15.83
196.0 638.10 34.11 36.76 18.53 16.41
278.7 774.55 34.79 34.62 15.54 13.10
272.3 757.90 35.77 35.40 15.70 13.63
267.4 753.35 36.44 35.96 16.45 14.51
254.5 704.70 37.82 36.26 17.62 15.38
224.7 666.80 35.07 36.34 18.12 16.10
181.5 568.55 35.26 35.90 19.05 16.73
227.5 653.10 35.56 31.84 16.51 10.58
253.6 704.05 35.73 33.16 16.02 11.28
263.0 709.60 36.46 33.83 15.89 11.91
265.8 726.90 36.26 34.89 15.83 12.65
263.8 697.15 37.20 36.27 16.71 14.06
___________________________________________________________________________________________
y = Flujo total de calor (kwatts); x1 = Insolación (watts/m2); x2 = Posición del foco en dirección este (pulgadas); x3 = Posición
del foco en dirección sur (pulgadas); x4 = Posición del foco en dirección norte (pulgadas); x5 = Hora del día
Fuente: Introducción al Análisis de Regresión Lineal. Montgomery et al. 2001.
8-88
8.32. La intención de este ejercicio es la de hacer una gráfica, con la variable de

respuesta (Y) y con cuatro variables regresivas (X1, X2, X3, X4) usando el programa
Minitab. Siendo así, de la configuración de los puntos esparcidos obtenida
predecir, qué tipo de función de regresión estadística encajaría mejor en los datos.
Además, evaluar el modelo de regresión candidato o superior usando métodos
estadísticos y gráficos. Sugerencia: para hacer la gráfica pedida, usar el programa
Mintab procediendo de la siguiente manera: Irse a Graph → Draftsman Plot. Esto
lleva al recuadro de “Draftsman Plot”. Enseguida, en la ventanilla de “Y variable”
poner la variable dependiente (Y) y, en la ventanilla de “X variable” poner las
variables independientes (X).

______________________________________________________________________________
Variable de respuesta (Y) Variable regresiva X1 Variable regresiva X2 Variable regresiva X3 Variable regresiva X4
235 20 19 86 95
231 27 17 85 90
285 40 20 83 105
270 55 20 82 83
296 60 20 87 90
312 68 21 89 94
295 75 20 83 92
292 80 20 81 92
263 70 20 58 105
271 50 15 79 100
283 40 15 80 90
256 30 15 79 88
8.33. Este es un problema adaptado del texto de Jay L. Devore (2001), en el cual se
da la información requerida para la selección del modelo de regresión superior,
basado en la inclusión del número de variables regresoras, seleccionado entre
8-89
cuatro modelos candidatos. El ejemplo está relacionado con el calor acumulado del
endurecimiento del cemento tomado como la variable dependiente, en función de
los predictores x1 = % de aluminato de tricalcio, x2 = % de silicato de tricalcio, x3 =
% ferrato de aluminio y x4 = silicato de dicalcio. Se da un tamaño de muestra igual
a 13 observaciones y, donde la suma de los cuadrados del total es igual a 2,715.76.
Para esto, se pide al lector llenar los faltantes de la tabla de abajo y decidir cual es
el modelo superior que tiene el número adecuado de variables regresoras.
Tabla mostrando la información. Llenar los faltantes.
No. de regresores k Regresor (es)k SSEk R2k R2(ajustada)k Cpk F(calc.)k
1 x4 880.85 0.676 0.647 138.2
2 x1, x2 58.01 2.7
3 x1, x2, x3 0.982 0.876 3.2
4 x1, x2, x3, x4 0.982 4.0
8-90
CAPITULO 8
Regresión lineal simple y múltiple
Suposiciones del modelo de regresión lineal.- Ecuaciones normales para
calcular el intercepto en la ordenada a y la pendiente b de la curva o línea de
regresión.- Coeficiente de determinación múltiple R2 de la muestra que estima
a ρ2 el coeficiente de determinación poblacional.- Coeficiente de correlación R
de la muestra que estima a ρ, el coeficiente de correlación poblacional.-
línea de regresión µY|X = α + βX, estimado por b, la pendiente de la línea.-
ordenada de la línea de regresión µY|X = α + βX, cuyo estimador es a.- Hipótesis
nula de Ho:β = βo contra las hipótesis alternativas de H1:β < 1 y H2:β > 1.-
Hipótesis nula de Ho:α = αo contra las hipótesis alternativas de H1:α ≠ αo, H2:α
> αo, y de H3: α < αo.- Intervalo de confianza para µY|X de la línea de regresión
poblacional estimada por Y.- Regresión y correlación múltiple.- Métodos para
validar el modelo de regresión lineal simple y múltiple: a través de estadística de
inferencias y a través del análisis gráfico de los residuales estandarizados.
El objetivo de estudiar regresión lineal simple es para obtener el modelo de
regresión más apropiado, es decir, una ecuación de regresión lineal simple o
múltiple para fines de predicción y estimación. Los componentes de esta ecuación
de regresión lineal, con solo una variable independiente, también llamado modelo
lineal de primer orden, son la variable dependiente Y´ o función de respuesta y, la
variable independiente X. El modelo de esta ecuación, que describe la relación de
la variable X con la variable Y, se llama la ecuación de regresión de Y sobre X y, la
gráfica de esta función, se llama la curva de regresión.
8-1
El modelo de regresión lineal poblacional que describe la relación entre la

respuesta o variable dependiente Y y, la variable independiente o regresora X es:
Y = βo + β1x1 + ε i = 1, 2, …., n (8-1)
Donde:
Y = variable dependiente poblacional (también se usa la anotación y)
β1 = pendiente de la línea
x1 = variable independiente
ε = error aleatorio con promedio de 0 y varianza σ2 constante. Este valor de ε es la
diferencia entre el valor teórico de Yi y el valor de Y calculado u observado. Las
condiciones de ε son de que este parámetro debe estar normalmente distribuido; sus
valores deben de ser independientes uno del otro y la varianza de ε es Var(ε) = σ2ε
n = número de (x, y) pares de observaciones
La ecuación de la línea de regresión muestral que estima a modelo de regresión
poblacional (8-1) de arriba se da como:
Y = a + bx + e (8-2)
Donde:
Y = valor de la variable dependiente de la muestra
a = intercepto en la ordenada
e = error o residual de la muestra denotado por ei = yi - Yi. Esta estadística es la
estimadora del parámetro ε
8-2
Suposiciones del modelo de regresión lineal

1. Los valores de Y son independientes uno del otro, es decir, no deben de estar
correlacionados.
2. Las distribuciones condicionales de probabilidad de Y dado X son normales.
3. La varianza del error es σ2 y es constante.
4. Los coeficientes βo y β1 son desconocidos y deben de estimarse.
Para estimar la ecuación de regresión lineal simple y múltiple se usa lo que
se llama el método de los cuadrados mínimos que ajusta los datos de la muestra a
la línea de regresión. Esta es una de las técnicas más usadas en investigaciones
científicas, para encontrar la relación entre dos o más variables que están
casualmente relacionadas.
En esta sección veremos el problema de regresión lineal de una variable
dependiente (Y) otra independiente (X), con fines de predicción y estimación. Sin
embargo, una vez que se obtiene la ecuación de regresión lineal, ésta se tiene que
evaluar o validar para ver qué tanta confiabilidad se le puede poner al modelo para
usos de predicción. Esto se hace usando enfoques objetivos y subjetivos. Por
ejemplo, el enfoque objetivo se hace haciendo pruebas estadísticas de inferencia.
Este enfoque se complementa usando enfoques subjetivos, es decir, analizando las
gráficas de los residuales estandarizados o no estandarizados, a través de
inspecciones visuales.
Por ejemplo, las condiciones o suposiciones requeridas para validar el
modelo, subjetivamente, se hace a través de los análisis de los residuos crudos o
estandarizados (para diferenciarlos de los residuos estandarizados). Los llamados
residuos se definen como las diferencias entre el valor actual de Y y el valor
pronosticado de Y por el modelo de regresión estimado. Los residuos se denotan
por ei, esto es, ei = Yi – Yí. En verdad, las gráficas de los residuos dan información
8-3
muy importante, acerca de la naturaleza y fuerza de la relación entre las variables.

La figura de abajo muestra los residuos que son las diferencias entre los valores de
Y1, Y2, Y3,…,Yk y los valores observados de Y´1, Y´2, Y´3,…,Y´k de la línea de
regresión de la muestra. Por otra parte, los residuos estandarizados se obtienen
dividiéndolos por sus respectivas desviaciones estándares.
Figura. 8.0. Gráfica mostrando los residuos de un ejemplo. (Elaboración propia)
Las suposiciones de los valores residuales son:

(a) Los residuales ei están normalmente distribuidos (εi están normalmente
distribuidos).
(b) Los residuos tienen la misma varianza (εi son constantes).
(c) Los residuales ei no están correlacionados, es decir, son independientes.
Otro método menos popular que el análisis de los residuos, para evaluar la
ecuación de regresión es comparando el diagrama esparcido de los puntos, con
respecto a la línea de regresión, con la gráfica de los puntos con respecto al
promedio de y . Esto se debe a qué, sin importar el valor de X, el promedio y
siempre permanece constante (línea horizontal trazada en el diagrama esparcido de
la gráfica). De esta manera, si la dispersión de los puntos con relación a la línea de
8-4
regresión es mucho menor, que la dispersión de los puntos con respecto a la línea
horizontal de y , entonces, se puede concluir que la ecuación de la línea de
regresión da un buen ajuste para los datos de la muestra (Daniel et al. 1989).
Como se dijo antes, el enfoque objetivista es la otra manera que se usa para
evaluar el modelo de regresión lineal, esto es, a través de análisis estadísticos. Para
esto, se pueden usar las siguientes funciones estadísticas:
(a) Coeficiente de determinación lineal R2 (o r2), el coeficiente de correlación lineal
R, s y PRESS.
(b) Análisis de varianza simple (ANOVA), para probar los coeficientes del modelo
de regresión (β), para ρ, etc.
(c) Intervalos de confianza para ρ2, para βo, βi, µy|x, etc.
Tipos de correlación lineal
1. Correlación simple que consiste de dos variables, una dependiente (Y) y la otra
independiente (X). Dentro de esta categoría tenemos:
(a) Correlación directa. Esta correlación consiste en el incremento en una variable la
cual es acompañada por el incremento de otra variable (correlación positiva).
(b) Correlación inversa. Esta correlación consiste en el incremento de una variable la
cual es acompañada por el incremento de otra (correlación negativa).
(c) Correlación no lineal. En esta correlación no hay ninguna asociación entre las dos
variables.
2. Correlación múltiple. Aquí, hay más de dos variables. Una variable es
dependiente (Y), mientras que las otras son independientes X1, X2,…, Xk, etc.
Las figuras de abajo representan varios tipos de correlaciones.
8-5
Fig. 8.1. Diagramas esparcidos con líneas de cuadrados mínimos. La Figura (a)
representa una línea recta con X fija; la Figura (b) representa línea no recta con X fija;
la Figura (c) representa una distribución adjunta con línea recta; la Figura (d)
representa una distribución adjunta con línea no recta; la Figura (e) representa un
diagrama donde no hay asociación entre las dos variable y; la Figura (f) representa
una relación causal. Las otras dos gráficas representan correlaciones perfectas.
8-6
Tipos de curvas más comunes
Figura 8.2. La figura (a) representa la función exponencial; la figura (b) representa la
función de potencia, la figura (c) representa una función recíproca y, la figura (d)
representa una función hiperbólica. (Elaboración propia)
8-7
Ecuaciones normales para calcular el intercepto en la ordenada a y la pendiente

b de la curva o línea de regresión
Las variables a y b se obtienen de las ecuaciones normales de abajo, es decir,
resolviéndolas simultáneamente:
ΣY = a n + b ΣX (8-3)
ΣXY = a ΣX + b ΣX (8-4)
Al resolverse simultáneamente dan el intercepto, a en la ordenada y, la pendiente de
la línea, b:
Intercepto = a = Y – b X (8-5)
Pendiente = b = [n ΣXY – (ΣX)(ΣY)] / [n ΣX 2 – (ΣX)2 ] (8-6)
= Σxy / Σx2 (8-7)
Donde:
Σxy y Σx2 se dan por las ecuaciones (8-8) y (8-9) de abajo.
Nota 1. Las siguientes ecuaciones son muy importantes.
Σx2 = Sxx = ΣX 2 – (ΣX)2 / n (8-8)
Σxy = Sxy = ΣXY – ΣXΣY / n (8-9)
Σy2 = Syy = ΣY 2 – (ΣY)2 / n (8-10)
Nota 2. Es muy importante notar las diferencias entre el uso de las variables
minúsculas y las mayúsculas en las ecuaciones de arriba.
Coeficiente de determinación R2 de la muestra que estima a ρ2 el coeficiente de
determinación poblacional
El cálculo del coeficiente de determinación múltiple R2 es una prueba objetivista
de estadística. Esta es una función estadística muy importante, para validar el
modelo de regresión lineal. Este coeficiente R2 mide la proporción de variación en
la variable dependiente Y explicada por la variable independiente X. Los valores de
R2 varían de 0 a 1. Por ejemplo, un valor cercano a 0 indica que no hay una
8-8
relación lineal entre Y y X, mientras que un valor cercano a uno indica un ajuste
lineal perfecto. Aquí, sin embargo, es necesario aclarar que, un valor alto de R2, no
necesariamente indica un buen ajuste del modelo de regresión, sino hasta que se
hacen todas las pruebas objetivistas y subjetivas. La función que calcula R2 es:
R2 = (Σxy)2 / Σx2Σy2 (8-11)
= 1 – SSe / SSt (8-12)
Donde Σxy, Σx2 y Σy2 se dan por las ecuaciones (8-8), (8-8) y (8-10) descritas para
la ecuación (8-11). Además, para la ecuación (8-12) SSe es la suma de los
cuadrados del error o residual y SSt es la suma de los cuadrados del total, mismos
que se describen en el formato de la tabla de ANOVA.
También hay el llamado coeficiente R2 de determinación ajustado. Esta es
una versión ajustada de R2, el cual busca remover la distorsión debida a un tamaño
de muestra pequeño. Se define como:
R2ajustada = 1 – [(1 – R2) (n – 1)/(n – 2)] (8-13)
Donde R2 ya se definió y n es el tamaño de la muestra
Coeficiente de correlación R de la muestra que estima a ρ, el coeficiente de
correlación poblacional
El coeficiente de correlación R, que estima a ρ, también se llama coeficiente de
correlación de Pearson. Este coeficiente es un índice de la fuerza de la asociación
lineal entre las variables X e Y. El coeficiente de correlación R es:
R= ∑ xy (8-14)
∑x ∑ y
2 2
Donde: Σxy, Σx2 y Σy2 se dan por las ecuaciones (8-8), (8-9) y (8-10)
Nota: El coeficiente de correlación R explica el grado de asociación entre las
variables X e Y. Este coeficiente R varía de –1 a 0, si la correlación es negativa, es
8-9
decir, con pendiente negativa. Pero, si la correlación es positiva, entonces, R varía

de 0 a 1. Así, a medida que R se aproxima a ±1, mejor asociación habrá entre las
variables X e Y. Nótese que, en caso de la regresión lineal múltiple, tenemos lo que
se llaman coeficientes parciales de regresión usados para medir la relación lineal
entre la variable dependiente y la variable independiente especificada.
línea de regresión µY|X = α + βX, estimado por b, la pendiente de la línea.
∑x ∑x
2 2
b – t[1-α/2;n-2] s / < β < b + t[1-α/2;n-2] s / (8-15)
Donde:
b = Σxy / Σx2
t[1-α/2;n-2] = valor de la distribución de t de Estudiante
Σx2 = ΣX2 – (ΣX)2 / n
(∑ y − b∑ xy )
2
s= (8-16)
n−2
∑ y − (∑ y )
2 2
= SSE/(n – 2) = - (bΣXY - ΣXΣY/n)] / n-2

n
La ecuación de la varianza es: s2 = (Σy2 – bΣxy) / (n – 2) (8-17)

β = coeficiente poblacional de la pendiente de la línea, el cual es estimado por b =
Σxy / Σx2 o sea el coeficiente de la línea de regresión muestral.
ordenada de la línea de regresión µY|X = α + βX, cuyo estimador es a
(8-18)
Donde:
8-10
t[1-α/2;n-2] = a un valor usando la distribución de t de estudiante con ν = n – 2 grados
de libertad
s = de la ecuación (8-16)
Sxx = Σxy (de la ecuación (8-9))
Hipótesis nula Ho:β = βo contra las hipótesis alternativas H1:β < 1 y H2:β > 1.
Para esta prueba también se usa la distribución de t de Estudiante con ν = n – 2
grados de libertad, es decir:
t = (b – βo) / s/Σx2 (8-19)
Donde:
t = la estadística de la distribución de t de Estudiante
βo = un valor dado
Hipótesis nula Ho:α = αo contra las hipótesis alternativas H1:α ≠ αo, H2:α > αo,
y H3: α < αo
Aquí, nuevamente, se usa la distribución de t de Estudiante con grados de libertad,
ν = n – 2. Para esto se usa la fórmula de abajo:
(8-20)
8-11
Donde:
αo = un valor dado
Intervalo de confianza para µY|X de la línea poblacional estimada por Y

El intervalo de confianza para el valor de µY|X se hace es usando la fórmula (8-21) de
abajo:
1 1
Yo’– t[α/2;ν] s + (Xo - X )2/Σx2 < µY|X < Yo’+ t[α/2;ν] s + (Xo - X )2/Σx2 (8-21)
n n
Donde:
Yo’ = a + b Xo = valor de la línea de regresión con un valor de Xo dado (8-22)
t[α/2;n-2] = valor de la distribución de t con un nivel de significancia de α = .05 o bien
0.01 con ν = n – 2 grados de libertad
a = ya definida anteriormente
Xo = un valor dado
X = promedio de la muestra
Hipótesis nula Ho:β = 0 contra las hipótesis alternativas H1:β > 0 y H2:β < 0
Para hacer esta prueba usamos la distribución de t de Estudiante con ν = n – 2 grados
de libertad. La función estadística usada para tales fines es:
∑x
2
t = (b – bo) / s / (8-23)
Donde:
8-12
b = intercepto en la ordenada Y
bo = un valor dado
Σy2 = ΣY2 – (ΣY)2/n
βo = 0
Aquí, también se tienen que calcular las regiones críticas usando la distribución
de t, es decir, t[1-α/2;ν], donde α es el nivel de significancia deseado y, ν es el número de
grados de libertad, es decir, n - 1. Después de esto, se compara el valor de tcalc., con el
valor crítico de ttab. y se sigue el mismo procedimiento para cualquier prueba de
hipótesis.
Hipótesis nula de Ho:α = αo contra las hipótesis alternativas H1:α > 0 y H2:α < 0
Para hacer esta prueba de hipótesis se usa la estadística de t de Estudiante mostrada
abajo:
(8-24)
Donde:
Donde:
Σy2 = ΣY2 – (ΣY)2/n
b = ya definida anteriormente
Aquí, también se tiene que establecer las regiones críticas usando la distribución de t
de Estudiante. Estas regiones críticas son: t[1-α/2;ν], donde α es el nivel de significancia
usado.
8-13
Pruebas de hipótesis Ho:ρ = 0, contra la hipótesis alternativas H1:ρ ≠ 0, para el

coeficiente de correlación poblacional ρ estimado por R. (Dunn et al. 1974)
Para estos fines se usa la estadística de t de Estudiante:
2
t=√ν R/ 1− R (8-25)
Donde:
∑x ∑ y
2 2
R = Σxy / (8-26)
ν = n – 2 grados de libertad
Aquí, nuevamente, para calcular las regiones críticas se usa la t de Estudiante, es
decir, t[α/2;n-2].
Ejemplos de problemas usando regresión y correlación lineal simple
Ejemplo #1. Este problema está relacionado con un estudio acerca de la cantidad de
precipitación pluvial y la cantidad de contaminación atmosférica.
___________________________________________________________________
Lluvia (0.026”) | 18 7 14 31 21 5 11 16 26 29
Remoción de contaminación | 55 17 36 85 62 18 33 41 63 87
Hacer las siguientes estimaciones:

(a) Identificar la variable dependiente y la variable independiente. Hacer una gráfica
que vaya en función de la variable dependiente Y, y la variable independiente X.
(b) Calcular los valores de la estadística descriptiva de los datos.
(c) Obtener la ecuación de regresión lineal simple y trazarla en la gráfica.
(d) Validar la confiabilidad del modelo de regresión, es decir, a través de la emisión
de un juicio subjetivo analizando los valores de los residuos estandarizados, de la
siguiente manera:
1. Hacer una gráfica que muestre la prueba de normalidad.
8-14
2. Hacer una gráfica con los residuales estandarizados versus valores ajustados de Y .
(El valor predecido o ajustado de Y i es el valor de Y que se esperaría cuando se usa la
línea de regresión. En otras palabras, los valores ajustados de Y 1, Y 2,.., Y n se obtienen
sustituyendo, sucesivamente, x1, x2, .., xn en la ecuación de la línea de regresión
estimada: Y i = βo + β1xi, .., βo + β1xn.
3. Hacer un histograma de residuales.
4. Hacer una grafica que muestre los residuales estandarizados versus renglones.
(e) Complementar la evaluación del modelo con inferencias estadísticas, como:
1. Cálculo del coeficiente de determinación R2 y el coeficiente de correlación R.
2. Hacer una tabla de análisis de varianza (ANOVA).
3. Hacer una tabla con los coeficientes, los errores estándares, las pruebas de t, los
valores de p, y los intervalos de confianza para el intercepto y la pendiente.
Solución:
(a) La variable dependiente es la remoción de contaminantes (Y) y la variable
independiente es la cantidad de lluvia (X). La figura de abajo muestra esta solución:
Figura 8.3. Gráfica mostrando Y versus X, con una línea recta horizontal
correspondiente al valor del promedio de Y = 49.7000. (Elaboración propia)
(b) Los valores de la estadística descriptiva son:
X = 17.8000, Y = 49.7000. Los valores máximos y mínimos de los valores de Y son
8-15
87.000 y 17.000, respectivamente. Los valores máximos y mínimos de los valores de

X son 31.000 y 5.0000, respectivamente. Cuadrado medio del error = s2y|x = 26.667;
error cuadrático medio es sy|x = 5.164
(c) Usando un programa de computadora se estiman los valores del intercepto en la
ordenada y la pendiente. Estos son: intercepto = a = 1.0213, pendiente de la línea = b
= 2.7348. Sustituyendo estos valores dan la línea de regresión muestral (misma que se
ve en la Figura 8.3), da.
Y = a + bX
Y = 1.0213 + 2.7348(X)
(d) Para este inciso la Figura 8.4 muestra la información requerida.
Residual Plots for Remocion de contaminatnes (Y)

99
5
90
Residual
Percent
0
50
-5
10
1 -10
-10 -5 0 5 10 20 40 60 80
Residual Fitted Value

3
5
Frequency
2
Residual
1 -5
0 -10
-8 -4 0 4 1 2 3 4 5 6 7 8 9 10
Residual Observation Order
Figura 8.4. Gráficas mostrando las respuestas para el inciso (d).

Como se ve en la Figura 8.4 la figura superior izquierda muestra la prueba de
normalidad con todos los puntos formando una linea recta. Esto indica que la
8-16
distribución de los datos es normal. Igualmente, la figura superior derecha muestra

los residuales en función de los valores ajustados de Y. Aquí, hay aleatoriedad en
la distribución de los puntos con la misma cantidad de puntos negativos y
positivos, lo que indica que no hay correlacion de los datos. La figura inferior
izquierda muestra la frecuencia versus los residuales. Finalmente, la figura inferior
derecha muestra los residuales en función de los órdenes de las observaciones.
Aquí, en esta figura hay aleatoriedad y el mismo numero de puntos positivos y
negativos, lo que sugiere que no hay colinealidad o correlacion en serie de la
información suministrada.
(e) Para complementar el estudio objetivista, esto se hace haciendo pruebas
estadísticas de inferencia.
(1) Como se dijo antes, el coeficiente de determinación R2 es un enfoque objetivista,
que sirve para validar el modelo de regresión. Este coeficiente de determinación R2,
mide la fuerza relativa de la relación lineal entre X e Y (mide la proporción de
variación en Y que puede ser explicada por la variación en X) es dado por la ecuación
(8-11) y por las ecuaciones (8-6), (8-7) y (8-8), respectivamente:
R2 = 0.9620
El cálculo del coeficiente de correlación R es:
R= R 2 = 0.9808
(2) Para el análisis de varianza (ANOVA), que también sirve para validar el modelo
de regresión, es una función estadística objetivista que prueba la hipótesis nula de que
la pendiente es igual a 0. Aquí se verá que, un valor grande de F indica que el modelo
de regresión seleccionado es util. Sin embargo, es necesario analizar todos los demás
criterios antes de emitir un juicio final. La tabla de ANOVA de abajo da los
resultados.
8-17
TABLA 8.1. Tabla de análisis de varianza (ANOVA) para el ejemplo.

__________________________________________________________________
Fuente de Suma de los g.l. Cuadrado del Fcalc. Ftab. Valor de p
variación cuadrados promedio
__________________________________________________________________
Debido al 5,396.77 1 5,396.77 202.38 5.32 0.00001
tratamiento
___________________________________________________________________
Total 5,610.1 9
El valor de Ftab. se saca consultando la tabla de la distribución de F, esto es Fα;ν1,ν2, el

cual da F.95;1,8 = 5.32. Aquí, debido a que el valor de Fcalc. = 202.38 >>> 5.32, se
rechaza la hipótesis sustentada de que Ho:β1 = 0 y se inclina por Ho:β1 ≠ 0. La
conclusión es de que la pendiente de la línea no es igual a 0 u horizontal.
(3) La tabla de abajo muestra los valores del intercepto en la ordenada, el gradiente
de la línea de regresión, los errores estándar, la pruebas de hipótesis usando la t de
estudiante, los valores de la probabilidad p y los intervalos de confianza (95%) para
βo (intercepto) y β1 (pendiente).
TABLA 8.2. Tabla mostrando los valores del intercepto, pendiente, pruebas de t de
Estudiante, valor del nivel de p y sus intervalos. (Elaboración propia)
__________________________________________________________________
Coeficiente Error Prueba t Valor p Límite Límite
estándar inferior superior
___________________________________________________________________
Intercepto 1.02 3.79 0.27 0.79 -7.772 9.76
___________________________________________________________________P
endiente 2.73 0.19 14.23 5.8x10-7 2.29 3.18
__________________________________________________________________
Aquí, nótese que el intervalo de confianza para el intercepto es muy amplio y la

hipótesis no se puede rechazar, puesto que el valor de t es muy pequeño y el valor de
8-18
p = 0.79 es grande. Esto es apoyado por el valor de 0.79 de p y por un error estándar
de 3.79, relativamente grande; lo contrario ocurre con las pruebas estadísticas de la
pendiente, cuyo valor de t es grande y cuyo valor de p es muy pequeño.
Ejemplo #2. En un estudio de microbiología ambiental, en muestras de agua, se
dieron los siguientes datos de la tabla de abajo. Estos datos se refieren al crecimiento
de una colonia de bacterias en un medio de cultivo.
Tiempo en días de | 3 6 9 12 15 18
inoculación (X)
__________________________________________________________________
No. bacterias (Y) | 115,000 147,000 189,000 235,600 257,900 286,400

(a) Calcular la línea de regresión.
(b) Calcular el coeficiente de determinación R2 y el coeficiente de correlación R.
(c) Con la ecuación de regresión, estimar el número de bacterias después de 20 días
(d) Encontrar los intervalos de confianza para α y β usando el paquete de EXCEL.
(e) Usar el programa Minitab y estimar los valores residuales y analizarlos
subjetivamente, para revisar por la calidad del modelo de regresión.
Solución:
(a) La ecuación de la línea de regresión es:
Y = 81,520.00 + 11,774.29 X
(b) El coeficiente de determinación lineal múltiple R2 es igual a 0.9880. El coeficiente
de correlación R es igual a 0.9940.
(c) Cuando X = 20 días, el número de bacterias es de:
Y = 81,520 + 11,774.29 (20) ≈ 317,006 bacterias
(d) En cuanto a los intervalos de confianza para α y β, el programa de computadora de
8-19
EXCEL arroja los siguientes resultados:

Intervalo de confianza de 95% para α: 61,259.45 < α < 101,780.6; valor de la
probabilidad p = 0.0004; Intervalo de confianza de 95% para β es: 10040.14 < β <
13508.43, con un valor de la probabilidad p = 0.000046
(e). Las figuras de abajo muestran las gráficas que tratan de validar el modelo de
regresión lineal, con del número de bacterias en función del tiempo de incubación.
Figura 8.5. Figuras mostrando los resultados del número de bacterias versus el tiempo
de incubación. La gráfica (a) muestra la relación entre Y y X, con la línea recta de Y ;
la gráfica (b) muestra los residuos crudos versus X; la gráfica (c) muestra los residuos
crudos versus los renglones y, la gráfica (d) muestra los residuos crudos versus
residuos rezagados (Elaboración propia).
8-20
Todas estas gráficas sugieren, subjetivamente, que el modelo de regresión lineal es

confiable. ¿Por qué?
Ejemplo #3. En un estudio de agricultura, relacionado con la siembra de algodón, en
cierto estado de la Unión Americana, la precipitación anual y el rendimiento de la
cosecha de algodón son como sigue.
Precipitación | 7.12 63.54 47.38 45.92 8.68 50.86 44.46
en pulgadas
(X)
Rendimiento de | 1037 380 416 427 619 388 321
la cosecha en
libras/acre
(Y)

(a) Calcular los valores del intercepto a y la pendiente b.
(b) Escribir la ecuación de la línea de regresión.
(c) Calcular el coeficiente de determinación R2 y el coeficiente de correlación R.
(d) Predecir el rendimiento de la cosecha de algodón, si la precipitación es de 30
pulgadas.
(e) Hacer una tabla de análisis de varianza.
Solución:
(a) Usando un paquete de computadora como el Excel da:
Intercepto en la ordenada = a = 880.40
Pendiente de la línea = b = -9.61
(b) Por lo tanto, la ecuación de la línea de regresión es:
Y = 880.40 – 9.61 (X)
(c) El coeficiente de determinación = R2 = 0.6991
8-21
El coeficiente de correlación = R = 0.8361

(d) Cuando la precipitación de lluvia es de 30 pulgadas, el rendimiento de la
cosecha se calcula usando el modelo de regresión obtenido, es decir sustituyendo el
valor de X = 30. De esta manera, usando la ecuación de regresión dada arriba y
sustituyendo el valor de X = 30 nos da:
Y = 880.4 – 9.61 (30) = 592.1
(e) La tabla de análisis de varianza dada por el paquete Excel se da abajo.
TABLA 8.5. Tabla de análisis de varianza (ANOVA). (Elaboración propia)
Fuente de variación g.l. SS MS Fcalc. Ftab. Valor de p
Debido a la Regresión 1 260,628.2 260,628.2 11.62 5.32 0.019
Residuo 5 112,165.5 22,433.11
Total 6 372793.7
En conclusión, al comparar el valor de la estadística calculada F con el valor crítico de

F se rechaza la hipótesis sustentada con un valor de p igual a 0.019.
Ejemplo #4. El libro Applied Statistics: Análisis of Variance and Regression de Dunn
y Clark (1974) describe un estudio de física, es decir, de óptica, donde se obtuvieron
los datos de abajo que muestran los diámetros de las fibras ópticas (en micras) en
función de la fuerza de rompimiento de éstas. Para este problema hacer los siguientes
cálculos
(a) Hacer todos los calculos preliminares y calcular la ecuación de la línea de
regresión muestral que estima a la ecuación de regresión poblacional µY|X = α + βX.
(b) Usando un paquete de computadora, encontrar el intervalo de confianza para el
coeficiente de regresión poblacional α (intercepto en Y), que estima a a.
(c) En forma análoga que con en el inciso (b), encontrar el intervalo de confianza para
el coeficiente de regresión β (la pendiente de la línea) cuyo estimador es b.
8-22
(d) Probar la hipótesis nula de Ho:β = βo, es decir, β = 0 contra la hipótesis alternativa
de H1:β > 0 y H2:β < 0. Calcular el valor de la probabilidad p.
(e) Hacer un intervalo de confianza para µY|Xo.
(f) Calcular los criterios evaluadores del modelo de regresion, v. g., R2, PRESS y s.
(g) Hacer una prueba de hipótesis para el coeficiente de correlación poblacional ρ.
(h) Graficar los datos y trazar la ecuación de la línea de regresión sobre la gráfica y
trazar la línea horizontal correspondiente al valor del promedio Y .
(i) Emitir un juicio subjetivo que ayude a validar el uso del modelo de regresión.
La tabla de abajo muestra los datos.
TABLA 8.6. Tabla mostrando el diámetro de fibras vs. fuerza de rompimiento.
Diámetro de la fibra (X) Log de la fuerza de rompimiento (Y)
22.5 .19
28.0 .62
27.5 .51
25.5 .53
22.0 .24
30.5 .87
23.0 .25
25.0 .25
23.5 .37
27.0 .32
21.5 .13
22.0 .35
29.0 .53
20.5 .22
27.0 .65
(Fuente: Dunn et al. 1974. Applied Statistics: Analysis of Variance and Regression)
Solución:
(a) Los cálculos preliminares son:
8-23
n = 15, ΣX = 374.5, (ΣX)2/n = 9,350.0, ΣY = 6.03, (ΣY)2/n = 2.42, ΣXY = 158.25, ΣX

2
= 9,482.75, ΣY 2 = 3.03, (ΣXΣY)/n = 2,258.24/15 = 150.55, X = 24.97, Y = 0.402,
Σx2 = ΣX 2 – (ΣX)2/n = 9,482.75 – 9,350.0 = 132.75, Σxy = ΣXY – ΣXΣY/n = 158.25
– 150.55 = 7.70, Σy2 = ΣY 2 – (ΣY)2/n = 3.03 – (6.03)2/15 = .6074
Para calcular la línea de regresión de la muestra, primero calculamos manualmente,
los coeficientes a y b de la línea de regresión muestral que estiman a α y β.
b = Σxy/Σx2 = 7.70/132.75
= .058
a = Y – b X = 0.402 – (0.058)(24.97) = -1.046
Por lo tanto, la línea de regresión muestral es:
y = a + b(X)
y = -1.046 + 0.058(X)
(b) El intervalo de confianza para α es usando la función (8-18) o usando un paquete
de computadora como Excel procediendo como: Tools → Data análisis → Regression
y OK. Enseguida, después de que los datos se introdujeron en las columnas A y B de
la hoja de Excel irse a la ventanilla de “Input Y Range” y “Input X Range”, lo que
genera la TABLA 8.7 de abajo.
TABLA 8.7. Tabla mostrando el valor del intercepto, la pendiente, los valores de t y p
y los intervalos de confianza para α y β.
Por lo tanto, el intervalo de confianza para el intercepto (α) se lee de la tabla como:
-1.5706 < α < -0.5224
(c) En forma análoga el intervalo de confianza para β se lee de la TABLA 8.7 como:
8-24
0.0788 > β > 0.0371

(d) Para probar la hipótesis nula Ho:β = βo es decir, β = 0, contra H1:β > 0 y H2:β < 0
usamos la distribución de t de estudiante con ν = n – 2 = 15 – 2 = 13 g.l. La fórmula
es: t = (b – βo) / s/√ Σx2. Sustituyendo todos los valores de βo = 0 y demás valores en
la fórmula de arriba da:
t = (0.058 – 0) / 0.12/ 132.73
= 5.8
Las regiones críticas son: t = ± 2.16.
En conclusión: debido a que tcalc. = 5.8 > ttab. = 2.16, se rechaza la hipótesis nula de
Ho:β = 0 y se inclina por H1:β > 0. El valor de la probabilidad se calcula usando la
fórmula de interpolación (6-10): (λ2 – λ1)/(t2 – t1) = (λ2 – X)/(t2 – tcalc.)
Sustituyendo los valores apropiados de la tabla de t nos da:
(.00001 - .00002)/(6.287 – 5.607) = (.00001 – X)/(6.287 – 5.8)
Lo que da X = p = .00002. Pero como la prueba es bilateral, lo multiplicamos por 2 y
da p = .00004. Este valor apoya, muy contundente, la hipótesis alternativa de H1:β >
0.
(e) El intervalo de confianza para la variable dependiente de la línea de regresión
poblacional, µY|X estimada por Y, con nivel de significancia de α = 0.05, dar varios
valores a Xo. Para hacer esto, se usa la función de abajo:
1 1
Yó - t[α/2;n-2] s +(Xo– X )2/Σx2 < µY|X < Y´ó + t[α/2;n-2] s +(Xo– X )2/Σx2 (8-28)
n n
Donde:
X = promedio
t[α/2;n-2] = valor de t con ν = n – 2 g.l.
t[.025;13] = ± 2.16
Xo = los diferentes valores que se le den a Xo para construir los límites o bandas de
8-25
confianza para µY|X

Ahora bien, con los valores de: a = -1.047, X = 24.97, Σx2 = 132.73, s = 0.12, t.0.25;13
= ± 2.16 y asignándole valores a Xo, digamos de 19, 28, 30.0, etc., se procede de la
siguiente manera:
Para Xo = 19.0; Y’o = -1.047 + 0.058(19.0) = 0.055, etc.
Enseguida, usando la fórmula (8-28) y sustituyendo los valores, es decir, para Xo = 19
da:
.055–2.16(0.12) 1 +(19.0-24.97)2/132.73 < µ < .055+2.16(0.12) 1 +(19.0-24.97)2/132.73

Y|19
15 15
El cual se simplifica a: 0.335 > µY|19 > 0.299
Así se puede continuar dando diferentes valores de Xo y sustituyéndolos, como se

hizo arriba, para, finalmente, hacer las bandas de confianza para µY|X.
(f) Para calcular los valores de R, R2, s y PRESS se pueden hacer con un paquete de
computadora. Por ejemplo, si se hace manualmente, el coeficiente R se calcula usando
la ecuacion (8-14), etc. De otra manera, si se usa el Mintab proceder como:
Stat → Regression → Regression
En la ventana de “Response” poner la variable dependiente, y en la ventana de
“Predictors” poner la variable independiente. También se pueden usar las ventanas de
“Graphs”, “Options” y “Results” para obtener información adicional. Por ejemplo los
valores de las estadísticas objetivistas de inferencia dadas por el programa son:
R2 = 73.6%, R = 0.858, s = 0.1112, PRESS = 0.2204. Por ejemplo, el valor de R =
0.8576 indica indica una correlación positiva que va de acuerdo con la pendiente
positiva de la curva de .058. Los valores tan pequeňos de s y de PRESS indican un
buen ajuste de los datos al modelo de regresión.
(g) Para la prueba de hipótesis Ho:ρ = 0, es decir, para el coeficiente de correlación
poblacional, ρ con α = 0.05, contra la hipótesis alternativa de H1:≠ 0, esto es, H2:ρ > 0
8-26
y H3:ρ < 0 se usan las siguientes estadísticas:

(1) Usando la estadística de t de Estudiante (8-25):
2
t= n − 2 R / 1− R
Donde:
R = ya definida
Para calcular las regiones críticas se usa la distribución de t, es decir, t[α/2;n-2] = t.025;13 =
± 2.16
Entonces, usando la fórmula de abajo y sustituyendo los valores da:
∑x ∑ y
2 2
R = Σxy / = 7.701 / (132.73)(0.6074) = 0.86
y R2 = 0.7396
Ahora, usando la estadística de abajo y sustituyendo da
2
t= n−2 R/ 1− R
t = 13 (0.86) / .2604
= 6.07
Si se desea sacar el valor de p se busca 6.07 en la tabla de la distribución de t con ν =
13 y con α = .05, lo que da .025 < p < .05.
(h) Para graficar los datos aunados a la ecuación de la línea de regresión con una línea
horizontal correspondiente al valor del promedio Y se hace usando un paquete de
computadora.
8-27
Figura 8.6. Gráfica mostrando la fuerza de rompimiento (log10) en función del

diámetro de la fibra, con la ecuación de la linea de regresión Y = -1.046 + 0.058(X) y
con el promedio Y = 0.402. (Elaboración propia).
(i) Emitir un juicio subjetivo que ayude a validar el uso del modelo de regresión. Para
responder a esta pregunta se hacen los siguientes gráficos:

1
-1
-2
2 4 6 8 10 12 14
Observation Order
Figura 8.7a. Gráfica mostrando los residuos estandarizados versus el orden de la

observación. Esta es una gráfica que muestra todos los residuales en el orden en el
cual los datos fueron coleccionados. Aquí hay el mismo número de datos positivos
y negativos. Esta gráfica también sirve para encontrar errores no aleatorios,
especialmente, en efectos relacionados con el tiempo.
8-28

1
-1
-2
0.1 0.2 0.3 0.4 0.5 0.6 0.7
Fitted Value
Figura 8.7b. Está gráfica muestra los residuales versus valores ajustados. Para que
el modelo de regresión sea aceptable, se requiere que: los puntos en la gráfica sean
aleatorios en ambos lados de 0; no debe haber series de puntos que aumenten o
disminuyan; no debe haber predominancia de residuales positivos o negativos, ni
tampoco debe haber patrones de residuales que aumenten con valores ajustados
que aumenten. Como se ve, todas estas condiciones están bien sustentadas.
1
Normal Score
-1
-2
-2 -1 0 1 2
Figura 8.7c. Gráfica mostrando la prueba de normalidad. Los datos deben formar
una línea recta si los residuales están normalmente distribuidos (situación que
ocurre aquí). De otra manera, la suposición de normalidad se inválida.
8-29
Como se observa en estas gráficas, la emision de un juicio subjetivo es aceptable,

porque el modelo de regresión seleccionado ajusta bien los datos. Esto se debe a que,
en la Figura 8.7a hay aleatoridad en los datos, es decir, con el mismo número de
valores positivos y negativos. Además, en la Figura 8.7b la descripción de ésta,
sugiere un modelo de regresión representativo de la información dada. Situación
similar ocurre con la descripción de la Figura 8.7c.
Ejemplo #5. En un estudio de ingeniería del agua relacionado con las reducciones de
los sólidos suspendidos, en función de la demanda química de oxígeno (DQO), se
sacó una muestra aleatoria, cuyos datos se dan en la tabla de abajo. Para lo siguiente:
(a) Identificar la variable dependiente y la independiente y hacer una gráfica de DQO
versus reducción de sólidos.
(b) Calcular la ecuación de la línea de regresión.
(c) Hacer una tabla de análisis de varianza que incluya la F crítica y el valor de p.
(d) Validar el modelo candidato, a través de estadísticas como R2, PRESS, s y de la
estadística de Durbin-Watson (para la prueba de autocorrelación de residuales).
(e) Evaluar la utilidad del modelo a través de gráficos subjetivos:
TABLA 8.8. Tabla mostrando las mediciones de sólidos y la demanda química de
oxígeno. (Elaboración propia)
__________________________________________________________________
Sólidos supendidos DQO
___________________________________________________________________
30 29 33 37 25 32 29 27 31 36 25 31
30 30 33 30 35 31 29 28 32 29 30 30
29 30 34 30 36 30 28 29 34 29 34 29
34 31 36 29 31 30 33 30 35 28 30 28
28 31 36 28 33 32 26 30 34 28 30 31
27 32 36 27 31 32 27 32 34 26 29 31
Solución:
8-30
(a) La variable dependiente es DQO y la variable independiente es reducción de

sólidos suspendidos. La figura 8.8 de abajo muestra las concentraciones de DQO
versus reducción de sólidos suspendidos.
Figura mostrando la grafica de DQO y solidos suspendios.
35
DQO (Y)
30
25
27 32 37
Solidos suspendidos (X)
Figura 8.8. Gráfica mostrando el DQO versus reducción de sólidos.

(b) La ecuación de la línea de regresión es:

DQO (Y) = 1.53 + 0.909 X(sólidos suspendidos)
La pendiente es igual a 0.909 y el intercepto es 1.53
(c) La tabla de abajo muestra la información de ANOVA.
TABLA 8.9. Tabla de ANOVA de sólidos suspendidos y DQO.

Fuente de SS g.l. MS Fcalc. Fcrítica Valor de p
Variación
Entre los grupos 32.00 1 32.00 4.35 3.98 0.04
Total 546.44 71
__________________________________________________________________
(d) s = 0.9039 R2 = 88.8% R2(ajustada) = 88.5%

PRESS = 31.8928 R2(predecida) = 87.13% Durbin-Watson statistic = 1.67
8-31
Aquí, el coeficiente de determinacion R2, mide, qué tan bien el modelo de

regresión ajusta los datos. Análogamente, el estadístico PRESS (suma de
cuadrados de error de predicción) mide la calidad del modelo de regresión. En
cuanto a la estadística Durbin-Watson, si está cercana a 2 no hay autocorrelaciones
en series positivas o negativas. La variación de los datos la da la estadística s.
(e) La Figura 8.9 da la información subjetiva para la evaluación del modelo.
(a)
1
-1
-2
-3
-4
25 30 35
Fitted Value
(b)
1
Normal Score
-1
-2
-4 -3 -2 -1 0 1 2
Figura 8.9. La figura (a) prueba por la autocorrelación o falta de independencia de los
datos. Además, la figura (b) prueba por la normalidad de los datos.
8-32
Regresión y correlación lineal múltiple

Muchas aplicaciones del análisis de regresión involucran situaciones donde se tiene
más de una variable independiente. En la mayor parte de los problemas de
investigación se necesitan varias variables independientes para ver el efecto en la
variable dependiente. La variable dependiente o de respuesta (Y) puede estar
relacionada con muchas variables independientes o regresoras X1, X2, etc.
En el estudio de regresión lineal múltiple se pueden usar el enfoque matricial.
También se pueden hacer pruebas de hipótesis, intervalos de confianza, análisis
subjetivos (análisis de los gráficos) y análisis objetivos (estadística de inferencia),
como los cálculos de los coeficientes de determinación (R2) o de correlación (R),
como en el caso de la regresión lineal simple. Sin embargo, en este caso, se puede
calcular el coeficiente de correlación general y coeficientes de correlación parciales,
es decir, en forma análoga a como se hace con los coeficientes βo, β1, etc.
Cuando hablamos de regresión lineal múltiple tenemos las siguientes
situaciones:
1. Modelo de primer orden con dos variables regresoras o independientes.
2. Modelo de primer orden con más de dos variables independientes.
Modelo de regresión múltiple generalizado
Cuando este modelo general es lineal en los coeficientes se denomina modelo de
regresión múltiple. Por ejemplo, para el caso de k variables independientes x1, x2,
x3,..., xk, el promedio está dado por Y|x1, x2, x3,..., xk y se da por el modelo de
regresión múltiple poblacional:
Y = µY|x1, x2, x3,..., xk = βo + β1x1 + β2x2 + ...+ βkxk + εk (8-29)
Este modelo, también se puede expresar con otra anotación como:
Ŷ j = βo + β1X1j + β2X2j + ……. + βkXkj + εj (8-29a)
Los parámetros βj, j = 0, 1, 2, 3,.., k se conocen como coeficientes de regresión
8-33
poblacionales. Por ejemplo, el parámetro βj representa el cambio esperado en la

respuesta Y, por unidad de cambio en xj, cuando todos los demás pronosticadores xi
se mantienen constantes. Además, εi y ei son los errores aleatorios o residuos de
población y de la estadística asociados con la respuesta Yi.
El modelo de regresión lineal múltiple de la muestra que estima al modelo
poblacional de arriba es:
Y = bo + b1X1 + b2x2 + ... + bkXk + e (8-30)
Donde cada coeficiente de regresión parcial βi es estimado por bi. Esto se debe a
qué, cada coeficiente parcial βi mide el cambio esperado en Y por unidad de cambio
en x1, cuando x2 se mantiene constante, y β2 mide el cambio esperado en Y por
unidad de cambio en x2 cuando x1 se mantiene constante.
El modelo de primer orden con dos variables independientes es:
Yi = βo + β1Xi1 + β2Xi2 + ε (8-31)
Donde Yi, la variable dependiente que denota la respuesta en las -ésimas tentativas;
Xi1 y Xi2 son las dos variables independientes de la -ésima tentativa; βo, β1, β2 son los
coeficientes de regresión y, ε es el error o residuo.
Modelo de regresión múltiple con más de dos variables independientes
Yi = βo + β1Xi1 + β2Xi2 + … + βp-1Xi,p-1 + ε (8-32)
Cuando hablamos de regresión lineal múltiple, el principal objetivo es la obtención
de la ecuación de la línea de regresión muestral, para predicción y estimación, la
cual emula a la ecuación poblacional. Sin embargo, antes de poder usar el modelo
de regresión calculado, éste se tiene que evaluar, para ver qué tanta confiabilidad se
le pueda dar. La evaluación o validación del modelo de regresión estimado se hace
a través de análisis objetivos y subjetivos, en forma análoga como en la regresión
lineal simple. Por ejemplo, los análisis objetivistas se hacen a través de funciones
estadísticas de inferencia. Posteriormente, para que la validación del modelo sea
8-34
completa, el procedimiento se complementa usando enfoques subjetivistas, a través

de análisis de las gráficas de los valores residuales. Si la validación no es
satisfactoria, se procede con remediación del modelo, ya sea haciendo
transformaciones de los ejes o probando otros modelos más apropiados, como
cuadráticos o cúbicos, etc.
Aplicación de análisis subjetivos y objetivos para la evaluación del modelo de
regresión
Como se ha estado mencionando anteriormente, se sugieren dos maneras de revisar
la utilidad del modelo obtenido. Estas maneras son: (1) análisis de gráficas de
residuos y, (2) pruebas estadísticas de inferencia.
Por ejemplo, para validar el modelo de regresión aplicando análisis
subjetivos, es decir, a través de los gráficos de los residuos (ei), éstos se describen
como las diferencias entre los puntos y la línea de regresión. Siendo así, las
suposiciones son de que los residuos deben ser independientes y normalmente
distribuidos, con promedio igual a cero y con varianzas constantes. Más
explícitamente, las descripciones de las suposiciones son:
1. Los valores de la variable aleatoria estadística ei deben estar normalmente
distribuidos. Para lograr esto, se grafican los residuos (crudos o estandarizados) de
la variable dependiente en función de los valores de z o normales esperados. Para
que se reúna la condición de normalidad de los datos, todos los puntos deben de
estar dentro de las bandas de confianza y deben de estar muy cercanos a la línea de
regresión. Además, si los términos del error ei están normalmente distribuidos, los
residuales estandarizados o crudos deberán estar, aproximadamente, de acuerdo
con las reglas del 68%, 94% y 99%. Esto quiere decir qué, el 68% de los residuos
deberán estar entre z = ±1; el 95% deberán estar entre z = ±2 y, finalmente, el 99%
de los residuos deberán estar entre z = ±3.
8-35
2. Los valores de la variable aleatoria ei deben ser independientes uno del otro. No
debe haber colinialidad o correlación en serie. Esto se revisa graficando los
residuos (estandarizados o crudos) en función de los renglones. Si no hay,
aproximadamente, los mismos residuos positivos y negativos en la gráfica,
entonces, el modelo lineal calculado no es el apropiado y tendrán que buscarse
otras alternativas (como funciones polinomiales, cuadráticas, cúbicas, etc.). Aquí
cabe notar que la suposición de independencia es la más importante que se pueda
violar, porque es la base para las pruebas estadísticas como la R2, el error de lo
estimado (s dado por el programa Minitab), ANOVA, etc.
3. Los valores de la variable aleatoria ei deben de tener la misma varianza. Esto se
llama homoscedasticidad. Esto se puede revisar visualmente graficando los
residuales estandarizados o no estandarizados (crudos) contra cada valor de las
variables independientes (Xi). Aquí, nuevamente, tiene que haber la misma
cantidad de valores positivos y negativos expresados en la gráfica. Aquí, sin
embargo, existen otros métodos para revisar por el problema de
heteroscedasticidad que se retomarán en el capítulo de regresión polinomial.
Otros investigadores estadísticos (Devore, 2000) sugieren cuatro gráficos de
diagnóstico subjetivo, para la validación del modelo de regresión múltiple. Estos
gráficos de diagnóstico son:
valores de Xi en la abscisa.
valores pronosticados (en la abscisa) por el programa de computadora usado.
3. El gráfico de los valores pronosticados en la ordenada versus los valores de Yi en
la abscisa.
4. Gráfico de normalidad de los residuos estandarizados versus los percentiles de z
8-36
(valores de z).
5. Histogramas.
Aplicación de análisis objetivos para la evaluación del modelo de regresión
Por otro lado, en cuanto al enfoque objetivista (estadística inferencial) para la
validación del modelo de regresión, éste está relacionado con el uso de estadísticas
como el coeficiente de determinación múltiple R2 (o r2), el coeficiente de
determinación ajustado R2ajustada, el error estándar de lo estimado, s, tablas de
análisis de varianza, pruebas de t de Estudiante, intervalos de confianza, el criterio
de Mallow de Cp, PRESS, etc.
De esta manera, cuando se habla de coeficientes en el modelo de regresión
múltiple, existen cuatro tipos de coeficientes:
(1) El coeficiente de determinación múltiple (R2)
(2) El coeficiente de correlación múltiple (R)
(3) El coeficiente de determinación ajustado (R2ajustada)
(4) El coeficiente parcial de correlación múltiple (Rij.k)
Por ejemplo, el coeficiente de determinación múltiple R2 es, tal vez, la
medida estadística más popular usada para medir, qué tan bien encaja el modelo de
regresión en los datos de la muestra. En realidad el uso de R2 es una técnica para
medir la adecuación de un modelo de regresión lineal múltiple. Esta estadística se
puede definir como una proporción o como un porcentaje. Como proporción, sus
valores varían de cero a uno. Por ejemplo, si el valor de R2 está cercano a cero, esto
indica que no hay una relación lineal entre Y y las X´s, mientras que, un valor
cercano a uno, indica una ajuste perfecto. Sin embargo, el valor de R2 no debe de
interpretarse ligeramente, sin el apoyo del error estándar de lo estimado (s), el
residual (PRESS), el criterio de Mallow (Cp) o los factores de variación inflados
(variance inflation factors, VIF). Además la validación del modelo debe estar
8-37
apoyada por los análisis de los gráficos subjetivos.

De acuerdo a la lógica del programa de NCSS, los siguientes enunciados dan
algunas calificaciones de la interpretación de R2.
1. El valor de R2 puede incrementarse agregando más variables independientes,
pero esto puede causar un aumento en el error del cuadrado medio, especialmente,
cuando la muestra es pequeña.
2. La magnitud de R2 está influenciada por el rango de cada variable independiente.
R2 aumenta a medida que el rango de las X´s aumenta y viceversa.
3. El valor de R2 no mide la magnitud de las pendientes.
4. La magnitud de R2 no mide la aptitud del modelo lineal; mide la fuerza lineal del
componente del modelo.
5. Un valor grande de R2 no necesariamente significa una predicción grande. Lo
opuesto también es correcto. Todo esto tiene que ser complementado o
corroborado por otras funciones estadísticas y por el análisis gráfico subjetivo.
6. El valor de R2 es altamente sensible al número de observaciones. Entre más
grande sea el tamaño de la muestra, más alto será el valor de R2. Más adelante, hay
lo que se llama el valor ajustado del coeficiente de determinación múltiple ajustado
(R2ajustada). Este coeficiente de determinación múltiple ajustado R2ajustada es una
versión ajustada de R2 la cual busca remover la distorsión causada por un tamaño
de muestra pequeño. Igualmente, también hay lo que se llama PRESS (predicted
sum of squares) que se usa para validar el modelo de regresión en términos de
predicción. Aquí, entre más pequeño sea el valor de PRESS, mejor será el modelo
candidato.
En forma análoga, también hay lo que se llama el coeficiente de correlación
múltiple R. Este coeficiente R mide la fuerza de la relación lineal entre la variable
dependiente Y y las variables independientes X1, X2, X3,…, Xk. En contraste con el
8-38
coeficiente de correlación lineal simple, el rango de este coeficiente de correlación

múltiple es de 0 ≤ R ≤ 1. Esto se debe a que R no indica la pendiente de la
ecuación de regresión debido a que no es posible indicar los signos de todos los
coeficientes de regresión que relacionan la variable dependiente Y a las variables
independiente Xi. Así como en el caso de la correlación lineal, la medición de R2 es
más fácil de interpretar que el coeficiente de correlación múltiple, R.
Otro tipo de correlación relacionado con regresión y correlación múltiple es
lo que se llama coeficiente parcial de correlación múltiple. Este coeficiente mide la
fuerza de la relación lineal entre la variable dependiente Y y las variables
independientes X1, X2, X3,…, Xk. Este coeficiente se puede expresar como Rij.k el
cual es el estimador del coeficiente de correlación múltiple poblacional ρij.k. Rij.k se
puede usar para ver la relación causal entre Y y una de las variables independientes,
manteniendo las demás constantes. Este coeficiente, también se puede usar para ver
la relación entre dos variables independientes.
Más adelante, dentro de la categoría de análisis objetivos de estadística
inferencial relacionados con regresión múltiple, tenemos lo que se llama análisis de
varianza (ANOVA) discutido en capítulos anteriores. En forma análoga como el
uso de R2, este análisis es un método complementario para revisar las suposiciones
del modelo de regresión. La confiabilidad de los resultados del ANOVA está
mancomunada a la suposición de que los residuales están normalmente
distribuidos. El uso de ANOVA prueba los promedios poblacionales donde se
analiza la variación total. ANOVA evalúa la utilidad del modelo de regresión
probando la hipótesis nula de que todos los coeficientes (βi) de la ecuación de
regresión (pendientes) son igual a cero. Los componentes del análisis de varianza o
de ANOVA, son parecidos a los del análisis de varianza simple explicados en
capítulos anteriores. Los componentes son la fuente de variación, los grados de
8-39
libertad, la suma de los cuadrados, el cuadrado del promedio, la prueba de F y el

nivel de probabilidad. Por ejemplo, la fuente de variación representa las particiones
de la variación en Y. Hay cuatro fuentes de variación es decir, el intercepto, el
modelo, el residuo o error y, el total ajustado. La prueba de inferencia con la
estadística F se usa para probar la hipótesis de todas las βi = 0.
Más importante todavía, es el cálculo del nivel de probabilidad p. El valor de
p es la probabilidad de obtener un estadístico de prueba, al menos tan
contradictorio o más extremo para Ho:, como el valor observado que se obtuvo,
asumiendo que Ho: es verdadera. Si el valor de p es menor qué, digamos α = 0.05,
la hipótesis nula se rechaza; de otra manera se retiene. Entre más pequeño sea el
valor de p, menos credibilidad tendrá la hipótesis nula.
Otros estadísticos objetivistas para validar el modelo de regresión son las
pruebas individuales de t de estudiante para probar la hipótesis de que β1, β2, β3, βk
son iguales a cero. Además se pueden usar los intervalos de confianza. Por
ejemplo, en regresión múltiple el valor de t de estudiante se usa para probar la
hipótesis de que uno de los coeficientes es igual a cero, después de remover la
influencia de los otros. Los investigadores Paffenberger et al. (1987) dan la función
para el intervalo de confianza para βi. Sin embargo, si se concluye que β1 o βk no
son igual a cero esto, no necesariamente, dice que el modelo de regresión es útil
para predicción. En verdad, para determinar si el modelo es apropiado, en lugar de
probar que β1 = 0 y β2 = 0, separadamente (usando la prueba de t), se usa una
prueba conjunta como el análisis de varianza (ANOVA). De cualquier manera, la
prueba de hipótesis bilateral para probar los coeficientes individuales βi se usa el
siguiente formato dado en la tabla de abajo.
8-40
TABLA 8.10. Tabla mostrando los mecanismos para una prueba de hipótesis
bilateral para los coeficientes individuales βi incluidos en el modelo de regresión
múltiple. (Elaboración propia)
Hipótesis nula: Ho:βi = 0, hipótesis alternativa: H1:βi ≠ 0
Valor del estadístico: t = bi / sbi
Regla de decisión:
Rechazar Ho: si t > tα/2;n-(k+1) o bien si t < -tα/2;n-(k+1).
No rechazar Ho: si tα/2;n-(k+1) ≤ t ≤ tα/2;n-(k+1)
Donde: βi son los coeficientes de regresión individuales.
bi = estimadores de βi
sbi = errores estándar
α = nivel de significancia deseado
k = número de variables independientes
t = función estadística de t de Estudiante
Ejemplos aplicando la regresión y correlación múltiple
Ejemplo #6. En la adsorción de tierra y sedimento, la magnitud de la acumulación
en forma condensada de los productos químicos en la superficie es una
característica importante que influye en la eficiencia de insecticidas y varios otros
productos químicos. El artículo “Adsorption of Phosphate, Arsenate,
Methanearsonate and Cacodylate by Lake and Stream Sediments: Comparison with
Soils” (J. of Environ. Qual., 1984, pp. 499-504) presenta los siguientes datos en la
tabla de abajo. Aquí se toma Y como la variable dependiente, la cual denota el
índice de adsorción de fosfato, X1 es una de las variables independientes
denotando la cantidad de hierro extraíble y, X2 es otra de las variables
independientes denotando la cantidad de aluminio extraíble. (Devore, 2000)
8-41
TABLA 8.11. Tabla mostrando los datos del ejemplo.

_________________________________________________________________
Observación X1 (Hierro extraíble) X2 (Aluminio extraíble) Y (Índice de adsorción)

__________________________________________________________________
1 61 13 4
2 175 21 18
3 111 24 14
4 124 23 18
5 130 64 26
6 173 38 26
7 169 33 21
8 169 61 30
9 160 39 28
10 244 71 36
11 257 112 65
12 333 88 62
13 199 54 40
________________________________________________________________

Hacer los cálculos pertinentes.
Solución:
Usando un paquete de computadora da: bo = -7.351, desviación estándar = 3.485,
b1 = 0.11273, desviación estándar = 0.02969, b2 = 0.34900, s = 0.07131
La ecuación de la línea de regresión lineal múltiple es:
Y = -7.351 + (0.11273)(X1) + (0.34900)(X2)
Enseguida, para ver, qué tan confiable es el modelo de regresión calculado,
primero procedemos a efectuar el análisis subjetivo, es decir, el análisis de las
gráficas de los residuos.
8-42
Figura 8.10 Figura mostrando las gráficas de los residuos estandarizados versus
valores esperados de z (1); gráfica mostrando el residuo estandarizado versus la
variable independiente X1 (2); gráfica mostrando el residuo estandarizado versus la
variable independiente X2 (3); gráfica mostrando el residuo estandarizado versus el
valor de Y pronosticado (4) y, finalmente, gráfica de Y pronosticada versus
adsorción (5). (Elaboración propia)
8-43
Figura 8.11 Esta gráfica muestra un enfoque un poco diferente al de la figura

anterior, es decir usando los residuos no estandarizados en contraste con la figura
8.10 que usa los residuos estandarizados. Gráfica mostrando la prueba de
normalidad (1). Gráfica mostrando la prueba de independencia de residuos versus
renglones (2). Gráfica mostrando los residuos versus valores pronosticados (3).
Gráfica mostrando los residuos versus variable independiente de hierro (4). Gráfica
mostrando los residuos versus variable independiente aluminio (5). (Elaboración
propia)
8-44
El valor del coeficiente de determinación múltiple es: R2 = 0.9480

El coeficiente de determinación ajustado es: R2ajustada = 0.9380
El coeficiente de correlación múltiple es: R = 0.9736
Los coeficientes parciales se pueden estimar si se desea saber la relación
entre el índice de adsorción y el aluminio extraíble, poniendo la variable
independiente, hierro constante. También, si se deseara saber la relación entre el
índice de adsorción y el hierro extraíble, se pondría la variable aluminio constante.
Similarmente, si se deseara saber la relación entre las variables aluminio y la
variable del hierro, se pondría la variable índice de adsorción fija.
TABLA 8.12. Tabla mostrando los coeficientes de regresión, valores de t de
Estudiante, niveles de p y decisiones tomadas en Ho: (Elaboración propia)
_________________________________________________________________
Variable Coeficiente Valor de t Nivel Decisión
independiente de regresión de p (5%)
_________________________________________________________________
Intercepto -7.35066 -2.1094 0.0611 Aceptar
Hierro 0.11273 3.7969 0.0035 Rechazar
Aluminio 0.34900 4.8944 0.0006 Rechazar
_________________________________________________________________

_________________________________________________________________
Fuente de g.l. Suma de los Cuadrado Fcalc. Valor Poder de
Variación cuadrados medio de p la prueba
_________________________________________________________________
Intercepto 1 11580.31 11580.31
Regresión 2 3259.90 1764.95 92.03 0.000 1.0000
Error 10 191.79 19.18
_________________________________________________________________
Total 12 3721.69 310.14
8-45
TABLA 8.14. Tabla mostrando el reporte de residuos. (Elaboración propia)

_________________________________________________________________
Renglón Valor Valor Residuo Error estándar
actual pronosticado
_________________________________________________________________
1 4 4.0630 -6.3052 5.0077
2 18 19.7066 -1.7066 4.9511
3 14 13.5387 0.4612 4.7055
4 18 14.6552 3.3447 4.6862
5 26 29.6406 -3.6406 5.1051
6 26 25.4141 0.5858 4.5996
7 21 23.2182 -2.2182 4.6488
8 30 32.9902 -2.9902 4.6623
9 28 24.2976 3.7024 4.5671
10 36 44.9352 -8.9352 4.7012
11 65 60.7097 4.2902 5.4250
12 62 60.9014 1.0986 5.4195
13 40 33.9292 6.0707 4.5649
_________________________________________________________________
TABLA 8.15. TABLA mostrando los intervalos de confianza para este problema.
_________________________________________________________________
Variable Límite inferior (95%) Límite superior (95%)
independiente
_________________________________________________________________
Intercepto -15.1149 0.4137
Hierro (X1) 0.0467 0.1789
Aluminio (X2) 0.1901 0.5079
__________________________________________________________________
8-46
TABLA 8.16. Tabla mostrando la estadística descriptiva. (Elaboración propia)

_________________________________________________________________
Variable Conteo Promedio Desviación Valor Valor
estándar mínimo máximo
_________________________________________________________________
Hierro (X1) 13 177.31 70.10 61 333
Aluminio (X2) 13 49.31 29.19 13 112
Índice de (Y) 13 29.85 17.61 4 65
adsorción
_________________________________________________________________
Conclusiones: El modelo de regresión obtenido es válido para predicción y

estimación. Los datos encajan bien con un modelo lineal múltiple. Esta contención
está basada en el análisis subjetivo de las gráficas de los residuos. Por ejemplo, en
la figura 8.10 y 8.11 la prueba de normalidad es buena, porque todos los puntos
están dentro de las bandas, y muy cercanos a la línea de regresión. Además, los
puntos están de acuerdo con la regla del 68%, 95% y 99%, es decir, el 68% de los
puntos están dentro de z = ±1, el 95% están dentro de z = ±2, etc. En la figura 8.11
de los residuos versus los renglones, esto satisface la suposición de independencia,
porque hay el mismo número de residuos positivos y negativos. Además, las
gráficas de los residuos versus las variables independientes no violan la suposición
de no linealidad, porque no hay tendencias definidas. Finalmente, la gráfica de
residuos versus valores pronosticados están de acuerdo con la suposición de
varianzas iguales (homoscedasticidad).
En cuanto a los análisis objetivistas, es decir, usando pruebas estadísticas,
nuevamente, presuponen un buen ajuste del modelo de regresión estimado. Esto se
debe a qué, el valor del coeficiente de determinación múltiple R2 está muy cercano
a uno. Además, el valor de R = 0.9736 indica muy buena correlación entre la
variable dependiente y las variables independientes. Con respecto a la tabla del
análisis de varianza, el valor de F es mucho menor que el valor crítico y esto está
8-47
demostrado por el valor de la probabilidad p el cual es mucho muy significante.

Las pruebas de t de estudiante, también son muy aceptables y demuestran que las
pendientes de βi no son iguales a cero. Los intervalos de confianza dan resultados
similares y sugieren que el modelo de regresión es buen pronosticador. Se pueden
seguir haciendo pruebas de hipótesis para todos los parámetros poblacionales y, sin
lugar a dudas, éstas también apoyarían la contención de que, el modelo de
regresión, es aplicable.
Ejemplo #7. Considerar los datos de la tabla de abajo. Usando el programa de
computadora Minitab obtener el modelo de regresión más apropiado, es decir, un
modelo múltiple lineal (Modelo 1); modelo con transformación en el eje vertical
(Modelo 2) y un modelo con transformaciones de los ejes horizontales y del eje
vertical (Modelo 3).
TABLA 8.17. Tabla mostrando los datos bivariados de regresión. (Elaboración
propia)
X1 | 4 4 4 6 3 6 3 2
X2 | 3 4 3 4 2 4 2 2
Y | 3 2 7 6 5 6 7 4
Solución:
Abajo se dan los resultados de los tres modelos. Al juzgar por los resultados, se le
pide al lector que decida cual modelo es el más apropiado.
8-48
TABLA 8.18. Resultados mostrando el resumen de los tres modelos.

_______________________________________________________________
Regression Analysis: Y versus X1, X2 (Modelo 1)
The regression equation is: Y = 6.00 + 2.00X1 – 3.00X2

Constant 6.0000 1.803 3.33 0.021
X1 2.0000 0.7746 2.58 0.049
X2 -3.0000 1.183 -2.54 0.052
s = 1.414 R-Sq = 58.3% R-Sq(adj) = 41.7%

PRESS = 0.1274 R-Sq(pred) = 51.62%
Source DF SS MS F P
Regression 2 14.000 7.000 3.50 0.112
Total 7 24.000
Regression Analysis: Log Y versus X1, X2 (Modelo 2)

The regression equation is: Log Y = 0.810 + =.225X1 – 0.348X2
Predictor Coef SE coef T P

Constant 0.8101 0.1622 4.99 0.004
X1 0.2248 0.0697 3.23 0.023
X2 -0.3479 0.1065 -3.27 0.022
s = 0.1272 R-Sq = 69.3% R-Sq(adj) = 57.0%

PRESS = 0.1274 R-Sq(pred) = 51.62%
Source DF SS MS F P
Regression 2 0.1824 0.0912 5.63 0.052
Total 7 0.2634
Regression Analysis: Log Y vs Log X1, Log X2 (Modelo 3)

The regression equation is: Log Y = 0.595 + 1.83 Log X1 – 2.16 Log X2

Constant 0.5949 0.2095 2.84 0.036
Log X1 1.8342 0.7288 2.52 0.053
Log X2 -2.1573 0.8332 -2.59 0.049
s = 0.1483 R-Sq = 58.2% R-Sq(adj) = 41.5%

PRESS = 0.3005 R-Sq(pred) = 0.00%
Source DF SS MS F P
Regression 3 0.1533 0.0767 3.48 0.113
Total 7 0.2634
8-49
TABLA 8.19. Tabla mostrando los datos originales del problema. (Elaboración
propia)
___________________________________________________________________________
C1 C2 C3 C4 C5 C6
___________________________________________________________________________
Y X1 X2 Log Y Log X1 Log X2
___________________________________________________________________________
1 3 4 3 0.477121 0.602060 0.477121
___________________________________________________________________________
2 2 4 4 0.301030 0.602060 0.602060
___________________________________________________________________________
3 7 4 3 0.845098 0.602060 0.477121
___________________________________________________________________________
4 6 6 4 0.778151 0.778151 0.060206
___________________________________________________________________________
5 5 3 2 0.698970 0.477121 0.301030
___________________________________________________________________________
6 6 6 4 0.778151 0.778151 0.602060
___________________________________________________________________________
7 7 3 2 0.845098 0.477121 0.301030
___________________________________________________________________________
8 4 2 2 0.602060 0.301030 0.301030
___________________________________________________________________________
Ejemplo #8. En estudios de química analítica, el uso del análisis de fluorescencia

de rayos X se usa como una herramienta para estimar los porcentajes de los
ingredientes de muchas mezclas. A menudo, la estimación de las concentraciones
depende en la habilidad para ajustar modelos de regresión. En una investigación
intitulada “Corrections for Matrix Effects in X-rays fluorescent Analisis Using
Multiple Regression Methods”, publicado por Analytical Chemistry (Vol. 37,
1965) mezclas contiendo 4 ingredientes (Xi) fueron preparadas. Las
concentraciones de los componentes variaron en las mezclas para producir tipos
estándares de calibración (Yi). (Walpole, 1992, p. 421). Los datos de este problema
se dan abajo.
8-50
TABLA 8.20. Tabla mostrando los datos del problema de arriba.
Yi X1 X2 X3 X4
0.5514 1.1240 0.8980 0.8219 0.9906

0.4426 0.9285 0.8872 0.9308 0.9944
0.5631 1.1214 0.8030 0.7668 1.1221
0.5624 1.1635 0.8706 0.9272 0.9832
0.4505 0.9415 0.8064 0.9026 1.1127
0.5290 1.0712 0.8404 0.8662 1.0836
0.4702 0.9561 0.8731 0.8206 1.0290
0.5001 1.0186 0.8431 0.8346 1.0591
0.4425 0.9039 0.8314 0.7596 1.0994
(a) Ajustar un modelo lineal de regresión múltiple a los datos de la tabla.
Enseguida, estimar las concentraciones del ingrediente A para una mezcla cuya
tasa de intensidades de rayos-X sean, respectivamente, X1 = 1.10, X2 = 0.900, X3 =
0.800 y X4 = 0.995.
Solución:
(a) Usando un paquete de computadora y asumiendo un modelo de regresión lineal
múltiple se obtiene la ecuación de regresión.
Y = -0.3004 + 0.5387X1 + 0.1770X2 – 0.0704X3 + 0.1506X4
Sustituyendo las variables independientes, se obtiene el valor de la respuesta Y, es
decir:
Y = -0.3004 + 0.538(1.10) + 0.1770(0.90) – 0.0704(0.80) + 0.1506(0.995)
= 0.50
Ejemplo #9. Montgomery y Peck (1992) describen el uso de un modelo de
regresión para relacionar la cantidad de tiempo que requiere un vendedor para dar
servicio a una máquina expendedora de artículos y el número de empaques
contenidos en la máquina y la distancia del vehículo (pies) de servicio del sitio
8-51
donde se encuentra la máquina. Este modelo de regresión múltiple fue utilizado

para diseñar la ruta, los horarios y la salida de los vehículos. La tabla de abajo
muestra 25 observaciones del tiempo de suministro, número de empaques y la
distancia, del vehículo.
TABLA 8.21. Tabla mostrando los datos de suministro.
No. de observación Tiempo de suministro No. de envases Distancia del vehículo
1 9.45 2 50
2 24.45 8 110
3 31.75 11 120
4 35.00 10 550
5 25.02 8 295
6 16.86 4 200
7 14.38 2 375
8 9.60 2 375
9 24.35 9 100
10 27.50 8 300
11 17.08 4 412
12 37.00 11 400
13 41.95 12 500
14 11.66 2 360
15 21.65 4 205
16 17.89 4 400
17 69.00 20 600
18 10.30 1 585
19 34.93 10 540
20 46.59 15 250
21 44.88 15 290
22 54.12 16 510
23 56.23 17 590
24 22.13 6 100
25 21.15 5 400
8-52
Para este problema calcular los siguientes enunciados:

(a) El modelo de regresión lineal múltiple poblacional.
(b) El modelo de regresión lineal múltiple de la muestra que estima al modelo
poblacional.
(c) Predecir el tiempo de suministro para pares de valores de las variables de
regresión, número de empaques (x1) y distancia (x2), cuando x1 = 1 empaque y la
distancia es igual a x2 = 25 pies.
(d) Evaluar el modelo de regresión obtenido usando técnicas objetivistas y
sujetivistas, como las descritas en este capítulo.
Discutir el razonamiento que se sigue en la validación subjetiva de los gráficos.
Solución:
(a) El modelo de regresión múltiple, para 2 variables independientes es:
µY|x1,x2| = βo + β1x1 + β2x2 + ε
(b) El correspondiente modelo de regresión lineal múltiple muestral es:
Y = bo + b1X1 + b2X2 + e
Donde:
Y = tiempo de suministro
X1 = no de envases
X2 = distancia del vehículo
El modelo de regresión de la muestra es:
Y = 1.74 + 2.78 (X1) + 0.013 (X2)
(c) Para predecir el tiempo de suministro (Y) en relación con el número de envases,
cuando X1 = 1 y con la distancia del vehículo, cuando X2 = 25 pies se obtiene
sustituyendo los valores en la ecuación de regresión, es decir:
Y = 1.74 + 2.78(1) + 0.013(25) = 4.85
(d) Los resultados objetivistas estadísticos son: R2 = 98.1%; R2ajustada = 97.9%; s =
8-53
2.32; PRESS = 159.89.

TABLA 8.22. Tabla mostrando los valores de T y de P. (Elaboración propia).
Predictor Coeficiente SE coeficiente T P
Constante 1.743 1.155 1.51 0.145
No. de envases 2.790 0.092 30.09 0.000
Distancia del vehículo 0.013 0.003 4.33 0.000
_________________________________________________________________
Fuente de g.l. SS MS F p
Variación
Debido a la 2 5984.8 2992.4 555.2 0.000
Regresión
Error 22 118.6 5.4
Total 24
Para la validación subjetiva del modelo de regresión, analizando las gráficas

de los residuos estandarizados, deben existir, aproximadamente, el mismo número
de residuos positivos y negativos. Además, en la prueba de normalidad, todos los
puntos deben estar dentro de las bandas de confianza. El estudiante deberá hacer
los diagnósticos subjetivos para complementar la refrendación o confiabilidad del
modelo de regresión.
Procedimiento de regresión múltiple usando el programa Minitab
Procedimiento:
1. Irse a: Stat → Regression → Regression
2. En la ventana de “Regression” aparecen las entradas de la variable
dependendiente (Y) y de las variables independientes X1, X2, en sus columnas
respectivas relacionadas con el problema
8-54
3. En la ventanilla de “Response” (de esta ventana de Regression) entrar la variable

dependiente y, en la ventanilla de “Predictors,” entrar las variables independientes
(que se copiaron en las columnas del programa).
4. Debajo de esta venta de Regression están las ventanillas de “Graphs, Options,
Results y Storage”. Por ejemplo si se desea usar Graphs se pueden seleccionar los
residuales regulares o los estandarizados. En la ventanilla de “Option residual
plots”, puntear las gráficas de las cuatro opciones, para el análisis subjetivista.
5. En la ventana de “Regression-Options” puntear las funciones deseadas, v.g.,
variance “Inflation factors, Durbin-Watson statistics, PRESS”, etc.
6. En la ventana de “Regression-Results” puntear las funciones deseadas de las
cuatro enlistadas, v.g., “In addition de sequential sum…..”
Ejemplo #10. Este es un ejemplo del libro Applied Statistics: Análisis of Variance
and Regresion de los autores Dunn y Clark. Esta es una investigación relacionada
con la temperatura, tomada como la variable de respuesta, en función de variables
regresoras como la altitud, longitud y latitud. La tabla de abajo muestra los
resultados. Usando el programa Minitab:
(a) Encontrar el modelo de regresión más apropiado
(b) Validar el modelo usando metodos estadísticos, es decir, estimando el
coeficiente de determinación múltiple R2, R2 ajustada, s, PRESS, tabla de ANOVA,
y gráficas subjetivistas, como residuos versus órdenes, residuos versus valores
ajustados y pruebas de normalidad.
(c) Hacer comentarios acerca de los resultados
8-55
TABLA 8.24. Tabla mostrando los valores de la temperatura en oF (Y), Altitud en

pies (X1), Longitud en grados (X2) y Latitud en grados (X3).
Temperatura (Y) Altitud (X1) Longitud (X2) Latitud (X3)
55.7 1083 112 33
37.8 457 86 38
56.4 312 118 34
51.0 305 90 32
34.5 5221 105 40
34.0 2842 116 44
36.7 807 94 41
33.4 4260 112 41
32.6 815 83 40
49.1 3920 106 32
46.6 1054 84 34
36.3 4397 120 39
18.2 830 93 45
36.7 465 90 39
13.3 1162 92 47
30.1 787 82 41
__________________________________________________________________
Solución:
(a) Se assume un modelo de regresión lineal
(b) La utilidad del modelo se da por los valores de R2, s, PRESS, etc. mostrados
por las Figuras 8.12 (a), (b) y (c).
Regression Analysis: (Y) Temperatura versus (X1) Altitud, (X2) Longitud (X3)
The regression equation is: (Y) Temperatura = 99.2 - 0.00138 (X1) Altitud + 0.299 (X2)
Longitud - 2.29 (X3) Latitud
Predictor Coef SE Coef T P VIF

Constant 99.24 10.79 9.20 0.000
(X1) Altitud -0.0013780 0.0005968 -2.31 0.040 1.7
(X2) Longitud 0.29877 0.07736 3.86 0.002 1.7
(X3) Latitud -2.2900 0.1779 -12.87 0.000 1.0
8-56
s = 3.12166, R-Sq = 94.6%, R-Sq(adj) = 93.2%, PRESS = 214.855, R-Sq(pred) = 90.08%
Source DF SS MS F F crítica P
Regression 3 2048.54 682.85 70.07 F.05;3,12 = 3.49 <<< 0.001
Total 15 2165.48
(a) (b) (c)

Residuals Versus the Order of the Data Residuals Versus the Fitted Values Normal Probability Plot of the Residuals
(response is (Y) Temperatura) (response is (Y) Temperatura) (response is (Y) Temperatura)
2 2 99
95
90
1
1
80
70
Percent
60
0 0 50
40
30
20
-1 -1
10
-2 -2 1
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 20 30 40 50 60 -3 -2 -1 0 1 2 3
Observation Order Fitted Value Standardized Residual
Figura 8.12. La Figura (a) muestra los residuales vs. órdenes; la figura (b) muestra
los residuales vs. los valores ajustados y la figura (c) da la prueba de normalidad.
(c) En conclusión, de acuerdo a los valores del coeficiente de determinacion R2 =
95.6% hay un buen ajuste del modelo. El valor de F de la ANOVA rechaza la
hipótesis de igualdad de promedios (de altitud, longitud y latitud), con un valor de
p muy significativo. Las pruebas de T son significantes, lo que sugiere que no hay
problemas de multicolinealidad. Análogamente, los valores bajos de VIF sugieren
indican que no hay problemas de multicolinealidad. Esto, aunado, a los signos de
las variables regresoras de la ecuación de regresión, los cuales si están de acuerdo a
una lógica a posteriori. El valor de la función de Durbin-Watson Statistic o de
correlación en serie igual a 1.53384 indica que no hay problemas de
autocorrelación (aunque aquí, esto se puede ignorar porque el problema no
involucra series de tiempo). En cuanto a la Figura 8.12 la gráfica (a) muestra los
residuales versus los órdenes, en la cual hay aleatoriedad de los datos.
Análogamente, la gráfica de residuales vs. valores ajustados (b) indica alateoridad
8-57
o independencia de los datos, sin problemas de heteroscedasticidad (errores de

varianzas no constantes), etc. Finalmente, la gráfica de la prueba de normalidad (c)
indica que los datos están normalmente distribuidos (porque todos los puntos están
dentro de las bandas de confianza), aunque con sesgo positivo.
Nota: ¿Cree usted qué, eventualmente, el calentamiento global, debido a las
emisiones de gases de invernadero, generados por emisiones vehiculares e
industriales va a modificar las temperaturas que van en función de la latitud?
Ejemplo #11. Este es un ejemplo hipótetico mostrando la relación entre las
concentraciones de ozono artificial, a nivel del suelo (ppm) y las temperaturas (oF).
Este ejercicio está encaminado a calcular, manualmente, los residuales y de hacer
una gráfica mostrando los residuales crudos. Los datos se dan en la tabla de abajo.
TABLA 8.25 mostrando los datos de este problema.
__________________________________________________________________
Concentraciones de O3 (y)| 75 80 86 94 99 107
__________________________________________________________________
Temperatura (oF) (x) | 65 71 79 85 93 100

(a) Calcular el modelo de regresión y medir su adecuación estimando R2, R2(ajust.),
s, PRESS y la estadística Durbin-Watson
(b) Hacer una tabla mostrando el valor de la desviación entre los datos y el ajuste,
es decir, de los residuales regulares o crudos ei = yi – y i.
(c) Hacer una gráfica de O3 (y) y temperaturas (x) mostrando los residuales crudos
Solución:
(a) Usando un paquete de computadora da la ecuación de regresión:
Concentración de ozono ( y ) = 15.4 + 0.909 Temperatura (x)
s = 1.101, R2 = 99.3%, R2(ajust.) = 99.2%, PRESS = 9.42837, estadística Durbin-Watson = 3.33
(b) La TABLA 8.26 muestra los valores ajustados ( y i), los residuales y SSE.
8-58

____________________________________________________________________________________________
Residual crudo Suma de los cuadrados del error
i xi yi y i = 15.44 + 0.909 x ei = yi - y i SSE = (yi - y i)2
_________________________________________________________________________________________________________________________________________
1 65 75 y 1 = 74.53 75 – 74.53 = 0.48

0.2304
2 71 80 y 2 = 79.98 80 – 79.98 = 0.02
0.0004
3 79 86 y 3 = 87.25 86 – 87.25 = -1.25
1.5625
4 85 94 y 4 = 92.71 94 – 92.71 = 1.30
1.6900
5 93 99 y 5 = 99.98 99 – 99.98 = -0.98
0.9604
6 100 107 y 6 = 106.34 107 – 106.34 = 0.66
0.4356
Σ(yi - y i) = 4.8793
2
__________________________________________________________________________________________
(c) La Figura 8.13 de abajo muestra las concentraciones de ozono en función de las
temperaturas con los valores de los residuales ei.
8.13. Figura mostrando la medicion de cada uno de los valores residuales con la
línea de regresión. (Elaboración propia).
8-59
8.1. Los datos de abajo muestran las emisiones de óxidos de nitrógeno (NOx)
provenientes de calderas de plantas eléctricas.
Tabla mostrando los datos para el problema. (Elaboración propia)
__________________________________________________________________
MBtu/hr-ft2 (X) |100 125 125 150 150 200 200 250 250 300 300 350 400 400
NOx (Y) |150 140 180 210 190 320 280 400 430 440 390 600 610 570
(a) Calcular la ecuación de regresión de la muestra que estima a la verdadera ecuación

poblacional. (Y = -24.2 + 1.59X)
(b) Calcular el coeficiente de correlación R2 y R que estiman a ρ. (R2 = 0.95)
(c) ¿Cuál es la estimación esperada de la emisión de NOx cuando la tasa de liberación
es de 225 MBtu/hr-ft2? (333.67)
(d) Usar el programa de computadora de Minitab y analizar las gráficas de los
residuos para la prueba de normalidad y de los residuos en función del valor de X. (El
lector lo deberá hacer)
8.2. Este es un ejemplo del libro de Introducción al Analisis de Regresión Lineal de
Mongomery et al. (2001), donde habla de un ejemplo relacionado con las
concentraciones de ozono de debido al calor. Así, Davidson (“Update on Ozone
Trenes in California’s South COSAT Basin”, Air and Waste, 43, 226, 1993) estudio
las concentraciones de ozono en la cuenca aérea de la costa sur de California, durante
los años 1976 a 1991. Se cree que la cantidad de días en que las concentraciones de
ozono fueron mayores que 0.20 ppm depende del índice metereológico estacional,
que es el promedio estacional de la temperatura con 850 milibares. La siguiente
información muestra los datos.
8-60

___________________________________________________________________
Año No. de Días (y) Índice meteorológico
___________________________________________________________________
1976 91 16.7
1977 105 17.1
1978 106 18.2
1979 108 18.1
1980 88 17.2
1981 91 18.2
1982 58 16.0
1983 82 17.2
1984 81 18.0
1985 65 17.2
1986 61 16.9
1987 48 17.1
1988 61 18.2
1989 43 17.3
1990 33 17.5
1991 36 16.6
__________________________________________________________________
(a) Estimar la ecuación de regresión
(b) ¿Qué tanta confiabilidad se le puede dar al modelo seleccionado? Usar enfoques
estadísticos y gráficos para justificar esta pregunta.
8.3. En un estudio agrícola, para ver los efectos de los cambios climáticos globales
relacionado, con los patrones pluviales alterados debido al calentamiento global, por
las emisiones de CO2, se estudió la precipitación pluvial anual y el rendimiento de la
cosecha de gramíneas. La tabla de abajo da los datos.
8-61

Precipitación pluvial Rendimiento de la cosecha
en pulgadas (X) en libras por acre (Y)
7.12 1037
63.54 380
47.38 416
45.92 427
8.68 619
50.86 388
44.86 321
___________________________________________________________________
Ver cuál modelo de regresión encaja mejor en los datos, al juzgar por las estadísticas
y por los análisis gráficos, es decir, usando una aproximación lineal, una logarítmica
y una aproximación de función de potencia de la forma de Ln (Y) = Ln(a) + b(LnX).
(a) Usar una aproximación lineal como Y = a + bX y, además, calcular el coeficiente
de determinación R2. (Y = 880.4 – 9.6 (X), R2 = 0.699)
(b) Usar una aproximación logarítmica como Y = a + b Ln (X) y además, calcular el
valor de R2. (Y = 1331.08 – 557.03 Lg X)
(c) Usando una aproximación de función de potencia de la forma de Ln (Y) = Ln (a)
+ b (Ln X) y, además, calcular R2 (R2 = 0.829)
8.4. En un estudio de química analítica, en la tabla de abajo se da la relación entre la
temperatura y la molaridad (en moles por litro) de una sustancia. Para esto hacer los
siguientes:
(a) Estimar el modelo de regresión más apropiado basado en análisis estadísticos de
R2, R2ajustada, PRESS, s, y Cp y en análisis gráficos subjetivos de los valores
8-62
residuales.
Tabla mostrando la información requerida.
_________________________________________________________________
Temperatura oC | 4.3 4.5 4.8 5.5 5.7 5.9 6.4 6.7 7.5 7.9
_________________________________________________________________
Molaridad | 12.1 12.5 12.9 13.0 13.1 14.0 14.2 14.8 15.0 15.5
_________________________________________________________________
8.5. El aluminio es el tercer elemento más abundante que ocurre en minerales, rocas
y barros. El aluminio se puede analizar con el método de absorción atómica
espectrométrica (método A), el cual está exento de interferencias como fluoruros y
fosfatos. El aluminio también se puede analizar por medio del método de
calorimetría de cianuro de Eriocromo R (método B), el cual es más simple que el
anterior. La tabla de abajo muestra los resultados de los análisis (en mg/L) de los dos
métodos usados. Hacer los siguientes cálculos usando el programa de computadora
de Minitab o SAS.
(a) Calcular e interpretar el coeficiente de determinación R2 y el coeficiente de
correlación R. (R2 = 0.9922, R = 0.9961)
Tabla mostrando los datos del ejemplo. (Elaboración propia)
Método A | 5 6 6 8 10 10 11 11
Método B | 8 9 9 11 13 13 14 14
8.6. El berilio (Be) y sus compuestos son extremadamente venenosos y capaces de

causar la muerte en concentraciones altas. La inhalación del Be causa una seria
afección llamada beriliosis. El berilio también puede causar dermatitis, conjuntivitis,
neumonía aguda y beriliosis pulmonar crónica. Este elemento químico se usa en los
reactores atómicos, aviones, cohetes y en combustibles para mísiles. Hay dos
8-63
métodos para el análisis (en µg/L) del berilio, es decir, el método espectrométrico de
absorción atómica (método 1) y el método aluminon (método 2). Los resultados de
los análisis de los dos métodos se dan en la tabla de abajo. Hacer los siguientes
cálculos:
(a) Hacer un estudio estadístico objetivista, es decir, estimando los valores de R2,
R2ajustada, PRESS, s y tablas de ANOVA. Complementar el estudio haciendo análisis
subjetivistas.
Tabla mostrando los resultados de los métodos 1 y 2 para la medición del berilio.
Método 1 | 0 3 4 5 9 12 15 17 20 20
Método 2 | 1 7 11 19 24 31 31 35 41 41
8.7. En investigaciones de toxicología existen estudios que han demostrado que la

probabilidad de qué, un fumador de 40 años de edad, quien ha sido fumador los
últimos 10 años contraiga el cáncer pulmonar en los próximos 20 años es alta
(asumiendo que continúe fumando al mismo ritmo). Esta relación va en función del
número promedio de cigarrillos que fuma. Asumir un modelo de regresión lineal. La
tabla de abajo presenta los datos de esta investigación de toxicología.
8-64

Número de cigarrillos Probabilidad de cáncer
fumados por día pulmonar
5 .100
10 .113
20 .225
30 .300
40 .450
50 .540
60 .700
80 .860
(a) Identificar la variable dependiente y la variable independiente.
(b) Describir la ecuación de regresión que mejor encaje en los datos. (Y = 0.0981 –
0.00002(X) + 0.0003(X 2))
(c) Calcular R2, R2ajustada, s, y PRESS. (R2 = 0.996, R2ajustada = 0.995 s = 0.019,
PRESS = 0.0038)
(d) Analizar e interpretar los componentes de la tabla de ANOVA como Fcalc., Fcrítica
y el valor de p.
(e) Discutir la relación existente entre R2, s, PRESS, Fcalc., y el valor de p.
(f) Validar el modelo de regresión subjetivamente, es decir, analizando los gráficos
de los residuos estandarizados.
8.8. Se realizó un estudio de química ambiental y se registraron las cantidades de
cloruro de sodio (NaCl), el cual, cuando se disolvió en 100 gramos de agua destilada,
a diferentes temperaturas (oC) dio los siguientes resultados:
8-65

___________________________________________________________________
Temperatura (X) NaCl disuelto en gramos de agua (Y)
0 8 6 8
15 12 10 14
30 25 21 24
45 31 33 28
60 44 39 42
75 48 51 44

(b) Encontrar la línea de regresión y ponerla en la gráfica.
(c) Estimar la cantidad de NaCl que se disolverá a una temperatura de 300 K.
(d) A sabiendas de que, a medida que aumenta la temperatura, la disolución de las
sustancias, como las sales de sodio, aumenta proporcional al incremento de la
temperatura, entonces, siendo así, verificar de que hay una correlación casi perfecta
entre ambas variables.
(e) Hacer una prueba de hipótesis para el coeficiente de correlación muestral R, para
verificar que si existe una asociación lineal significante entre las dos variables.
Sugerencia: usar la estadística de t de Estudiante dada abajo:
t= R 2
con ν = n - 2 grados de libertad.
1− R n − 2
(f) Teóricamente, la disolución de muchas sales va en función directa a la

temperatura y, en teoría, el valor del coeficiente de determinación, R2 debería de ser
de 1.0. Siendo así, enlistar 2 factores (en el laboratorio de química) que pudieran
afectar la disolución de las sales y de no dar un valor menor que 1.0.
8.9. En un estudio de meteorología entre la cantidad de lluvia y la remoción de
8-66
contaminantes atmosféricos, se dio la siguiente información:

Precipitación (X) Remoción de partículas (Y)

(0.01 cm./día) (µg/m3)
4.3 126
4.5 121
5.9 116
5.6 118
6.1 114
5.2 118
3.8 132
2.1 141
7.5 108
(a) Calcular la remoción de contaminantes (Y) cuando el valor de la precipitación

pluvial es de X = 8.0. (102.44)
(b) Validar el modelo de regresión objetiva y subjetivamente.
8.10. En un estudio para evaluar la capacidad de los sistemas de flujo freático
(wetlands), usados para la degradación de la materia orgánica de las aguas residuales
se uso el parámetro de la demanda bioquímica de oxígeno (DBO) y varios otros
componentes quíٌ
micos. Este estudio dio como resultado los siguientes datos. Estos
resultados están relacionados con la carga de masa de DBO (en Kg./hectárea/día), la
cual se usó como la variable independiente (X) y, la degradación de la concentración
de masa carbonosa de DBO5 (en Kg./ha/día), la cual se uso como la variable
dependiente (Y). (Fuente de información es “Surface Floor Wetlands: A Performance
Evaluation”. Water Environ. Res., 1995, pp.244-247).
8-67
(X) | 3 8 10 11 13 16 27 30 35 37 38 44 103 142
(Y) | 4 7 8 8 10 11 16 26 21 9 31 30 75 90
(Fuente: Water Environ. Res., 1995)
(a) Graficar los datos

(b) Establecer el modelo de regresión más apropiado para este problema. Hacer los
mismos cálculos que el problema anterior.
(c) Validar el modelo de regresión seleccionado, objetivistamente, usando los
siguientes criterios o diagnósticos:
(1) Cálculo del coeficiente de determinación R2
(2) Cálculo del coeficiente de determinación ajustado, R2ajustado
(3) El coeficiente de correlación R
(4) La estadística PRESS
(5) El error estándar de lo estimado, s (Util para medir la utilidad del modelo. Se
selecciona el modelo que tenga el valor de s más pequeño)
(d) Evaluar el modelo candidato a través de los siguientes criterios gráficos:
(1) Prueba de normalidad
(2) Residuales en función de los ordenes
(3) Residuales en función de los valores ajustados
(e) Una vez que se haya seleccionado el modelo más apropiado, calcular la
remoción del DBO después de que el agua residual se degradó en el wetland cuando
la carga fue de 50 Kg./ha/día.
8-68
Nota: Los sistemas de flujo freático (áreas pantanosas) se usan como sistemas de
tratamiento natural, porque tienen la capacidad de degradar las concentraciones
carbonosas de DBO actuando como especie de lagunas de oxidación. En Minatitlán
y Coatzacoalcos, Veracruz, se usan estos tipos de tratamientos naturales.
Solución:
De acuerdo a la tabla de arriba se le pide al lector decidir, cuál modelo es superior.
8.11. El texto de Daniel, W.W., James C. Terrell Business Statistics (1989), p. 257
mencionan el problema del envenenamiento del ganado vacuno, por los insecticidas
el cual es un problema muy serio, porque los pesticidas tienen la facultad de
acumularse en los tejidos de los animales y, de ahí se pasan a aquellas personas que
los consumen. Así, en aňos recientes, los ambientalistas se han preocupado mucho
por los efectos, en el medio ambiente, debido al uso indiscriminado de insecticidas.
Es verdad que los insecticidas matan los insectos, pero también matan todo lo demás.
De esta manera, los insecticidas contaminan los frutos de las plantas, a los animales y
también a la gente. Los investigadores Mount y Oehmet estudiaron los efectos de los
insecticidas en las ovejas relacionada con la actividad enzimática en el cerebro.
Además, de otros análisis estadísticos, estos científicos derivaron una línea de
regresión que describe las relación entre la actividad enzimática en el cerebro de las
ovejas (Y) y el tiempo, en horas, después de que las ovejas has sido expuestas a los
insecticidas (X). La función de la línea de regresión estimada por estos científicos se
da abajo.
Y = 27.32 + 1.36 X
Basando el criterio en esta ecuación, estimar lo siguiente:
(a) Si después de que han pasado 30 horas, cuando las ovejas han sido expuestas a
los insecticidas, ¿Cuál sería el valor de la actividad enzimática? (68.12)
(b) Si el coeficiente de correlación muestral se da como R = 0.86 y, el coeficiente de
8-69
determinación es R2 = 0.74 (el que mide la fuerza de la relación lineal entre X e Y, es

decir, el % de asociación entre las dos variables), entonces, hacer una prueba de
hipótesis con Ho:ρ = 0, contra H1:ρ ≠ 0 (que es lo mismo que decir que no hay
asociación lineal entre X e Y). Asumir que el tamaño de la muestra es de n = 16 y el
nivel significante de α = 0.05.
Para esto, seguir las siguientes sugerencias:
Usar la distribución de t con ν = n – 2 grados de libertad y usar las regiones críticas
dadas por t[1-α/2;ν].
8.12. En estudios de química, la presión de un gas que corresponde a varios
volúmenes (de acuerdo a la ley de los gases de Boyle) se da en la tabla de abajo.
Asumir que el volumen del gas es (X) y la presión es (Y). Hacer los siguientes
cálculos:
(a) Hacer una gráfica con los datos.
(b) Estimar la línea de regresión de la muestra.
(c) Estimar el coeficiente de determinación R2 y el coeficiente de correlación R.
Interpretar los resultados.
(d) Predecir la presión del gas, cuando el volumen es .001 m3
(e) Predecir la presión del gas, en libras por pulgada cuadrada (lbs/in2) y, en
atmósferas (atm), cuando el volumen del gas es de 0.0528 cuartos (.05 L).
(f) En teoría, debido a que la relación entre el volumen del gas y la presión es
inversamente proporcional, el coeficiente de correlación debería ser de R = -1.0. Sin
embargo, si R difiriera del valor de -1.0, enlistar 3 factores que pudieran intervenir
para explicar esta situación.
8-70
Tabla mostrando los volúmenes y las presiones del gas. (Elaboración propia)
Volumen en cm3 | 50.0 60.0 70.0 90.0 100.0
Presión en Kg./cm2 | 64.7 51.3 40.5 25.9 7.8
Sugerencias: Se dan los siguientes factores de conversión: 1 atm = 14.7 lbs/in2 = 760
torr = 1.0668 kg/cm2; 1 cm2 = 0.16 in2; 1.0567 cuartos = 1 L; 1 pulgada cuadrada =
6.25 cm2; 1 m3 = 1000 L. = 106 cm3.
8.13. Se coleccionó una muestra de 33 casos de una descarga de aguas residuales
municipales. Esta muestra se analizó para la demanda bioquímica de oxígeno de 5
días (DBO5), en libras por día, y la demanda química de oxígeno, DQO (en libras por
día). La tabla de abajo muestra la información requerida.
Tabla mostrando las mediciones de DBO5 y DQO. (Elaboración propia)
Demanda química de oxígeno Demanda bioquímica de oxígeno
(lbs/día) (lbs/día)
494 486 216 202

444 556 200 240
528 600 238 280
396 428 164 184
532 440 230 194
308 291 116 134
350 490 150 215
456 545 190 246
440 582 190 292
544 368 248 177
309 386 120 193
538 400 226 165
480 347 200 160
500 278 222 125
396 304 176 137
8-71
Hacer lo siguiente:
(a) Ver su existe una correlación significante usando los valores R del DBO5 y el
DQO. (R = 0.9677, R2 = 0.9360)
(b) Interpretar el valor del coeficiente de correlación R y el coeficiente de
determinación R2. Usar el programa Minitab o EXCEL para hacer el cálculo pedido.
Nota. La demanda bioquímica de oxígeno de 5 días (DBO5) mide la concentración,

en mg/L o en libras por día de la materia carbonosa del agua residual. De hecho el
DBO mide la fracción biodegradable del drenaje, o del agua residual industrial o
doméstica, en términos del carbono. Usualmente, las unidades son en mg/L. Sin
embargo, esto se debe a que, anteriormente, se usaba indiscriminadamente las
unidades de ppm y mg/L. Después, se vio que, con los residuos tóxicos, la gravedad
específica era diferente a la de los residuos carbonosos. Por esta razón es mejor usar
las unidades de mg/L. Por otra parte, la prueba del DBO es de 5 días, para evitar la
nitrificación. En cambio, la prueba de la demanda química de oxígeno mide los
compuestos orgánicos biodegradables y los compuestos orgánicos tóxicos. Esto
quiere decir que, la demanda química de oxígeno (DQO) oxida la cantidad de
materiales totales oxidables presentes en el agua residual y varía con la composición
del agua, la temperatura, el periodo de contacto y otros factores más.
8.14. Considerar los datos de abajo relacionados con el peso del vehículo y el
rendimiento de gasolina. El peso del auto se da en toneladas y, el rendimiento del
combustible se da en millas galón. Los datos se dan abajo.
8-72
Tabla mostrando los datos del los modelos vehiculares en función del peso en
toneladas (X), y de millas por galón (Y).
________________________________________________________________
Modelo vehicular Peso (toneladas) Millas/galón
Buick Estate Wagon 4.36 16.9

Ford Country Squire Wagon 4.05 15.5
Chevy Malibu Wagon 3.61 19.2
Chrysler Le Baron Wagon 3.94 18.5
Toyota Corona 2.56 27.5
Datsun 510 2.30 27.2
Dodge Omni 2.23 30.9
Audi 5000 2.83 20.3
Volvo 99 GLE 3.14 17.0
Saab 99 GLE 2.80 21.6
Peugot 694 SL 3.41 16.2
Buick Century Special 3.38 20.6
Mercury Zephyr 3.07 20.8
Dodge Aspen 3.62 18.6
AMC Concord D/L 3.41 18.1
Chevy Caprice Classic 3.84 17.0
Ford LTD 3.73 17.6
Mercury Grand Marquis 3.96 16.5
Ford Mustang 2.59 26.5
Mazda GLC 1.98 34.1
Dodge Colt 1.92 35.1
VW Scirocco 1.99 31.5
Honda Accord LX 2.14 29.5
Buick Skylark 2.67 28.4
Chevy Citation 2.60 28.8
Oldsmobile Omega 2.70 26.8
Plymouth Horizon 2.20 34.2
Datsun 210 2.02 31.8
VW Dasher 2.19 30.5
Datsun 810 2.82 22.0
BMW 3210 2.60 21.5
VW Rabbit 1.93 31.9
(Fuente: Probabilidad y Estadistica Aplicadas a la Ingenieria. Montgomery et al.

1996)
Hacer los siguientes cálculos usando el programa Minitab.
(a) Estimar la línea de regresión entre las variables peso del vehículo y el
8-73
rendimiento de gasolina.
(b) Estimar el coeficiente de correlación de la muestra R (llamado también
coeficiente de correlación de producto-momento de Pearson) y el coeficiente de
determinación muestral R2.
(c) Hacer una gráfica que vaya en función de Y y X, trazarla en la gráfica y también
trazar la línea horizontal usando el valor del promedio de Y.
(d) Hacer una tabla de ANOVA.
(e) Estimar los intervalos de confianza para α y β las probabilidades
correspondientes para cada uno de éstos.
(f) ¿Qué otros factores tendrían que considerarse, para que el modelo de regresión
fuera más confiable?
8.15. Los metales pesados como el Hg, Cr, Pb, etc., pueden interferir con el
tratamiento biológico en las plantas municipales de aguas residuales domésticas. En
este estudio se hicieron mediciones mensuales en una planta modelo de tratamiento
de las concentraciones de cromo, Cr, en mg/L, tanto en el efluente como en la
entrada. Los resultados de las concentraciones de Cr se dan en la tabla de abajo.
Entrada (X) | 250 290 270 100 300 410 110 130 1100
(µg/L)
Efluente (Y) | 19 10 17 11 70 60 18 30 180
(µg/L)

(a) Hacer un diagrama de dispersión en papel aritmético.
(b) Hacer un diagrama esparcido en papel semilogaritmo y logaritmo completo
(transformación de los ejes).
(c) Calcular los modelos de regresión para las partes (a) y (b).
(Y = -9.06 + 0.17X; Y = -1.96 + 0.97X)
8-74
(d) Estimar Y cuando X = 350 en incisos (a) y (b).

(e) Calcular el coeficiente de correlación para (a) y (b). (R2 = 0.9425, R = 0.7469)
(f) Comentar sobre lo apropiado de Y y de R en cada caso.
8.16. En un estudio de microbiología ambiental relacionado con el cultivo de una
muestra de agua se dan los siguientes datos.
Tiempo en días desde | 3 6 9 12 15 18
la inoculación (X)
___________________________________________________________________
No. de bacterias (Y) | 115,000 14,700 23,900 35,600 57,900 86,400

(a) Trazar una curva Ln Yi versus Xi para ver qué tan bien se puede ajustar una curva
exponencial a los datos.
(b) Trazar una curva Yi versus Xi para ver que también se puede ajustar una línea
recta a los datos.
(c) Por interpolación, usando ambas gráficas estimar el número de bacterias después
de 20 días. Cuantificar las diferencias en ambos casos.
8.17. En el libro de J. L Devore, Probabilidad y Estadística para Ingeniería y
Ciencias se da una investigación relacionada con la temperatura (oC) y la
profundidad de la nieve acumulada en el suelo. Para esto se la tabla de abajo:
_______________________________________________________________
Temperatura (oF) | -62 -41 -36 26 -33 -56 -50 -66
_______________________________________________________________
Profundidad de la | 21 13 12 3 6 22 14 19
capa de nieve
_______________________________________________________________
(Fuente: Devore 2001) .
(a) Identificar la variable dependiente (Y) y la variable independiente (X).

8-75
(b) Estimar un modelo de regresión lineal. (Y = 5.71 – 0.202(X), R2 = 0.741, s =

3.759, PRESS = 409.02, F = 17.8, p = 0.006)
(c) Estimar un modelo cuadrático. (Y = 3.3 – 0.0943(X) + 0.0029(X 2), s = 0.019, R2
= 0.996, PRESS = 0.0038, F = 14.98, p = .008)
(d) Estimar un modelo cúbico. (Y = 9.96 – 0.139(X) + 0.0189(X 2) + 0.00022(X 3),
R2 = 0.914, s = 2.656, PRESS = 8007.75, F = 14.14, p = 0.14)
(e) De acuerdo a los resultados estadísticos, ¿Cuál de los tres modelos es superior?
8.19. La tasa de flujo en m3/min en un muestreador de alto volumen para medir la
calidad del aire, es decir, para partículas atmosféricas, depende de la caída de
presión, en pulgadas de agua, a través del filtro del muestreador. Siendo así,
supóngase que se coleccionó una muestra de 15 valores de caída de presión y la tasa
de flujo del aire a través del filtro del sensor. Los datos se dan en la tabla de abajo.
Tabla mostrando los datos para este problema. (Elaboración propia)
Tasa de flujo del aire con Caída de presión después de
3
las partículas (m /min) algún tiempo (pulgadas de agua)
2.00 5.0
1.99 6.0
1.88 7.0
1.76 7.8
1.68 8.4
1.57 9.6
1.46 9.9
1.40 10.6
1.39 11.7
1.20 14.0
1.15 15.9
1.07 19.0
1.01 24.0
1.00 28.0
0.95 35.0
(a) Calcular el modelo de regresión muestral que estime a la verdadera línea

8-76
poblacional. Para esto, identificar, primeramente, la variable dependiente y la

variable regresora. (Y = 1.95 – 0.0364 (X))
(b) Validar el modelo de regresión estimado en (a) usando enfoques subjetivos, es
decir, a través de gráficas con residuos estandarizados versus valores de caída de
presión. También hacer otra gráfica de residuos estandarizados versus los renglones.
Hacer otra gráfica más con los valores residuales versus los valores de z para la
prueba de normalidad.
(c) Complementar la validación del modelo de regresión usando métodos estadísticos
objetivistas. Para esto, estimar el coeficiente de determinación R2, el error estándar
de lo estimado (s dado por el Minitab) y PRESS. Usar el programa Minitab para
estos cálculos. (R2 = 76.0%, s = 0.1869, PRESS = 0.7405)
8.21. Se hace un estudio sobre la concentración de cadmio atmosférico, en ppm, yi y
su relación con Xi = la altura de los muestreadores y X2 = distancia de la fuente
emisora. La tabla de abajo muestra los datos. Hacer los siguientes cálculos:
(a) Ajustar el modelo de regresión que pueda ajustar a los datos del problema de la
concentración de Cd. (Y = 350.99 – 1.27X1 – 0.154X2)
(b) Validar el modelo usando enfoques de diagnóstico de estadística de inferencia
(objetivistas) y de análisis gráfico (subjetivistas).
(c) Usar el modelo de regresión lineal múltiple para predecir el la concentración de
cadmio, cuando la altura del muestreador es de X1 = 25 metros y la distancia de la
fuente emisora, es X2 = 851 metros. (188.2 ppm de Cd)
La tabla de abajo muestra los datos requeridos por este problema.
8-77

y (concentración de Cd) | 193 230 172 91 113 125
X1 (Altura del muestreador) | 1.6 15.5 22.0 43.0 33.0 40.0
X2 (Distancia) | 851 816 1058 1201 1357 1115
8.22. El texto Applied Statistics: Analysis de Variance and Regression de los

investigadores Olive Dunn y Virginia Clark, discuten un ejemplo para predecir el
rendimiento de la cosecha de cebada, en función de la precipitación pluvial X1 y la
temperatura X2. Para esto, hacer los siguientes cálculos:
(a) Enlistar el modelo de regresión lineal múltiple que mejor ajuste a los datos.
(b) Estimar la ecuación de los cuadrados mínimos que ajuste el rendimiento de trigo
(Y) a la precipitación pluvial (X1) y la temperatura (X2).
(c) Probar la hipótesis de Ho: β2 = 0 con α = 0.05.
(d) Estimar el coeficiente de correlación parcial ρ2y.1 y probar Ho:ρ 2y.1 = 0
(e) Validar el modelo de regresión derivado para ver, qué tanta confiabilidad se le
puede acreditar. Hacer esto, a través de juicios objetivistas, como los diagnósticos R2,
R2ajustada, R2predecida, s, PRESS y Cp. Complementar la evaluación del modelo usando
técnicas subjetivistas, como los análisis de los gráficos de residuales estandarizados y
estudiantizados, prueba de normalidad, etc.
8-78
Tabla mostrando los rendimientos de cebada como variable dependiente de la

precipitación pluvial y la temperatura.
Rendimiento de cebada (yi) Precipitación (x1) Temperatura (x2)
(fanegas/acre) (pulgadas) (oF)
21.0 45 54.1
20.0 47 61.6
21.0 33 50.8
24.0 39 52.1
20.0 30 50.2
12.5 28 57.1
19.0 41 55.7
23.0 44 57.6
23.0 31 50.1
19.0 29 38.0
21.0 34 56.2
12.0 27 51.5
21.0 42 54.1
27.0 35 46.7
17.5 43 60.8
26.0 39 56.9
11.0 31 60.3
24.0 42 54.6
26.0 43 53.5
18.5 47 64.0
15.5 25 45.7
(Fuente: Dunn et al. 1974. Applied Statistics: Analysis de Variance and Regression)
8.23. El texto Applied Statistics: Analysis de Variance and Regression de Dunn et al.
1974) hace un estudio médico relacionado con el cambio de la hemoglobina de la
sangre de operaciones de la glándula tiroides, el cual está relacionado con la duración
de la operación quirúrgica y el cambio en el porcentaje de la hemoglobina de la
sangre. Los datos se dan en la tabla de abajo.
8-79
Tabla mostrando los datos.

________________________________________________________________
No. de paciente | 1 2 3 4 5 6 7 8
Pérdida de sangre (x1) | 105 80 86 112 109 100 96 120
Duración en minutos (x2) | 503 490 471 505 482 490 513 464
% de cambio de
hemoglobina (y1) | -1.7 -4.6 -9.8 -1.1 -4.1 -3.3 0.4 -2.9
________________________________________________________________
Fuente: Dunn et al. 1974
(a) Encontrar el modelo de regresión múltiple para predecir el porcentaje del cambio
de la hemoglobina (y) en función de las variables independientes, es decir, duración
de la operación (x1) y de la pérdida de sangre (x2). (y = -84.002 + 0.129x2
+ 0.138x2)
(b) Predecir el % del cambio en la hemoglobina, cuando la duración en minutos de la
operación es de 80 y la pérdida de sangre es de 350 ml. (25.38%)
(c) ¿Discutir, qué tanta fidelidad se le puede otorgar al modelo de regresión múltiple
obtenido en este problema?
(d) Calcular el coeficiente de determinación múltiple. (R2 = 0.813)
(e) Calcular el coeficiente parcial de correlación, es decir, entre y y x1, con x2
constante. (0.793)
8.24. El libro de Jay L. Devore intitulado Probabilidad y Estadística para Ingeniería
y Ciencias discute el diseño eficiente de ciertos incineradores de desperdicios
municipales, los cuales requieren de información acerca del contenido energético de
los desperdicios. Acordemente, los autores del artículo “Modelling the Energy
Content of Municipal Solid Waste Using Multiple Regression Techniques (J. of the
Air and Waste Mgmt. Assoc., 1996, pp. 650-656) proporcionaron los siguientes datos
acerca de Y = contenido energético (Kcal/Kg.), en función de regresores % de
8-80
plásticos en peso, % de papel en peso, % de basura en peso y % de humedad de peso.

_______________________________________________________________________________________________
Obs. % Plástico (x1) % Papel (x2) % Basura (x3) % Humedad Contenido energético (y)
_______________________________________________________________________________________________
1 18.69 15.65 45.01 58.21 947
2 19.43 23.51 39.69 43.61 1407
3 19.24 24.23 43.16 46.63 1452
4 22.64 22.20 35.76 45.85 1553
5 16.54 23.56 41.20 55.14 989
6 21.44 23.65 35.56 42.24 1162
7 19.53 24.45 40.18 47.20 1466
8 23.97 19.39 44.11 43.82 1656
9 21.45 23.84 35.41 51.01 1254
10 20.34 26.50 34.21 49.06 1336
11 17.03 23.46 32.45 53.23 1097
12 21.03 26.99 38.19 51.78 1266
13 20.49 19.87 41.35 46.69 1401
14 20.45 23.01 43.59 53.57 1223
15 18.81 22.62 42.20 52.98 1216
16 18.28 21.87 41.50 47.44 1334
17 21.41 20.47 41.20 54.68 1155
18 25.11 22.59 37.02 48.74 1453
19 21.04 26.27 38.66 53.22 1278
20 17.99 28.22 44.18 53.17 1153
21 18.73 29.39 34.77 51.06 1225
22 18.49 26.58 37.55 50.66 1237
23 22.08 24.88 37.07 50.72 1327
24 14.28 26.27 35.80 48.24 1229
25 17.74 23.61 37.36 49.92 1205
26 20.54 26.58 35.40 53.58 1221
27 18.25 13.77 51.32 51.38 1138
28 19.01 25.62 39.54 50.13 1295
29 21.25 20.63 40.72 48.67 1392
30 21.62 22.71 36.22 48.19 1372
_____________________________________________________________________________________________
Fuente: Jay L. Devore. Probability and Statistics for Engineering and the Sciences
(2000)
(a) Obtener el modelo de regresión y validarlo acordemente, es decir, usando
diagnósticos subjetivos y después complementar la tarea usando diagnósticos
objetivos.
8.25. Treinta muestras del efluente de una planta de tratamiento se analizaron para la
8-81
medición del DBO5 y la demanda bioquímica de oxígeno (DQO). Los datos se

muestran en la tabla de abajo. Hacer lo siguiente:
(a) Calcular el promedio, s y el error estándar del DBO y del DQO. ( X DBO = 440.6,
s = 93.18, error estándar = 17.01; X DQO = 194.4, s = 45.3, error estándar = 8.27)
(b) Graficar los datos en papel de probabilidad.
(c) Determinar el DBO5 y el DQO que se excederá el 50% de las veces. (El DBO5
excederá 195 lbs/día el 50% de las veces. El DQO excederá 440 lbs/día el 50% del
tiempo)
(d) Determinar el DBO5 y el DQO que se excederá el 90% del tiempo.
Tabla mostrando las concentraciones de DQO y de DBO5. (Elaboración propia)
DQO | 494 494 528 396 532 308 350 456 440 544
(lbs/día) | 310 538 480 500 396 486 556 600 428 440
| 291 490 546 582 368 386 400 347 278 304
DBO5 | 216 200 238 164 230 116 150 190 190 248
(lbs/día) | 120 226 200 222 176 202 240 280 184 194
| 134 215 246 292 177 193 165 160 125 137
8.26. El director de la oficina de personal de una firma constructora desea saber si

la destreza, en determinado tipo de trabajo, dentro de la empresa, puede ser
pronosticada usando como pronosticadores las variables edad y experiencia de los
empleados. La tabla de abajo da la información de una muestra aleatoria de 15
empleados. (Adaptación del libro Business Statistics de Daniel et al. 1989, p. 577).
8-82

________________________________________________________________
Nivel de (y) Experiencia (x1) Edad (x2)
Destreza
15 0 21
15 0 18
21 0 22
28 1 24
30 1 25
35 1 25
40 1 26
35 2 34
30 2 25
45 2 38
50 3 44
60 3 51
45 4 39
60 4 54
50 5 55
________________________________________________________________
Fuente: Daniel et al. 1989. Business Statistics
(a) Encontrar la ecuación de regresión de los cuadrados mínimos.
(b) Computar R2y.12.
(c) Probar Ho:β1 = 0 y Ho:β2 = 0. Dejar que α = 0.05 y calcular el valor de p para
cada prueba.
(d) Computar el 95% de intervalo de confianza para β2.
(e) Dejar que x1 = 2 y x2 = 25 y calcular y.
(f) Encontrar el intervalo de 95% para y.
8.27. La capacidad de los ecologistas para identificar regiones de máxima riqueza
de las plantas podría tener un impacto sobre la preservación de la diversidad
genética. Esto es uno de los objetivos de los ecologistas quienes están preocupados
8-83
por el medio ambiente. El artículo “Prediction of Rarities from Habitat Variables:

Coastal Plain Plants on Nova Scotian Lakeshores” (Ecology, 1992, pp. 1852-1859)
usó una muestra de 37 lagos y se obtuvo la ecuación de regresión de abajo. Este
problema se sacó del libro del investigador J. L. Devore (2001).
y = 3.89 + .033x1 + .024x2 + .023x3 - .0080x4 - .13x5 - .72x6
Donde:
y = riqueza de especies de plantas
x1 = área de la cuenca
x2 = ancho de la playa
x3 = mal drenado (%)
x4 = color del agua
x5 = % de arena
x6 = alcalinidad.
El estudio reportó un coeficiente de determinación múltiple de R2 = 0.83. Realizar
una prueba de la utilidad del modelo de regresión. Sugerencia: usar la función
estadística: F = [R2/k] / [(1 - R2)/(n - (k + 1))], con región de rechazo para una
prueba de nivel de F ≥ Fα,k,n-(k+1), donde k es el número de pronosticadores usados.
Usar la tabla de la distribución F. Valorar la utilidad del modelo de acuerdo al
valor de la probabilidad p.
8.28. Este es ejercicio que involucra la selección de un modelo de regresión con 9
variables independientes o predictoras, es decir, x1, x2, x3, x4, x5, x6, x7, x8 y x9.
Basando el criterio en los diagnósticos R2, MSE y Cp (criterio de Mallow), decir
cuál modelo de regresión es el más apropiado. Esto es, seleccionando los mejores
subconjuntos posibles. Los datos se dan abajo.
8-84

________________________________________________________________
Subconjunto de predictores
1 2 3 4 5 6 7 8 9
Criterios _________________________________________________________
R2k | .354 .453 .511 .550 .562 .570 .572 .575 .575
MSEk | 2295 1948 1742 1607 1566 1541 1535 1530 1532
Cpk | 314 173 89.6 35.7 19.9 11.0 9.4 8.2 10.0
__________________________________________________________________
8.29. En un estudio de laboratorio para ver la relación entre los sólidos

suspendidos y las concentraciones de DBO se sacó una muestra con los datos que
Sólidos suspendidos| 18 7 14 31 21 5 11 16 26 29
DBO5 | 55 17 36 85 62 18 33 41 63 87
(a) Hacer una gráfica que vaya en función de la variable dependiente y de la

(b) Obtener el modelo de la ecuación de regresión y trazarla en la gráfica. (Sólidos

suspendidos Y = 0.32 + 0.352 (X)
(c) Validar el modelo de regresión objetivamente, calculando el coeficiente de
determinaron R2, s y PRESS. (R2 = 0.962, s = 0.957, s = 1.85, PRESS = 42.38)
(d) Hacer una tabla de ANOVA que incluya el valor de F y p. (Completar la tabla
de abajo.
8-85
Tabla de ANOVA. (Elaboración propia)

__________________________________________________________________
Fuente g.l. SS MS Fcalc. Ftab. Valor p
__________________________________________________________________
Debido a la 1 694.16
regresión
Error 27.44 3.43
Total 9 721.60
__________________________________________________________________
(e) Hacer un diagnóstico gráfico para validar la autenticidad del modelo de

regresión seleccionado. Sugerencia: usar el programa Minitab.
8.30. Treinta casos del efluente de una planta de tratamiento se analizaron para el
DBO y el DQO. Los datos se muestran en la tabla de abajo. Hacer los siguientes
cálculos:
DQO (lbs/Día)| 494 444 528 396 532 308 350 456 440 544 310 538
| 480 500 396 486 556 600 428 440 291 490 546 582
| 368 386 400 347 278 304
DBO (lbs/Día | 216 200 238 164 230 116 150 190 190 248 120 226
| 200 222 176 202 240 280 184 194 134 215 246 292
| 177 193 165 160 125 137
__________________________________________________________________
(a) Determinar R2 y R. (R2 = 0.9350, R = 0.967)
(b) Graficar los datos en papel de probabilidad y determinar lo siguiente:
(1) Determinar los valores de DBO y el DQO que excederán el 50% y el 90% de
(2) Determinar los valores de DBO y del DQO que se lograrán el 90% de las veces.
8-86
(3) Determinar los valores de DBO y del DQO que puedan ser excedidos el 10% de
(4) Calcular el promedio y la desviación estándar del DBO y del DQO.
(c) Evaluar el modelo de regresión aplicando enfoques subjetivistas, es decir, con
gráficas de los valores residuales en función de valores ajustados (para la prueba de
independencia), pruebas de normalidad, etc.
8.31. Este es un problema adaptado del libro Introducción al Análisis de Regresión
Lineal de los autores Montgomery, Peck y Vining (2001). Este proyecto está
relacionado con un estudio de energía solar en el Tecnológico de Georgia, Estados
Unidos. El proyecto involucra datos de pruebas de energía térmica con una
variable dependiente (y), que relaciona al flujo total de calor (Kwatts) y cinco
variables independientes que están relacionadas con la insolación (watts/m2), la
posición del foco en dirección del este (en pulgadas), la posición del foco en
dirección del sur (en pulgadas), la posición del foco en dirección norte (en
pulgadas) y la hora del día. Para esto, estimar los siguientes enunciados:
(a) Probar el modelo de regresión que mejor ajuste a los datos.
(b) Evaluar el modelo de regresión seleccionado, es decir, a través de criterios
estadísticos y complementar la decisión usando gráficos subjetivistas.
La tabla de abajo muestra la información requerida para solución todos los
enunciados requeridos por este problema.
8-87
Tabla mostrando los datos de las pruebas de energía solar térmica.

__________________________________________________________________________________
y x1 x2 x3 x4 x5
__________________________________________________________________________________
271.8 783.35 33.53 40.55 16.66 13.20
264.0 748.45 36.50 30.19 16.46 14.11
238.8 684.45 34.66 37.31 17.66 15.68
230.7 827.80 33.13 32.52 17.50 10.53
251.6 860.45 35.75 33.71 16.40 11.00
257.9 875.15 34.46 34.14 16.28 11.31
263.9 909.45 34.60 34.85 16.06 11.96
266.1 905.55 35.38 35.89 15.93 12.58
229.1 756.00 35.85 33.53 16.60 10.66
239.3 769.35 35.68 33.79 16.41 10.85
258.0 793.50 35.35 34.72 16.17 11.41
257.6 801.65 35.04 35.22 15.92 11.91
267.3 819.65 34.07 36.50 16.04 12.85
267.0 808.55 32.20 37.60 16.19 13.58
259.6 774.95 34.32 37.89 16.62 14.21
240.4 711.85 31.08 37.71 17.37 15.56
227.2 694.85 35.73 37.00 18.12 15.83
196.0 638.10 34.11 36.76 18.53 16.41
278.7 774.55 34.79 34.62 15.54 13.10
272.3 757.90 35.77 35.40 15.70 13.63
267.4 753.35 36.44 35.96 16.45 14.51
254.5 704.70 37.82 36.26 17.62 15.38
224.7 666.80 35.07 36.34 18.12 16.10
181.5 568.55 35.26 35.90 19.05 16.73
227.5 653.10 35.56 31.84 16.51 10.58
253.6 704.05 35.73 33.16 16.02 11.28
263.0 709.60 36.46 33.83 15.89 11.91
265.8 726.90 36.26 34.89 15.83 12.65
263.8 697.15 37.20 36.27 16.71 14.06
___________________________________________________________________________________________
y = Flujo total de calor (kwatts); x1 = Insolación (watts/m2); x2 = Posición del foco en dirección este (pulgadas); x3 = Posición
del foco en dirección sur (pulgadas); x4 = Posición del foco en dirección norte (pulgadas); x5 = Hora del día
Fuente: Introducción al Análisis de Regresión Lineal. Montgomery et al. 2001.
8-88
8.32. La intención de este ejercicio es la de hacer una gráfica, con la variable de

respuesta (Y) y con cuatro variables regresivas (X1, X2, X3, X4) usando el programa
Minitab. Siendo así, de la configuración de los puntos esparcidos obtenida
predecir, qué tipo de función de regresión estadística encajaría mejor en los datos.
Además, evaluar el modelo de regresión candidato o superior usando métodos
estadísticos y gráficos. Sugerencia: para hacer la gráfica pedida, usar el programa
Mintab procediendo de la siguiente manera: Irse a Graph → Draftsman Plot. Esto
lleva al recuadro de “Draftsman Plot”. Enseguida, en la ventanilla de “Y variable”
poner la variable dependiente (Y) y, en la ventanilla de “X variable” poner las
variables independientes (X).

______________________________________________________________________________
Variable de respuesta (Y) Variable regresiva X1 Variable regresiva X2 Variable regresiva X3 Variable regresiva X4
235 20 19 86 95
231 27 17 85 90
285 40 20 83 105
270 55 20 82 83
296 60 20 87 90
312 68 21 89 94
295 75 20 83 92
292 80 20 81 92
263 70 20 58 105
271 50 15 79 100
283 40 15 80 90
256 30 15 79 88
8.33. Este es un problema adaptado del texto de Jay L. Devore (2001), en el cual se
da la información requerida para la selección del modelo de regresión superior,
basado en la inclusión del número de variables regresoras, seleccionado entre
8-89
cuatro modelos candidatos. El ejemplo está relacionado con el calor acumulado del
endurecimiento del cemento tomado como la variable dependiente, en función de
los predictores x1 = % de aluminato de tricalcio, x2 = % de silicato de tricalcio, x3 =
% ferrato de aluminio y x4 = silicato de dicalcio. Se da un tamaño de muestra igual
a 13 observaciones y, donde la suma de los cuadrados del total es igual a 2,715.76.
Para esto, se pide al lector llenar los faltantes de la tabla de abajo y decidir cual es
el modelo superior que tiene el número adecuado de variables regresoras.
Tabla mostrando la información. Llenar los faltantes.
No. de regresores k Regresor (es)k SSEk R2k R2(ajustada)k Cpk F(calc.)k
1 x4 880.85 0.676 0.647 138.2
2 x1, x2 58.01 2.7
3 x1, x2, x3 0.982 0.876 3.2
4 x1, x2, x3, x4 0.982 4.0
8-90
CAPITULO 9
Regresión polinomial
Modelos polinomiales de segundo orden (k = 2) con una variable independiente.-
Modelo de polinomios de tercer orden (k = 3), con una variable independiente.-
Modelo de segundo orden (cuadrático) con interacción.- Modelo polinomial (de
segundo orden o cuadrático), con tres variables independientes con interacción.-
Evaluación de los modelos de regresión.- Prueba estadística para comparar la
suma de los cuadrados del error (SSE) de cada modelo probado, para saber cual
modelo es superior.- Modelos de regresión no lineales y de regresión logística.-
Modelos de regresión exponenciales paramétricos, con una sola variable
independiente.- Procedimientos para la identificación de valores atípicos
extremos. Diagnóstico y mitigación de multicolinealidad.- Medidas para corregir
multicolinealidad severa.- Ejemplos de problemas de regresión polinomial
usando el programa de computadora Minitab.- Autocorrelación en datos de
series de tiempo.- Heteroscedasticidad y homoscedasticidad.- Prueba de White
para el problema de heteroscedasticidad.-
La regresión polinomial es un caso especial de la regresión lineal simple o múltiple.
Hay modelos polinomiales de segundo o tercer orden. Con la regresión polinomial
existen modelos con una variable independiente, con ecuaciones cuadráticas, cúbicas
o con órdenes más altos que k = 3. También hay modelos polinomiales con dos o más
variables independientes, con ecuaciones de segundo, tercer orden, etc. Igualmente,
puede haber modelos de segundo orden o tercer orden con interacción. Sin embargo,
los modelos polinómicos que tienen tres o más variables independientes, con valores
de k > 3 son aplicaciones muy dificultosas y raras.
9-1
Dentro del tópico de regresión, también hay modelos de regresión no lineal,

como los modelos de regresión exponenciales, en los cuales los parámetros no son
lineales.
El modelo de regresión polinomial paramétrico o poblacional es:
y = βo + β1x + β2 x2 + ……… + βk xk + ε
El estimador o modelo de regresión estadístico es:
y = bo + b1x + b2 x2 + …… + bk xk + e
Modelos polinomiales de segundo orden (k = 2) con una variable independiente
El modelo polinómico de segundo orden (k = 2), con una variable independiente,
llamada función de respuesta cuadrática es:
y = βo + β1x + β11x2 + ε (9-1)
Que también se puede expresar con diferente anotación como:
y = βo + β1x + β2 x2 + ε (9-1a)
Donde:
y = variable dependiente o función de respuesta
βo = intercepto en la ordenada. Este coeficiente de regresión representa la respuesta
promedio de y, cuando x = 0
β1 = coeficiente de efecto lineal
β11 o β2 es el coeficiente de efecto cuadrático
x = variable independiente
ε = término de error o residuo
La función de respuesta para este modelo de regresión (Neter et al. 1996) es:
E{Y} = βo + β1x + β11x2 (9-1b)
Esta función es la forma básica de una parábola convexa, es decir, cuando β2 < 0. Sin
embargo, cuando β2 > 0, la parábola es cóncava. Estas situaciones se ven en la Figura
9.0(a) y en la Figura 9.0 (b). El coeficiente βo representa el intercepto en la ordenada.
9-2
Los coeficientes β1 y β2 controlan la parábola, relativo a la ordenada. Por ejemplo, si β1

= 0, la parábola es simétrica y centrada alrededor de y = 0. No obstante, si β1 y β2 tienen
el mismo signo, la parábola se desvía hacia la izquierda, pero si β1 y β2 tienen signos
opuestos, la parábola se desvía hacia la derecha. Además, el coeficiente β2 describe la
curvatura. Por otra parte, si β2 = 0, no hay curvatura. Esto se ve en la Figura 9.0(c).
Entre más grande sea el valor de β2, mayor será la tasa de curvatura. Sin embargo, entre
más pequeño sea el valor de β2, menor será la curvatura (Keller et al. 1990). Todas estas
situaciones se ven en estas gráficas.
Modelo de polinomios de tercer orden (k = 3), con una variable independiente
y = βo + β1x + β11x2 + β111x3 + ε (9-2)
Donde:
y = variable dependiente
β1 = coeficiente de efecto lineal
β11 = coeficiente de efecto cuadrático
β111 = coeficiente de efecto cúbico.
Las Figuras 9.0 (d) y (e) de abajo muestran este tipo de ecuación. Como se ve, cuando
β3 < 0, sobre el rango de x, el valor de y disminuye, pero cuando β3 > 0, el valor de y
aumenta. Sin embargo, las aplicaciones del modelo cúbico son muy pocas.
9-3
Figura 9.0. Figuras mostrando las gráficas del modelo cuadrático y cúbico. Por
ejemplo, gráfica (a) muestra el modelo de segundo orden, con β2 < 0; la gráfica (b)
muestra el modelo con β2 > 0 y con varios valores de β2. La gráfica (c) muestra los
modelos de tercer orden con β3 < 0 y, (d), con β3 > 0. (Fuente: Keller et al. 1990)
9-4
Los modelos polinomiales de poderes más altos que k = 3 deben de usarse con
precaución. Esto se debe a que, la interpretación de los coeficientes es difícil, y las
interpolaciones pueden ser peligrosas. Además, cuando hablamos de modelos con
valores de k = 4, o k = 5, el comportamiento de semejantes modelos es extraño y de
aplicaciones raras y, por lo tanto, no se discutirán aquí.
Modelo de segundo orden con más de dos variables independientes con
interacción
Antes de discutir estos modelos de regresión hay que definir el término interacción.
Interacción significa que, el efecto de x1 sobre y, es influenciado por el valor de x2, que
también significa que, el efecto de x2 sobre y, es influenciado por x1.
Para ver el efecto de interacción, supóngase que la ecuación de la línea de
regresión muestral es y = 6 + 4x1 + 5x2 – 3x1x2. Para explicar este efecto supóngase que
le demos valores a x2 de 1, 2, y 3. Al sustituir los valores de x2 = 1, 2, y 3, en la ecuación
muestral de arriba, se producen las siguientes ecuaciones: y = 5 + x1, con x2 = 1; y =
10 – 2x1 con x2 = 2 y, además, y = 15 – 5x1, con x2 = 3. Analizando estas tres ecuaciones
modificadas vemos que el intercepto y los coeficientes de x1 también varían. Aquí se ve
que el efecto de x1 sobre y es influenciado por el valor de x2. Al graficar estas tres
ecuaciones vemos que las tres líneas rectas se cruzan entre si. Esto se ve en la Figura
9.1 (b). En esta gráfica, claramente, se ve que hay interacción, es decir, cuando las
líneas rectas se cruzan entre si.
Modelo de segundo orden (cuadrático) con interacción
Si un investigador cree que en sus datos existe una relación cuadrática entre la variable
dependiente (y) y cada una de las variables independientes x1 y x2, es decir, cuando las
variables independientes interaccionan entre si (decisión que se logró después de
analizar las gráficas con tres curvas interaccionando entre si), entonces, se
9-5
debe de inclinar por el modelo de segundo orden con interacción.

El modelo polinomial con dos variables independientes con interacción se da
como:
y = βo + β1x1 + β2 x2 + β3 x21 + β4 x22 + β5 x1x2 + ε (9-3)
Este modelo, también se puede expresar con diferentes anotaciones, como las
señaladas abajo:
y = βo + β1x1 + β2 x2 + β12 x21 + β22 x22 + β12 x1x2 + ε (9-3a)
Donde:
β12 = coeficiente de efecto de interacción, donde x1 y x2 representan la interacción entre
los pronosticadores o variables independientes x1 y x2.
Aquí, nótese que, la diferencia entre la ecuaciones (9-2) y (9-3), es el último término de
la derecha, el cual denota el efecto de la interacción.
Modelo polinomial (de segundo orden o cuadrático) con tres variables
independientes sin interacción
El modelo de segundo orden con tres variables independientes, cuando estas variables
no interaccionan entre si, es:
y = βo + β1x1 + β2 x2 + β3 x3 + β11 x21 + β22 x22 + β33 x23 + ε (9-4)
Modelo polinomial (de segundo orden o cuadrático), con tres variables
independientes con interacción
El modelo de segundo orden con tres variables independientes, con interacción
(Neter et al. 1996) es:
y = βo + β1x1 + β2x2 + β3x3 + β11x21 + β22x22 + β33x23 + β12x1x2 + β13x1x3 + β23x2x3 + ε (9-5)
Donde:
y = variable dependiente o función de respuesta
9-6
β12, β13, β23 = los coeficientes del efecto de interacción entre los pares de variables
de predicción x1x2, x1x3 y x2x3 x1x2, x1x3, x2x3 representan la interacción entre las
variables independientes x1, x2, x3,x1, x2, x3 = variables independientes
En la solución de problemas relacionados con modelos de regresión lineal,
múltiple o de regresión polinomial, con una o más variables independientes es siempre
conveniente graficar los datos y examinar el diagrama esparcido. Esto se hace con el
objeto de analizar, visualmente, el diagrama esparcido y ver el tipo de curva mostrado
y, por consiguiente, el modelo de regresión o función que pueda encajar mejor en los
datos.
Figura 9.1. Gráficas mostrando modelos polinomiales de primero y segundo orden, con
dos variables independientes. La gráfica (a) muestra la ecuación y = 6 + 4x1 + 5x2.
Cuando x2 = 1, 2 y 3, las ecuaciones modificadas se ven en la gráfica en cada uno de sus
casos.
9-7
En estas figuras se ve que no hay interacción (las líneas no se cruzan, porque es un

modelo aditivo). La gráfica (b) muestra la ecuación y = 6 + 4x1 + 5x2 – 3x1x2. Cuando
x2 = 1, 2 y 3, la gráfica muestra las ecuaciones modificadas. Aquí se ve que, la ecuación
polinomial de primer orden tiene interacción. Finalmente, las gráficas (c) y (d)
muestran los modelos de regresión polinomial de segundo orden, sin interacción y, con
efecto de interacción de inferencia, respectivamente. Esto se vería después de que se
sustituyeran los valores de x2 = 1, 2 y 3 a una ecuación muestral que emulará al modelo
(9-6). (Keller et al. 1990).
Evaluación de los modelos de regresión
La regresión polinomial es un caso especial de los modelos de regresión lineal simple
y múltiple. La validación de estos modelos es análoga a la de los modelos de regresión
lineal. Sin embargo, antes de estar totalmente seguros acerca de la utilidad del modelo
de regresión seleccionado, para fines de predicción y estimación, hay que ver que el
modelo represente adecuadamente la relación entre las variables. Esto se puede hacer
a través de estadística de inferencia y de análisis de gráficos.
Para la evaluación de los modelos se puede proceder, jerárquicamente, ajustando
modelos de segundo y tercer orden, con interacción y sin interacción y, luego se
explora la posibilidad de ajustar un modelo de orden más bajo como modelos de
regresión lineal múltiple, pero, nuevamente, con interacción y sin interacción.
De cualquier manera, como se dijo antes, para evaluar los modelos de regresión
se procede explorando los criterios estadísticos, como el coeficiente de determinación
múltiple (R2), el error estándar de lo estimado (sε), el coeficiente de determinación
múltiple (R2), el criterio Cp de Mallow, PRESS (la sigla de suma de cuadrados de error
de predicción) o, los valores de t, etc. Además, se revisan los valores de VIF (factores
de varianza inflada; en donde valores grandes de VIFs indican grandes diferencias
entre los coeficientes de regresión estimados y los estandarizados), para ver posibles
9-8
problemas de colinealidad. También, se puede usar la estadística de Durbin-Watson

para revisar problemas de autocorrelación de los residuos en series de tiempo. Aquí,
para regresión múltiple, de acuerdo a la lógica del programa NCSS, ésta dice que, si
esta función está cercana a 2, no hay autocorrelación, pero si es muy diferente de 2,
entonces, si la hay. Análogamente, se pueden usar otros métodos como “Regresión por
Pasos” o “Todas las Regresiones Posibles”, que seleccionan los modelos óptimos
basándose en los criterios arriba citados, es decir, agregando y/o eliminando las
variables independientes o de respuesta.
Finalmente, todo esto se puede complementa usando un análisis subjetivo, es
decir, analizando los gráficos de los residuos estandarizados o no estandarizados, esto
es, examinando la prueba de normalidad, residuos versus valores ajustados, de los
órdenes, etc.
A. Análisis de estadística de inferencia (objetivo) para complementar la validación del
modelo
1. Cálculo del coeficiente de determinación R2. Este criterio indica, qué proporción de
la variación total en la respuesta Y se explica con el modelo ajustado. En términos
simples, esto dice que R2 indica la proporción de variación explicada por las variables
independientes x1, x2, x3, …., xk. Este coeficiente de determinación R2 ya se describió
anteriormente, es decir:
R2 = (Σxy)2 / Σx2Σy2 (9-6)
Donde: Σxy = ΣXY – ΣXΣY/n, Σx2 = ΣX 2 – (ΣX)2/n y Σy2 = ΣY 2 – (ΣY)2/n, las cuales
se definen por las ecuaciones (8-8), (8-9) y (8-10) dadas en el capítulo 8.
2. El error estándar de lo estimado:
SSE
sε = = Σ(y – y p)2/(n – 2) (9-7)
n −1 − k
Donde, SSE = Σe2i se refiere a la suma de los cuadrados del error o residuo, y p es línea
9-9
de regresión, n es el tamaño de muestra y, k, es el número de coeficientes βi probados

en el modelo de regresión polinomial. Un valor pequeño de SSE, indica un buen ajuste
del modelo. La función SSE es un diagnóstico muy importante.
3. Criterio Cp. Este diagnóstico está relacionado con el error cuadrático medio de un
valor ajustado. En general, se prefieren valores pequeños de Cp. El modelo óptimo
tiene un valor de Cp cercano a (p + 1), donde, p es el número de variables
independientes. Un Cp mayor que (p + 1) indica que el modelo de regresión contiene
variables innecesarias que puedan dar problemas de colinialidad, pero si el Cp es
menor que (p + 1), esto indica que se han omitido variables importantes.
4. Análisis de ANOVAS y pruebas de t de Estudiante para ver cual modelo de
regresión ajusta mejor los datos.
B. Análisis gráfico (subjetivo). Para hacer la evaluación, subjetivamente, de la bondad
de ajuste de los modelos usados se analizan los siguientes gráficos:
1. Prueba de normalidad. Para que exista normalidad, los residuos deberán formar una
línea recta o estar dentro de las bandas de confianza. Si no es así, la suposición de
normalidad es inválida.
2. Histogramas de residuos. Esta gráfica deberá asemejarse a una distribución normal.
3. Gráfica de residuos versus valores ajustados de Y para la prueba de independencia.
Aquí, debe haber aleatoriedad de los residuos. No debe haber tendencias crecientes o
decrecientes. Además, debe haber el mismo número de residuos positivos y negativos.
De no ser así, se violan las suposiciones del modelo.
4. Autocorrelación (valores de ε fijos). Para diagnosticar la autocorrelación en series de
tiempo, gráficar residuos vs. tiempo. Usar prueba de Durbin-Watson para ver si existe
autocorrelación de primer orden. Se mitiga haciendo transformaciones del eje Y´.
5. Análisis de gráficos para diagnosticar colinialidad (correlación o dependencia casi
lineal entre las variables de regresión). Para mitigar esto hacer transformaciones como
9-10
Y´= Log Y, Y = Y 2, Y ´= √ Y e Y ´= 1/Y.

6. Prueba de heteroscedasticidad (hetero- = desigual; -scedasticidad = esparcido) o de
residuales no uniformes (implica error de varianza de σ2ε no constante en todos los
casos, en contraste con homoscedasticidad, la cual implica error de varianza σ2ε
constante). Para diagnosticar el problema de heteroscedasticidad graficar los residuales
versus valores predecidos, Y. Análogamente, para diagnosticar este problema de
heteroscedasticidad se puede hacer aplicando las pruebas de White y de
Breusch-Pagan. Para mitigar el problema de la falta de homoscedasticidad, esto se
puede hacer por medio de transformaciones, como en el incio (5). También se puede
hacer probando otros modelos que ajusten mejor los datos.
Resumen de los modelos de regresión usados
A. Modelo de regresión lineal simple (de primer orden), con una variable
independiente
y = βo + β1x1 + ε
B. Modelo de regresión lineal múltiple, con dos variables independientes, sin
interacción
y = βo + β1x1 + β2 x2 + ε
C. Modelo de regresión lineal múltiple, con dos variables independientes, con
interacción
y = βo + β1x1 + β2 x2 + β12 x1x2 + ε
D. Modelo cuadrático, con una variable independiente
y = βo + β1x1 + β2 x22 + ε
9-11
F. Modelo cúbico, con una variable independiente

y = βo + β1x1 + β2x22 + β3x33 + ε
F. Modelo de segundo orden (cuadrático), con 2 variables independientes, sin
interacción
y = βo + β1x1 + β2 x2 + β11 x21 + β22 x22 + ε
G. Modelo cuadrático con dos variables independientes con interacción
y = βo + β1x1 + β2 x2 + β11 x21 + β22 x22 + β12 x1x2 + ε
H. Modelo de segundo orden con 3 variables independientes, sin interacción
y = βo + β1x1 + β2 x2 + β3 x3 + β11 x21 + β22 x22 + β33 x23 + ε
I. Modelo cuadrático con 3 variables independientes con interacción
y = βo + β1x1 + β2x2 + β3x3 + β11x21 + β22x22 + β33x23 + β12x1x2 + β13x1x3 + β23x2x3 + ε
Ejemplo #1. En un artículo del J. Agricultural Eng. Research, 1975 (p. 353-361) se
reportan los datos con el número de días después de la floración (x), el rendimiento de
la cosecha, en Kg./ha (y). (Devore, 2001). La tabla de abajo muestra los datos.
x | 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46
y | 2508 2518 3304 3423 3507 3190 3500 3883 3823 3646 3708 3333 3517 3241 3103 2776

(a) Hacer una gráfica que vaya en función de (y) y de los días de floración (x).
(b) Ajustar el modelo de regresión más apropiado.
(c) Hacer una relación de los cálculos de los coeficientes de la desviación estándar y de
una tabla de análisis de varianza.
(d) Estimar el valor del coeficiente de determinación múltiple R2.
(e) Hacer una prueba de hipótesis Ho:β2 = 0 versus H1:β2 ≠ 0. Hacer otra prueba más
9-12
con Ho:β1 = 0 versus H1:β1 ≠ 0.

Solución:
(a) La gráfica de abajo indica que, una función polinomial cuadrática, con β < 0, sería
la más apropiada.
Figura 9.2. Diagrama esparcido de los datos del rendimiento de la cosecha (y) y el
número de días de floración (x). (Fuente: Devore, 2001).
(b) La tabla de abajo muestra los resultados. (Elaboración propia)

___________________________________________________________________
Pronosticador Coeficiente Desviación estándar Valor de t Valor de p
___________________________________________________________________
Constante -1070.4 617.3 -1.73 0.107
β1 293.48 42.18 6.96 0.000
β2 -4.5358 0.6744 -6.73 0.000
SSE = 203.9 R2 = 0.794 R2ajustada = 0.762

___________________________________________________________________
Los niveles críticos para una prueba bilateral, con un nivel significante de α = 0.05 son:
-2.16 ≤ t[.025;13] ≤ 2.160
(c) Los resultados obtenidos de este inciso se muestran en la tabla de abajo.
9-13

_________________________________________________________________
Fuente de g.l. SS MS Fcalc. Valor de p
Variación
_________________________________________________________________
Debido a la 2 2,084,779 1,042,389 25.08 0.0000
regresión
Error 13 540,388 41,568
________________________________________________________________
Total 15 2,625,167
Conclusión: Debido a que Fcalc. = 25.08 >>> Fcrítica = 3.81, se rechaza la hipótesis nula
Ho:β2 = 0 y, por lo tanto, se inclina por la hipótesis alternativa de H1:β2 ≠ 0.
(d) La estimación del coeficiente de determinación es:
R2 = 1 – SSerror/SStotal
= 1 – 540,388/2,625,167
= 0.794
(e) Para la prueba de hipótesis nula Ho:β2 = 0 y la hipótesis alternativa H1:β2 ≠ 0,
usamos los datos de arriba. Por ejemplo, β2 = -4.5358 y la desviación estándar es de sβ2
= 0.6744. La prueba de Ho:β2 = 0 es lo mismo que decir que el modelo polinomial
cuadrático no aplica a los datos y, H1:β2 ≠ 0 dice que si aplica. La función de t usada
es:
t = β2 / sβ2 (9-8)
Sustituyendo los valores correspondientes nos da:

t = -4.5358 / 0.6744
= -6.73
La prueba está basada en n - (k + 1) grados de libertad (ν), es decir, con n = 16 y k = 2.

Por lo tanto, ν = 13. Las regiones críticas son: -2.160 ≤ t.025;13 ≤ 2.160.
En conclusión, debido a que la tcalc. = -6.73 < tcrítica = -2.160, se rechaza la hipótesis nula
9-14
de Ho:β2 = 0 y se inclina por la prueba de hipótesis alternativa de H1:β2 ≠ 0. No

obstante, si se rechaza la hipótesis nula, se dice que el modelo cuadrático si encaja bien
en los datos; de otra manera se acepta la hipótesis nula. Para hacer la prueba de
hipótesis nula de Ho:β1 = 0 versus H1:β1 ≠ 0, se procede en forma similar.
(f) Para las gráficas de los residuos estandarizados, en función de las observaciones,
estas gráficas se pueden formular usando la información dada en la tabla de abajo.
Prueba estadística para comparar la suma de los cuadrados del error (SSE) de
cada modelo probado, para saber cual modelo es superior
Los autores Keller et al. (1990) del libro Statistics for Management and Economics dan
una prueba estadística que mide las diferencias de la suma de los cuadrados del error
(SSE), para probar la superioridad de cada modelo probado. Esto se debe a que SSE
mide, qué tan bien encajan los datos en el modelo. Esta prueba se hace comparando la
suma de los cuadrados del error (SSE1) del modelo simple o abreviado y, la suma de los
cuadrados del error (SSE2) del modelo completo o complejo. Esto se hace, porque
siempre es conveniente usar modelos simples (el uso de modelos complejos no
necesariamente los hace superiores). La prueba estadística para medir la relación entre
SSE1 y SSE2 es:
(SSE1 – SSE2)/(k2 – k1)
F = ——————————— (9-9)
SSE2 / (n – k2 – 1)
Donde:
F = distribución de Fisher, con ν1 = k2 – k1 y ν2 = n – k2 – 1 grados de libertad.
Donde: n – k2 – 1 = número de grados de libertad asociados con el modelo completo.
Donde: k2 = número de coeficientes (βi) probados del modelo completo
k1 = número de coeficientes (βi) probados del modelo simple.
SSE1 = suma de los cuadrados del error del modelo simple probado
9-15
SSE2 = suma de los cuadrados del modelo completo probado

Nota: Si el ajuste del modelo completo no es significantemente mejor que el modelo
simple o abreviado, el valor de SS1 será pequeño. Por ende, la relación SS1 – SS2 será
pequeña y, por lo tanto, el valor de F será pequeño y no se podrá rechazar la hipótesis
nula. Sin embargo, si el ajuste del modelo completo es bueno, el valor de SS2 será
pequeño y la relación SS1 – SS2 será grande y, por consiguiente, el valor de F será
grande y se rechazará la hipótesis nula.
La región de rechazo para la ecuación de arriba (9-9) es dada por la siguiente función
estadística:
F > F[α;k2-k1,n-k2-1] (9-9a)
Donde:
F = el valor de la estadística F calculada
α = nivel significante de 0.05 o 0.01 de la distribución de F
k2 = número de coeficientes βi del modelo superior
k1 = número de coeficientes βi del modelo abreviado
Ejemplo #2. El libro Statistics for Management and Economics de Keller et al. (1990)
da un ejemplo, para determinar el modelo de regresión más apropiado. Para esto, se
saca una muestra de 25 áreas (casos). Cada área consiste en, aproximadamente, 5,000
viviendas. Se registra la ganancia anual total de las ventas, el ingreso promedio anual
de las viviendas y la edad promedio de los niños de este problema.
(a) Probar un modelo de regresión cuadrático, con interacción. En este caso, lo
llamaremos modelo superior o modelo completo.
(b) Después, probar un modelo de regresión cuadrático, sin interacción. El este caso, lo
llamaremos modelo abreviado.
9-16
(c) Finalmente, probar un modelo de regresión lineal múltiple, sin interacción. Este
modelo, lo llamaremos modelo lineal simple.
(d) Describir las ecuaciones de los modelos de regresión poblacionales de los incisos
(a), (b) y (c).
(e) Para decidir cual modelo es mejor, hacer una tabla con los resultados de los tres
modelos, basándose en los diagnósticos objetivistas como las estadísticas R2, R2ajustada,
s, PRESS, ANOVA, etc.
(f) Hacer una prueba de hipótesis para ver si el efecto de interacción es viable. Además,
usar la ecuación 9-9, para seleccionar el modelo de regresión más apropiado.
9-17
TABLA 9.2. Tabla mostrando los datos para este problema.

Ingreso anual Ingreso promedio Edad promedio
de ventas anual de los niños
___________________________________________________________________
Área (y) (x1) (x2)
1 1,128 23.5 10.5
2 1,005 17.6 7.2
3 1,212 26.3 7.6
4 893 16.5 5.9
5 1,073 22.3 6.6
6 1,179 26.1 6.3
7 1,109 24.3 12.1
8 1,019 20.9 14.9
9 1,228 27.1 8.9
10 812 15.6 3.4
11 1,193 25.7 10.6
12 983 30.5 6.0
13 1,281 26.5 8.6
14 1,156 25.7 11.6
15 1,032 21.8 13.7
16 856 33.6 5.8
17 978 17.9 10.3
18 1,017 18.3 5.3
19 1,091 30.1 6.3
20 1,048 29.8 5.3
21 1,192 28.5 10.4
22 1,256 27.5 8.7
23 1,215 26.8 9.5
24 1,233 24.3 8.3
25 950 17.8 6.1
__________________________________________________________________
(Fuente: Statistics for Management and Economics de Keller et al., 1990)
Solución:
9-18
Figura 9.3. Figura mostrando los resultados usando el programa Minitab de los tres
modelos probados. (Elaboración propia)
(a) Primero, se prueba el modelo de regresión polinomial cuadrático, con interacción,
es decir, el modelo completo.
The Regression Equation is:
(y) = -1135 + 173(X1) + 23.6(X2) – 3.73(X21) – 3.8(X22) + 1.97(X1X2)
Predictor Coef SE Coef T p

Constant -1134.7 319.8 -3.55 0.002
(X1) 173.24 28.19 6.15 0.000
(X2) 23.62 32.21 0.73 0.472
(X1SQR) -3.7270 0.5420 -6.88 0.000
(X2SQR) -3.8720 1.1790 -3.28 0.004
(X1X2) 1.9671 0.9424 2.09 0.051
s = 44.68 R-Sq = 90.7% R-Sq(adj) = 88.2%

PRESS = 72380.6 R-Sq(pred) = 82.18%
Source DF SS MS F p
Due to regression 5 368162 73632 36.88 0.000
Residual Error 19 37934 1097
Total 24 406096
Nota: Aquí, la región crítica de F, con α = 0.05 y con 5 y 19 grados de libertad, es 2.74.
(b) Enseguida se prueba el modelo de regresión cuadrático, sin interacción, es decir, el
modelo abreviado. El programa Minitab arroja los siguientes resultados:
(y) = -1558 + 198(X1) + 70.8(X2) – 3.98(X21) – 4.12(X22)

Constant -1558.30 267.1 -5.83 0.000
(X1) 198.07 27.62 7.17 0.000
(X2) 70.76 24.83 2.85 0.010
(X1SQR) -3.997 0.5709 -6.97 0.000
(X2SQR) -4.117 1.268 -3.25 0.004
s = 48.29 R-Sq = 88.5% R-Sq(adj) = 86.2%

PRESS = 78054 R-Sq(pred) = 80.78%
9-19
Source DF SS MS F p
Due to Regression 4 359463 89866 38.54 0.000
Total 24 406096
(c) Finalmente, se prueba el modelo de regresión lineal sin interacción, es decir, el

modelo simple. El programa Minitab arroja los siguientes resultados:
(y) = 668 + 11.4(X1) + 16.8(X2)

Constant 667.8 132.2 5.05 0.000
(X1) 11.425 4.676 2.44 0.023
(X2) 16.829 7.988 2.11 0.047
s = 111.6 R-Sq = 32.6% R-Sq(adj) = 26.4%

PRESS = 392674 R-Sq(pred) = 3.31%
Source DF SS MS F p
Due to regression 2 132253 66126 5.31 0.013
Total 24 406096
Nota: Para probar que los coeficientes son iguales, en cuanto al análisis de varianza, la
función de ANOVA prueba la longitud total de la utilidad del modelo.
(d) La descripción de los tres modelos poblacionales, a estimarse, por los modelos de
regresión estadística son:
1. El modelo cuadrático con interacción o completo es:
y = βo + β1x1 + β2 x2 + β3 x21 + β4 x22 + β5 x1x2 + ε
2. El modelo cuadrático sin interacción o abreviado es:
y = βo + β1x1 + β2 x2 + β3 x21 + β4 x22 + ε
3. El modelo de regresión lineal múltiple es:
y = βo + β1x1 + β2 x2 + ε
9-20
(e) El resumen de los resultados de los tres modelos se da en la tabla de abajo.

TABLA 9.3. Tabla mostrando los resultados de las estadísticas de los tres modelos de
regresión probados. (Elaboración propia)
Tipo de modelo R2 s PRESS R2(ajustada)
Modelo completo 90.7% 44.7 72,380.6 88.2%
Modelo abreviado 88.5% 48.3 78,054.0 86.2%
Modelo lineal simple 32.6% 111.6 392,674.0 26.4%
Al juzgar por los resultados, tal parece que los mejores modelos candidatos son el
modelo completo y el abreviado. (Para hacer una decision final usar la función (9-9).
(f) Ahora se va a inquirir si existe suficiente evidencia, para concluir que, el modelo
cuadrático, con interacción, es el modelo óptimo. Esto se debe a qué, si a los modelos
de regresión se les agregan variables innecesarias, que pudieran dar un mejoramiento
pequeño, no es recomendable. Bajo estas condiciones, la adición de variables
innecesarias conlleva a problemas de colinealidad (correlación entre las variables
regresoras). Por esta razón, es conveniente dejar el modelo de regresión, lo más simple
posible, a menos de que existan buenas razones estadísticas para agregarle variables
adicionales.
Una manera de revisar, si el efecto de interacción es necesario, se prueba β5 (el
coeficiente de interacción) haciendo una prueba de hipótesis, como sigue:
La prueba de hipótesis nula es: Ho:β5 = 0
La prueba de hipótesis alternativa es: H1:β5 ≠ 0
Con un nivel significante de α = 0.05, la región de rechazo es:
|t| > tα/2;n-k-1; > t0.05/2;25-6-1; > t.025;19; > 2.093
De la Figura 9.3, en la columna de las pruebas de t, se ve que, para el efecto de
9-21
interacción de (x1x2) el valor de T es igual a 2.09 con p = .051. Por consiguiente, debido
a que T = 2.09 es menor que la T crítica de 2.093, esto indica que, la inclusión del
término de interacción β5x1x2 no mejora al modelo completo, es decir, al incluir el
factor de interacción. Esta decisión nos lleva al modelo cuadrático, sin interacción,
como el mejor modelo para este problema.
Otra forma de comprobar lo mismo que arriba, se puede hacer usando la
ecuación (9-9). Esta estadística dada por Keller et al. (1990) está relacionada con la
suma de los cuadrados SS, la cual mide, qué tan bien encajan los datos en el modelo.
Como se dijo antes, este procedimiento consiste en comparar la suma de los cuadrados
SS1 del modelo abreviado y SS2 del modelo completo. Por ejemplo, si SS2 es
significativamente más pequeña que SS1, se concluye que el modelo completo es
superior al modelo abreviado; de otra manera, se concluiría que, el modelo completo no
sería, realmente, superior. Para tales fines se usa la estadística (9-9) y se procede a
sustituir los siguientes valores sacados de la Figura 9.3 es decir, SS1 = 46633, SS2 =
37934, k2 = 5, k1 = 4, n = 25.
La prueba de hipótesis nula es: Ho:β3 = β4 = β5 = 0. La prueba de hipótesis
alternativa es que los coeficientes de regresión no son igual a 0 o, cuando menos, uno
de los coeficientes β3, β4 y β5 no es igual a 0. Si el modelo completo (con interacción en
este caso) es mejor que el abreviado (sin interacción en esta instancia), el valor de SSE2
será más pequeño que SSE1, el valor de F será grande, y se rechazará Ho:, y se concluirá
que si hay evidencia para afirmar que el modelo completo, con interacción, es mejor
que el modelo sin interacción. Sin embargo, si el modelo completo no es
significantemente mejor que el modelo abreviado, entonces, la relación SSE1 – SSE2,
será, aproximadamente, igual a cero. Por consiguiente, el valor de F será pequeño y no
se rechazará la hipótesis nula Ho: Bajo estas condiciones se concluirá que, el modelo
abreviado (sin interacción), es mejor.
9-22
La región crítica, con α = 0.05, es usando la distribución F.

F > F[α(k2-k1),(n-k2-1)]
> F[0.05(1),(19)]
> 4.38
Ahora usando la ecuación (9-9) y sustituyendo los valores da:
(46,633 – 37,934)/(5 – 4)
F = ——————————— = 4.35
37,934/(25 – 5 – 1)
En conclusión, debido a que la Fcalc. = 4.35 < Fcrítica = 4.38, se dice que no hay evidencia
para afirmar que el modelo de regresión con interacción es superior al modelo
abreviado.
Ejemplo #3. El desarrollo de microorganismos sigue a un crecimiento exponencial
matemático. Para esto decidió usar un modelo cúbico, donde Y es el conteo de
microorganismos y X es el número de horas que han pasado. Usar el programa Minitab
para tales propósitos.
Solución:
La ecuación es: Y = -8.10 + 12.7X – 0.905(X 2) + 2.14(X 3)
s = 41.845 R2 = 0.998 R2(ajustada) = 99.8%
Fuente de variación g.l. SS MS Fcalc.
Debido a la regresión 3 12,331,818 4,110,606 1370202
Residuo (error) 13 22,760 1,751
Total 16 12,354,578
9-23
Modelos de regresión no lineales y de regresión logística

Dentro de esta categoría, hay modelos de regresión exponencial y modelos de
regresión logística. El modelo de regresión exponencial se usa en estudios relacionados
con el crecimiento de algún proceso, donde la tasa de crecimiento, a un tiempo X dado,
es proporcional a la cantidad de crecimiento que queda, a medida que el tiempo se
incrementa. Otro uso es el estudio de la relación entre la concentración de una sustancia
(y), en función del tiempo transcurrido (X). En forma análoga, los modelos de regresión
logística se usan en estudios poblacionales, para relacionar el número de especies (Y)
en función del tiempo (X). Estos modelos también se pueden usar cuando la variable
dependiente es cualitativa; sin embargo, estos modelos no se discutirán en este texto,
como en el caso de los modelos exponenciales.
Modelos de regresión exponenciales paramétricos, con una sola variable
independiente (Neter et al. 1996)
Yi = γo exp(γ1Xi) + εi (9-10)
Un modelo más generalizado de regresión exponencial no lineal es:
Yi = γo + γ1 exp(γ2Xi) + εi (9-11)
Donde:
Yi es la función de respuesta o variable dependiente
γo, γ1, γ2 = los parámetros a estimarse por a, b y c
Xi = variables constantes
εi = error o residuo normalmente distribuido y con varianza constante
El correspondiente estimador estadístico es:
y = a + b exp(-cx) + ei (9-12)
Donde:
a, b, c = estimadores estadísticos de γo,γ1 y γ2, respectivamente
ei = el error o residual estadístico.
9-24
Los modelos exponenciales se usan en ejemplos de crecimiento que va en

función del tiempo (como el crecimiento de bacterias en un plato de agar, o para
describir el crecimiento exponencial de los gases de invernadero como el CO2, en
función del tiempo, que están ocasionando el calentamiento global y la corrupción del
clima del planeta).
Con relación a los modelos de regresión logísticos, la función poblacional que
describe estos modelos se da como (Neter et al. 1996):
γo
Yi = ———————— + ε (9-13)
1 + γ1 exp(γ2Xi)
Donde:
Yi = función de respuesta
γo = parámetro a estimarse por sus estadística correspondiente
γ1 = parámetro a estimarse por su estadística
γ2 = parámetro a estimarse por sus estadística
La evaluación y estimación de los parámetros de regresión no lineal se hacen
igual que con la regresión lineal. Por ejemplo, para el diagnóstico subjetivo, se analizan
las gráficas para la prueba de normalidad, los gráficos de los residuos en función del
tiempo, y también en función de los valores ajustados, etc. Sin embargo, en la
interpretación de las gráficas de los residuales de la regresión no lineal hay que recordar
que, los residuales, no necesariamente, suman a cero. También, se pueden hacer
transformaciones de las variables para hacer un mejor ajuste del modelo superior. En
cuanto a las inferencias estadísticas, con la regresión no lineal, se basan en la teoría de
muestreo grande, esto es, con tamaños de muestras grandes. Las funciones de modelos
de regresión exponencial, también se pueden tratar dentro del
9-25
tópico de series de tiempo.

Ejemplo #4. Este es un problema sacado del libro Statistics for Management and
Economics de Keller (1990), Warrack y Bartel relacionado con el ajustamiento y
análisis de modelos de regresión no lineales relacionado con datos estadísticos del
SIDA en los Estados Unidos de Norteamérica, en función del tiempo.
Nota: Independientemente de los datos dados por el autor de este problema, a juicio del
del autor de este libro de estadística, el nombre médico convencional del acrónimo
SIDA (AIDS en las siglas del inglés, es decir, acquired inmunodeficiency síndrome)
está diciendo que el llamado SIDA es una enfermedad o una deficiencia, en particular,
del sistema inmune del cuerpo. Esto no es posible, porque el sistema inmunológico del
cuerpo es una parte dependiene de todo el organismo, como unidad independiente. Si
este término “SIDA” fuera correcto, entonces, se tendría que decir que el sistema
inmune del cuerpo es una parte independiente del resto del organismo, y no una parte
dependiente de todo el cuerpo como unidad independiente. En términos más simples,
esto significa qué, el organismo humano está compuesto por órganos, partes o sistemas
contingentes, cuya función, en turno, depende de todo el cuerpo entero, como unidad
independiente, es decir, cuando el organismo está en un estado de salud perfecto. De
acuerdo a este razonamiento, el llamado SIDA es un síntoma de enfermedad (pero no
de una enfermedad en particular), que acusa que todo el cuerpo está enfermo (toda la
unidad orgánica distorsionada por vida antinatural), no únicamente, el sistema
inmunológico, como comúnmente se cree. De manera qué, para curar los síntomas de
este mal, es necesario curar todo el complejo orgánico, a través de artes médicas
naturales. La lógica siempre aconsejará qué, para curar un efecto (síntomas del SIDA),
primero hay que atender el origen causal más recóndito, que no es otra cosa más que la
vida no natural. Al proceder de otra manera, siempre habrá complicaciones que
agravarán el problema del enfermo.
9-26
TABLA 9.5. Tabla mostrando los datos de este problema.

Años Periodo de tiempo t Número de casos de SIDA
_________________________________________________________________
1981 1 1,000
1982 2 6,000
1983 3 10,000
1984 4 14,000
1985 5 25,000
1986 6 48,000
1987 7 63,000
1988 8 108,000
1989 9 161,000
_________________________________________________________________
(Fuente: Keller et al., 1990)
(a) Hacer una gráfica con los datos y obtener la ecuación de regresión del modelo
apropiado. Poner la ecuación sobre la gráfica.
(b) Predecir el número de casos de SIDA para el año 2000 (t = 20).
Solución:
(a) Usando el programa Minitab con una función de regresión estadística de series
de tiempo y análisis de tendencia (trend analysis), da la gráfica y la ecuación
señalada abajo.
9-27
Figura 9.4. Gráfica mostrando los casos de SIDA, en función del tiempo de este
problema. (Elaboración propia)
(b) Cuando t = 20 (año 2000), el número de casos de SIDA sería:
y = (1290.84)(1.75974) 20
= 104,674,894.9
9-28
Ajustamiento de curvas
En el ajustamiento de curvas, para seleccionar el modelo que mejor encaja en los datos
se dan abajo varios tipos de curvas. Estas funciones ayudan a seleccionar la forma más
apropiada para los datos. Estos tipos de curvas son sugeridos por el programa de
computadora NCSS.
Figura 9.5. Gráficas mostrando los diferentes tipos de funciones usados en los
ajustes de curvas, para seleccionar el mejor modelo de regresión que pueda encajar
en los datos.
9-29
Figura 9.6. Gráficas mostrando los diferentes tipos de curvas usados en el ajustamiento
de modelos de regresión más apropiados.
9-30
Procedimientos para la Identificación de valores atípicos extremos. Diagnóstico

y mitigación de multicolinealidad
Los procedimientos para refinar el modelo de regresión son la identificación y
eliminación de valores inusuales extremos. En algunas ocasiones, estos valores
extremos se encuentran en la generación de datos muestrales. Estos valores extremos se
refieren a datos univariados que son inconsistentes con el resto de la información. Los
valores extremos ocurren a menudo debido a errores de medición, ya sea por mal
funcionamiento del equipo o por negligencia del personal, falta de mantenimiento de
los instrumentos, etc. En regresión múltiple, los valores extremos pueden ocurrir con
las variables independientes y con la variable dependiente. Estos valores, una vez
analizados se pueden eliminar o retener, si se sabe que son, en realidad, valores
extremos. Siendo así, es necesario eliminarlos, porque pueden distorsionar el modelo
de regresión ajustado o causar serios errores en los cálculos de regresión.
La identificación de valores extremos se puede hacer de las siguientes maneras:
1. Usando gráficas de tallo y hoja.
2. Usando gráficas de caja.
3. Usando gráficos de probabilidad normal.
4. Usando la estadística DFITS que identifica valores extremos potenciales, cuando
DFITS > 2 p / n , donde p es el número de variables independientes y, n, es el tamaño
de la muestra.
5. Usando gráficos de residuos semiestudentizados, los cuales identifican los valores
extremos, cuando los valores absolutos de los residuales semiestudentizados son ≥ 4.
6. Usando DFBETAS cuando estos valores son ≥ ±2/ n .
7. Usando los gráficos de Rstudent vs. Hat Diagonal.
8. Usando regresión robusta (robust regression) recomendados por la lógica del
9-31
programa NCSS.
9. También se puede hacer usando el valor crítico de Bonferroni, que identifica los
valores absolutos de los residuales estudentizados. Esta prueba citada por Neter et al.
(1996) se da como t(1 – α/2n;n – p – 1).
10. También se hace con la estadística Cook´s Distance (lógica del programa NCSS), la
cual dice que, si ésta es mayor que F(.50,p,n-p), donde F es un valor de la distribución F,
entonces, esto sugiere un valor extremo.
11. Los valores extremos también se pueden identificar con los gráficos de los residuos
que van en función de X o de Y.
Diagnóstico de multicolinealidad
En regresión múltiple hay lo que se llama colinealidad, multicolinealidad o
intercorrelación. Esta situación existe cuando las variables independientes están
correlacionadas entre si. Lo ideal en regresión múltiple es de que las variables
independientes x1, x2,…, xkn no estén correlacionadas, de tal manera que, cada una
explique un porcentaje separado de la variación en la variable dependiente.
El mal efecto de multicolinealidad es que las desviaciones estándar de los
coeficientes del modelo de regresión están sobreestimadas. Como resultado de esto,
cuando se hacen las pruebas de hipótesis, la estadística t es más pequeña de lo que
debería ser. Además, algunas variables independientes o exógenas aparecen como si no
estuvieran relacionadas linealmente con la variable Y, cuando en realidad si lo están.
Existen dos métodos para descubrir la multicolinealidad, es decir, métodos
informales y métodos formales. Los métodos informales para detectar colinealidad
severa son:
1. Estudios de los signos algebraicos de los coeficientes del modelo de regresión. Si
hay colinealidad, los signos algebraicos de los coeficientes son opuestos, a lo que se
debería esperar de consideraciones teóricas o de experiencia a posteriori.
9-32
2. Otra situación que pudiera indicar multicolinealidad es el hecho de que ocurren

grandes cambios en los coeficientes estimados de regresión, cuando una variable
explicativa o independiente se agrega o se elimina.
3. Cuando se hacen pruebas de hipótesis de Ho:β´s = 0, las pruebas de t no son
significantes. Esta condición también pudiera indicar colinealidad.
4. Cuando hay grandes correlaciones entre pares de variables independientes, esta
situación también indica multicolinealidad.
5. Con la lógica del modelo de computadora NCSS, con números de los Eigenvalues
mayores que 1000, esta condición indica colinealidad severa. Sin embargo, con valores
de Eigenvalues entre 100 y 1000, esta condición implica colinealidad moderada a
fuerte.
6. Nuevamente, con la lógica del programa NCSS, en la sección de correlación de
matrices, grandes correlaciones entre las variables explicativas conllevan diagnósticos
de colinealidad.
7. Los valores extremos, también pueden causar problemas de colinealidad.
Por otra parte, los métodos formales para detectar multicolinealidad son los
factores de inflación de varianza (Variance Inflation Factors, VIF). En este contexto, el
problema de multicolinealidad se considera severo, cuando el máximo valor de VIP es
mayor que 10 o bien, cuando el promedio de los VIF´s es considerablemente > 1.
(Pfaffenberger, 1987).
En cuanto a situaciones relacionadas con la multicolinealidad se enlistan los
siguientes postulados:
1. Si el modelo se va a usar, únicamente, para estimar respuestas promedio o para hacer
predicciones de los valores de la variable dependiente Y, y las predicciones son
9-33
hechas, solamente, sobre las región de los valores de las variables independientes y, los
coeficientes de regresión estimados no se usarán para propósitos de interpretación,
concerniendo las relaciones de las variables explicativas (X´s) y de la variable de
respuesta (Y), entonces, la multicolinealidad, aun cuando sea severa, no será un
problema (Pfaffenberger, 1987). Aquí, sin embargo, la determinación de la región
muestreada es difícil. Por ejemplo, si hay una variable independiente, entonces, la
región es un intervalo sobre la línea real entre el valor mínimo de x y el valor máximo
de x en la muestra. Además, con cuatro variables independientes, la región muestreada
es en el espacio de cuatro dimensiones de las x´s y sus linderos no son obvios. Por lo
tanto, bajo estas condiciones, hay que ejercer precaución, de tal manera que, la
predicción no represente una extrapolación más allá de la región muestreada de las x´s,
cuando existe multicolinealidad severa. Por otra parte, si se desea hacer
interpretaciones de los coeficientes de correlación (bi), entonces la multicolinealidad no
se puede tolerar.
2. El hecho de que algunos o todas las variables independientes estén correlacionadas
entre si, en general, no obstruye la habilidad para obtener un buen ajuste de los datos.
Esta situación tampoco interfiere en las inferencias acerca de las respuestas promedio
de predicciones de nuevas observaciones, siempre y cuando, estas inferencias sean
hechas dentro de la región de las observaciones.
3. Cuando las variables independientes están altamente correlacionadas, los
coeficientes de regresión estimados tienden a tener una gran variación de muestreo. Por
lo tanto, bajo estas condiciones, los coeficientes de regresión tienden a variar
ampliamente de una muestra a otra. Como resultado de esto, solamente, se obtiene
información imprecisa acerca de los coeficientes individuales.
4. Cuando hay multicolinealidad, la interpretación de un coeficiente de regresión,
9-34
como medida de un cambio en el valor esperado en Y, cuando una variable

independiente, digamos X1 se incrementa por una unidad, manteniendo constantes las
demás variables, no es totalmente aplicable.
5. Otros efectos causados por la multicolinealidad están relacionados con la suma de
los cuadrados, los efectos en los coeficientes de determinación parcial, efectos en el
error estándar de lo estimado s, efectos sobre los valores ajustados, efectos en las
pruebas simultáneas de los coeficientes β´s, etc. (Neter et al. 1996).
Medidas para corregir multicolinealidad severa
1. El método más obvio para remediar la multicolinealidad es el de no incluir en el
modelo las variables independientes que están altamente correlacionadas. Esto se hace
para reducir los errores estándar de los coeficientes de regresión estimados de las
variables independientes que queden en el modelo. Sin embargo, este remedio tiene
dos limitaciones porque, de esta manera, ya no habrá información directa de la variable
independiente excluida. En segundo lugar, las magnitudes de los coeficientes de
regresión, para los coeficientes restantes son afectadas por las variables independientes
correlacionadas, que no se incluyan en el modelo.
2. Otro método para corregir la multicolinealidad se refiere como regresión de cima
(ridge regression). Siendo así, cuando hay multicolinealidad, los estimados de los
cuadrados mínimos son imparciales, pero sus varianzas son grandes, de tal manera que
puedan estar alejados del valor verdadero. Agregando un grado de parcialidad a los
estimados de la regresión, la regresión de cima (o ridge regression) reduce los errores
estándares, de tal manera que el efecto neto dará coeficientes estimadores más
confiables (Neter et al. 1996).
3. Otro método para reducir la multicolinealidad severa es la regresión por pasos. La
regresión por pasos incluye, solamente, las variables independientes que están
9-35
significantemente relacionadas linealmente, con la variable dependiente. Esto tiende a

reducir la colinealidad porque, si hay dos variables independientes, altamente
correlacionadas entre si, al incluir una, usualmente se elimina la segunda. En el
mecanismo, en la regresión por pasos, una variable independiente, a un tiempo, es
incluida en la ecuación. En el paso 1, la variable independiente, más fuertemente
relacionada con la variable dependiente, es incluida en el modelo. En el paso 2, la
siguiente variable independiente (entre las variables independientes restantes) más
fuertemente relacionada con la variable dependiente, se incluyen en el modelo. Esta
situación continúa hasta qué, solamente, las variables independientes, que no están
relacionadas con la variable dependiente (dado que las otras variables ya están en el
modelo) permanecen fuera de la ecuación. De cualquier manera, para evitar problemas,
la regresión por pasos debe usarse en conjunción con un profundo razonamiento
estadístico.
La pregunta de cuantas variables independientes (incluyendo las variables
transformadas) deben de incluirse en el modelo de regresión es el tema a tratar, cuando
se habla de los procedimientos usados en el programa Minitab, como “Todas las
Regresiones Posibles” (All Possible Regressions), “Regresión por Pasos” (Stepwise
Regression) y “Regresión de los Mejores Conjuntos” (Best Subset Regression).
Para encontrar el número ideal de variables independientes, esto involucra dos
objetivos opuestos. Primero se desea que el modelo de regresión sea lo más completo
y realista posible. Esto dice que se debe incluir cada variable independiente, aunque
parezca remotamente relacionada con la variable dependiente. En segundo término, se
debe de incluir lo menos posible de variables independientes. Esto se debe a que, cada
variable independiente, que no sea relevante al modelo, disminuye la precisión
9-36
de los coeficientes calculados y de los valores pronosticados. De esta manera, la

finalidad de la selección de las variables es parsimoniosa, esto quiere decir que debe
haber un balance entre lo simple (lo menos posible de variables) y el ajuste (la inclusión
de todas las variables que sean pertinentes).
Hay diferentes estrategias para la selección de las variables más apropiadas para
el modelo de regresión. Por ejemplo el modelo NCSS recomienda que, si no hay más
de quince candidatos de variables independientes (sin incluir el intercepto), entonces,
se debe usar el procedimiento de “Todas las Regresiones Posibles” (All Possible
Regressions). Esto se debe a que este procedimiento dará modelos tan buenos o
mejores que el procedimiento de “Regresión por Pasos”. Sin embargo, si hay más de
quince candidatos de variables, entonces, se recomienda el procedimiento de
“Regresión por Pasos” (Stepwise Regression). Otra función dada por el programa
Minitab está relacionada con la “Regresión de Mejores Conjuntos” (Best Subsets
Regression).
Después de que se haya formado un conjunto de candidatos de variables
independientes (una vez que se eliminaron las observaciones extremas y se mitigó la
multicolinealidad), la siguiente tarea es la de establecer una base para comparar dos
modelos finalistas. ¿Cómo se puede decir, si el modelo A es mejor que el modelo B?
Para hacer esta decisión crítica el consenso de investigadores de estadística está basado
en las funciones estadísticas citadas anteriormente, como R2, s, PRESS, etc. Como ya
se explicó anteriormente, estas funciones son:
(a) El coeficiente de determinación R2
(b) El error estándar estimado s
(c) El criterio Cp de Mallow
(d) PRESS
Otros criterios son los valores de t, tablas de ANOVA, análisis de gráficos, etc., pero
9-37
los penúltimos cuatro diagnósticos son los más populares.

Ejemplos de problemas de regresión polinomial usando el programa de
computadora Minitab
Ejemplo #15. Este problema está relacionado con un experimento del consumo de
gasolina usando la velocidad baja (overdrive) de una camioneta liviana. Aquí la
variable independiente es la velocidad constante dada, en millas por hora (X). Además,
la variable dependiente (Y), está relacionada con las millas por galón obtenidas bajo
estas condiciones de manejo. Hacer los siguientes cálculos:
(b) Ajustar un modelo cuadrático.
(c) Ajustar un modelo cúbico.
(d) Complementar el diagnóstico del inciso (d) con los análisis de los gráficos
subjetivos para el modelo superior.
(f) De acuerdo a los análisis de los criterios objetivitas y subjetivistas, decidir cual de
los dos modelos es superior.
TABLA 9.6. Tabla mostrando los valores originales y los valores del cuadrado y del
cubo de los valores de X. (Elaboración propia)
Nota: para hacer esta tabla cuadrar y cubicar los valores de X antes de ponerlos en las
columnas. Después de esto, se corre el programa como si fuera una regresión lineal.
9-38
Solución:
(a) La figura de abajo muestra la gráfica de los datos.
Grafica mostrando la relacion entre el tipo de manejo y el consumo de gasolina
40
Millas por galon (y)
30
20
40 50 60
Velocidad constante (x)
Figura 9.7. Figura mostrando el rendimiento de gasolina en función del tipo de manejo.
(b) Los resultados asumiendo un modelo cuadrático son:
y = -183 + 8.98(X) – 0.0911(X2)
Con s = 1.727, R2 = 0.947, PRESS = 49.26
TABLA 9.7. Tabla de ANOVA para el ajuste de un modelo cuadrático. (Elaboración
propia)
Fuente de variación g.l. SS MS Fcalc. Valor p
Debido a la regresión 2 483.17 241.58 81.0 0.000
Error o residual 9 26.83 2.98
Total 11 510.00
9-39
TABLA 9.8. Tabla mostrando los coeficientes, los errores estándares de los
coeficientes, los valores de t y de p para el modelo cuadrático. (Elaboración propia)
Predictores Coeficientes Error estándar Valor t Valor p

de coeficientes
Constante -182.58 17.68 -10.33 0.000
X1 8.98 0.76 11.80 0.000
XSQR -0.09 0.008 -11.39 0.000
(c) La ecuación de un modelo de regresión cúbico ajustado es:

y = -74 + 1.85(X) + 1.85 + 0.062(X 2) – 0.001(X 3)
Los diagnósticos estadísticos son:
R2 = 0.952, s = 1.75, PRESS = 59.22
TABLA 9.9. Tabla de para el modelo cúbico. (Elaboración propia)
Fuente de variación g.l. SS MS Fcalc. Valor de p
Debido a la regresión 3 485.50 161.83 52.85 0.000
Error o residual 8 24.50 3.06
Total 11 510.00
TABLA 9.10. Tabla mostrando los coeficientes, los errores estándares de los
coeficientes, los valores de t y de p para el modelo cúbico. (Elaboración propia)
Predictores Coeficientes Error estándar Valor t Valor p
de coeficientes
Constante -73.9 125.7 -0.59 0.57
X1 1.85 8.2 0.23 0.83
XSQR 0.06 17.5 0.35 0.73
XCUBE -0.001 0.001 -0.87 0.41
La figura de abajo muestra los residuos estandarizados en función del orden de la

observación para el modelo de regresión cuadrático
9-40

(response is Millas p)
1
-1
-2
2 4 6 8 10 12
Observation Order
Figura 9.8. Residuos estandarizados en función del orden de la observación para el

modelo de regresión cuadrático. Aquí, nótese que existen aproximadamente, el mismo
número de residuos positivos y negativos. En contraste, la gráfica del modelo cúbico
(que no se muestra aquí), no muestra el mismo número de residuos positivos y
negativos. (Elaboración propia)
1
-1
-2
20 30 40
Fitted Value
Figura 9.9. Gráfica de los residuos estandarizados versus los valores ajustados de Y
para el modelo cúbico. Nótese que, en esta gráfica hay el mismo número de valores
positivos y negativos. En contraste, el modelo cúbico ajustado (no mostrado aquí) no
muestra el mismo número de residuos positivos y negativos. (Elaboración propia).
9-41

1
Normal Score
-1
-2
-2 -1 0 1
Figura 9.10. Gráfica mostrando la prueba de normalidad para el modelo cuadrático.

(d) De acuerdo a los datos tabulados de abajo, y de los diagnósticos gráficos, tal parece
que el mejor modelo es el modelo cuadrático. Esto se debe a que, a pesar de que los
valores de R2 y s de los dos modelos son parecidos, los valores de PRESS difieren uno
del otro. Además, los valores de t del modelo cuadrático son muy significantes en
comparación con los del modelo cúbico (TABLAS 9.8 y 9.10). También la Figura 9.7
de Y versus X sugiere a una función cuadrática; no cúbica. Finalmente, los análisis de
los gráficos de los residuales para la función cuadrática son más convincentes que los
del modelo cúbico.
__________________________________________________________________
Diagnósticos estadísticos
_________________________________________
Clase de Modelo R2 s PRESS
__________________________________________________________________
Modelo cuadrático 0.947 1.727 49.26
__________________________________________________________________
Modelo cúbico 0.952 1.750 59.22
9-42
Ejemplo #16. Se obtiene una muestra aleatoria de 25 mediciones de partículas

atmosféricas (en micras). Se desea saber si hay valores inusuales extremos o
moderados. Usar un diagrama de caja.
Tabla 9.14. Tabla mostrando los datos (Elaboración propia)

5 8 14 74 85 88 90 92 92 93 94 94 95 95 96 96 96 97 97 98 99 101 104 106 114
Solución:
Antes de comenzar, vamos a tomar en cuenta la definición que dice como calcular el
cuarto inferior y el cuarto superior de un diagrama de caja. Esta definición dice que,
una vez que se ordenan los datos en forma ascendente, el cuarto inferior y el cuarto
superior se definen como:
Cuarto = Mediana de los mínimos n/2 casos, cuando n es par
inferior Mediana de los mínimos (n + 1)/2 casos, cuando n es impar
Cuarto = Mediana de los máximos n/2 casos, cuando n es par
superior Mediana de los máximos (n + 1)/2 casos, cuando n es impar
El investigador Devore (2001) enlista los valores atípicos usando un diagrama
de caja. Estos datos son: El valor mínimo y el valor máximo, el cuarto inferior y el
cuarto superior, la mediana, la cuarta dispersión fs (la cual es la diferencia entre el
cuarto superior y el cuarto inferior).
Además, para identificar la presencia de valores inusuales moderados y
extremos se dice que, toda observación mayor que 1.5fs, del cuarto más cercano, es un
valor inusual. Análogamente, si 3fs es mayor que el cuarto más cercano, entonces, el
valor inusual es extremo.
Los cálculos para este problema son:
9-43
X = 95.0, n = 25, valor mínimo = 5.0, valor máximo = 114.0, X = 84.92, s = 29.55,
error estándar del promedio = 5.91, Q1 = 89.0, Q3 = 97.5
Cuarto inferior para observaciones impares = mediana de los mínimos (25 + 1)/2 = 13
Cuarta dispersión fs = cuarto superior – cuarto inferior
= 97 - 90 = 7
Además, 1.5fs = (1.5)(7) = 10.5 y 3fs = (3)(7) = 21
Para estimar los valores atípicos inusuales, el criterio es: cualquier observación
menor que el cuarto inferior, menos 1.5fs o mayor que el cuarto superior más 1.5fs es un
valor atípico inusual. Esto es: 90 – 10.5 = 79.5 y 97 + 10.5 = 107.5
Analizando los datos de la TABLA 9.14, se ve que hay un valor atípico (114)
mayor en el extremo superior de la muestra. Además hay cuatro valores, de este tipo (5,
8, 14, 74), en el extremo inferior. Para identificar los valores extremos se calcula la
diferencia entre el cuarto inferior y 3fs, es decir, 90 – 21 = 69. Refiriéndose a la TABLA
9.14 y la Figura 9.11, vemos que las tres observaciones 5, 8 y 14 son valores extremos
(que se eliminarán) y los valores 85 y 114 son valores atípicos moderados.
Boxplot of C1
0 50 100
C1
Figura 9.11. Diagrama de caja con los 3 valores atípicos extremos (5, 8, 14) y los
valores atípicos moderados (85, 114). (Elaboración propia)
9-44
Ejemplo #17. Este ejemplo está encaminado a analizar el efecto que pueda ocurrir en el
modelo de regresión estimado, cuando se eliminan valores extremos. Para los datos de
la tabla de abajo, asumir un modelo polinomial cúbico. En la primera instancia, estimar
el modelo cúbico incluyendo todas las variables. Enseguida, ajustar un modelo de
regresión polinomial, como el anterior, pero esta vez excluyendo los valores extremos
(5, 8 y 14) estimados en el ejemplo anterior. Analizar en cada caso, los valores de R2,
R2ajustada, el error estándar de lo estimado s, PRESS (la sigla de suma de cuadrados de
predicción), ANOVA, etc. Ver si hay diferencias significantes en cada uno de los dos
casos. Hacer una tabla con los dos modelos de regresión que incluya las estadísticas
anteriores, correspondientes a cada uno de los dos modelos probados, bajo las dos
condiciones.
TABLA 9.15. Tabla mostrando los datos de mediciones (micras) de partículas

atmosféricas de la variable dependiente, en función de sus respectivos casos (X).
6 8 14 85 88 90 92 92 93 94 94 95 95 96 96 96 97 97 98 99 101 104 106 114
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
El esquema mostrando los resultados del Minitab, en el ajustamiento de un modelo de

regresión polinomial cúbico, el cual incluye todos los datos y, otro ajustamiento más,
de un modelo de regresión polinomial cúbico, el cual excluye los valores extremos se
da en la TABLA 9.16. Como se ve en esta tabla, primeramente, se ajusta un modelo de
regresión polinomial cúbico: (Y) versus (X), (XSQR), (XCUBE). Este modelo incluye
los valores extremos. Después se incluye otro modelo de regresión polinomial que no
incluye los valores inusuales extremos. Los resultados obtenidos usando el programa
Minitab se dan en la TABLA 9.16 de abajo.
9-45
9-46
TABLA 9.16. Tabla mostrando los resultados del Minitab.

The regression equation is:
(Y) = -26.4 + 27.1(X) – 1.86 (X2) + 0.0403 (X3)
Predictor Coef SECoef T p VIF

Constant -26.434 8.891 -2.97 0.007
(X) 27.079 2.904 9.33 0.000 121.7
(XSQR) -1.8595 0.2568 -7.24 0.000 682.9
(XCUBE) 0.0403 0.0065 6.20 0.000 259.3
s = 9.491 R-Sq = 91.0% R-Sq(adj) = 89.7%

PRESS = 2749.98 R-Sq(pred) = 86.88%
Source of variation DF SS MS F p
Due to Regression 3 19072.1 6357.4 70.57 0.000
Total 24 20963.8
Durbin-Watson statistic = 1.40 (measures autocorrelation for time series)
Ajustando un Modelo de Regresión Polinomial Cúbico: (Y) versus (X), (XSQR),

(XCUBE). Este modelo no incluye los valores inusuales extremos.
(Y) = 71.8 + 6.21 (X) – 0.540 (X2) + 0.0155 (X3)
Predictor Coef SE Coef T p VIF

Constant 71.819 1.514 47.42 0.000
(X) 6.2092 0.5576 11.14 0.000 125.3
(XSQR) -0.5400 0.0557 -9.70 0.000 700.9
(XCUBE) 0.0155 0.0016 9.75 0.000 265.1
s = 1.482 R-Sq = 96.9% R-Sq(adj) = 96.4%

PRESS = 105.104 R-Sq(pred) = 91.74%
Source of Variation DF SS MS F p
Due to Regression 3 1232.81 410.94 187.00 0.000
Total 21 1272.36
9-47
TABLA 9.17. Tabla mostrando el resumen de los resultados de los dos modelos
probados, es decir, con y sin los valores extremos. (Elaboración propia)
Tipo de modelo R2 R2ajustada s PRESS
Modelo con valores extremos 91.0% 89.7% 9.491 2749.98
Modelo sin valores extremos 96.9% 96.5% 1.482 105.10
Analizando la tabla de arriba se nota claramente qué, si hubo un mejoramiento

significativo en la obtención de los modelos de regresión, cuando se eliminaron los
valores inusuales extremos. Por ejemplo, el error estándar de lo estimado s, disminuyó
considerablemente, al excluir los valores extremos, es decir, de 9.49 a 1.482. Situación
similar ocurrió con la predicción de la suma de los cuadrados PRESS, la cual
disminuyó de 2749.98 a 105.10. En cuanto el coeficiente de determinación R2, este
valor aumentó de 91% a 96.9%, es decir, al excluir los valores extremos. Igualmente,
el valor de F de la tabla de ANOVA, que mide la longitud total aumentó
considerablemente, al excluir los valores extremos. Todos estos diagnósticos
estadísticos, aunados a los gráficos de los residuales estandarizados (que no se
muestran aquí, pero que el estudiante debe analizarlos), indican que la exclusión de los
valores inusuales extremos, en el modelo de regresión, si lo mejoraron
significantemente.
Autocorrelación en datos de series de tiempo
En los modelos básicos de regresión se asume que los términos de los errores aleatorios
εi son variables aleatorias sin correlacionar o variables aleatorias normales
independientes (no autocorrelación). Sin embargo, para series de tiempo, la suposición
de errores sin correlacionar (valores de ε independientes) no es aplicable, porque los
términos de los errores εi están positivamente correlacionados sobre el tiempo. Bajo
9-48
semejantes condiciones, los errores aleatorios εi se dice que están autocorrelacionados

o serialmente correlacionados (autocorrelación). La causa primordial de obtener
errores aleatorios positivamente autocorrelacionados se debe a la omisión de variables
claves del modelo (Neter et al. 1996). Comúnmente, cuando los datos están agrupados
secuencialmente sobre un periodo de tiempo es decir, en series de tiempo, los valores
residuales están correlacionados.
Por ejemplo, las figuras 9.12 y 9.13 muestran gráficas de los residuales, en
función del tiempo, los cuales exhiben autocorrelación, mientras que la gráfica de la
Figura 9.14 indica independencia de los residuales.
Las maneras de detectar problemas de autocorrelación de primer orden, una
condición que implica una correlación entre los residuos et y et - 1, donde t es el periodo
de tiempo, son usando la estadística Durbin-Watson. Matemáticamente, esta ecuación
se define como:
n
Σ (et – et-1)2
t=2
D = ───────── (9-14)
n
Σ e2t
t=1
Donde:
D es la estadística de Durbin-Watson
et y et-1 relación entre los residuos sobre el periodo de tiempo
n es el número de casos
En general, a menos que las observaciones sean de series de tiempo, la
estadística de Durbin-Watson debería ser ignorada, porque esta estadística da una
prueba de autocorrelación positiva o negativa, solamente, para series de tiempo.
9-49
Cuando se están aplicando series de tiempo y existen problemas de autocorrelación

pueden existir un número de importantes consecuencias. Por ejemplo, coeficientes de
regresion pueden ser ineficientes, el MSE seriamente subestimará los errores de la
varianza, el s{bk} calculado por la función de los cuadrados mínimos seriamente
subestimará la desviación estándar y los coeficientes de regresión, etc. (Neter et al.
1996). Las medidas para mitigar problemas de autocorrelación son los de agregar una
o más variables predictoras al modelo de regresión o de usar variables transformadas
(Neter et al. 1996).
Figura 9.12. Gráfica de valores residuales versus tiempo mostrando patrones de

autocorrelación (falta de independencia).
Figura 9.13. Gráfica de valores residuales versus tiempo indicando autocorrelación

(falta de independencia).
9-50
Figura 9.14. Gráfica de valores residuales versus tiempo indicando independencia de

los datos.
En aplicaciones en la economía y negocios, debido a que estas estimaciones

tienden a mostrar correlación de serie parcial, se pueden usar pruebas de hipótesis
como:
Ho:ρ = 0 (No hay autocorrelación o independencia) (9-15)
Ha:ρ > 0 (autocorrelación) (9-16)
La prueba consiste en determinar si el parámetro de autocorrelación ρ es igual a
cero o es mayor que cero. Por ejemplo, si ρ = 0 los términos del error εt son
independientes debido a que los términos ut son independientes. No obstante, los
valores críticos son difíciles de obtener, pero la prueba de Durbin-Watson ha obtenido
los linderos superiores e inferiores dU y dL de tal manera que, un valor de D fuera de
estos linderos lleva a una decisión definitiva.
De esta manera, Neter et al. (1996), da la regla de decisión para probar entre
estas alternativas, esto es:
Si D > dU, se concluye Ho: (9-17)
Si D < dL se concluye Ha: (9-18)
Si dL ≤ D ≤ dU, la prueba es inconclusa (9-19)
Valores pequeños de D conllevan a la conclusión de que la prueba de hipotesis de Ha:ρ
9-51
> 0, porque los errores aleatorios adyacentes εt y εt-1 tienden a ser de la misma
magnitud cuando están positivamente autocorrelacionados. Por lo tanto, la diferencia
en los resultados εt - εt-1 tienden a ser menores cuando ρ > 0, lo cual lleva a un
numerador pequeño en la función de D y, por lo tanto, a una prueba estadística de D
pequeña.
Las tablas de abajo muestran las pruebas de los linderos de Durbin-Watson, para
un nivel de significancia de α = 0.05 y 0.01. Como se ve, la columna de la izquierda
señala los valores de n. Las siguientes columnas dan los valores para cada k con sus
correspondientes linderos. Siendo así, las tablas de abajo muestran las pruebas de los
linderos de Durbin-Watson para los niveles significancia de α = 0.05 y α = 0.01.
9-52
Tabla 9.19. Tabla mostrando las pruebas de los linderos de Durbin-Watson para un
nivel de significancia de α = 0.05.
Fuente: Keller, G, Brian Warrack, Henry Bartel. Statistics for Management and
Economics (1990).
9-53
Tabla 9.20. Tabla mostrando las pruebas de los linderos de Durbin-Watson para un
nivel de significancia de α = 0.01 (continuación).
Fuente: Keller, G, Brian Warrack, Henry Bartel. Statistics for Management and
Economics (1990).
9-54
Ejemplo #18. Se dan los siguientes datos adaptados del libro Applied Linear Regresión
Models de Neter et al. (1996):
(et – et-1)2 = 0.09794, e2t = 0.1333018 con una tamaño de muestra de n = 20. Probar las
hipótesis (de autocorrelación positiva) señaladas abajo usando niveles de significancia
de 0.05 y 0.01:
Ho:ρ = 0
Ha:ρ > 0
Solución:
Usando la ecuación (9-14) y sustituyendo da:
20
Σ (et – et-1)2
t=2
0.09794
D = ───────── = ──────── = 0.735
20 0.13330
2
Σe t
t=1
Usando la Tabla 9.19 con α = 0.05, n = 20 y con p – 1 = 1 (porque X = 1, es decir, con

una sola variable independiente), da: dL = 1.20 y dU = 1.41. Debido a que D = .735 es
pequeño y cae debajo de 1.41, se dice que D < dL y se concluye que ρ > 0 o sea Ha: es
decir que hay autocorrelación o falta de independencia, o que los términos de error εt
están positivamente autocorrelacionados. Cosa similar ocurre si se usa un nivel de α =
0.01.
Nota: Si se hace una prueba de autocorrelación negativa, la estadística usada es 4 – D,
donde D se da en las ecuaciones de arriba. Si es así, entonces, la prueba se conduce de
la misma manera que para la autocorrelación postiva. Esto quiere decir que si la
cantidad 4 – D cae debajo de dL, se concluye ρ < 0. Además, si se usa una prueba
bilateral para Ho:ρ = 0 versus Ha:ρ ≠ 0 se hace usando separadamente las pruebas
9-55
unilaterales. (Neter et al. 1996).

Heteroscedasticidad y homoscedasticidad
Esta sección dará una definición de lo que se denominan heteroscedasticidad y
homoscedasticidad. Por ejemplo, cuando la varianza del error, ε(σ2ε), no es constante,
esta condición se llama heteroscedasticidad. En contraste, cuando la varianza del error,
ε(σ2ε), es constante, esta condición se llama homoscedasticidad.
El método más comun para diagnosticar el problema de heteroscedasticidad es
graficando los residuales contra los valores pronosticados de y. Siendo así, se analiza el
esparcimiento de los puntos graficados. Por ejemplo la Figura 9.15 describe los
residuales mostrando heteroscedasticidad, es decir, cuando el error σ2ε no es constante.
Como resultado de esto, si existen cambios sistemáticos de los residuales con las
funciones de las variables independientes. Esta condición se prueba analizando la
Figura 9.15 porque el error σ2ε aparece pequeño cuando el valor pronosticado de y es
pequeño y grande cuando el valor de y es grande. En contraste, la Figura 9.16 muestra
una condicion de homoscedasticidad, es decir, de σ2ε constante. Como resultado de
esto, no hay cambios aparentes en la variación de los residuales.
Figura 9.15. Gráfica de residuales mostrando la condición de heteroscedasticidad, es

decir, de la varianza del error, σ2ε no constante.
9-56
Figura 9.16. Gráfica de residuales mostrando la condición de homoscedasticidad,

cuando la varianza del error, σ2ε es constante es decir, cuando los residuales son
independientes
Prueba de White para el problema de heteroscedasticidad
Hay funciones estadísticas para probar el problema de heteroscedasticidad. Una de
éstas es la prueba de White. De esta manera, Hal White propuso una forma simple para
probar por heteroscedasticidad, es decir, de variaciones sistemáticas de los residuales
con las variables regresoras (White, Halbert, 1980. A Heterscedasticity-Consistent
Covariance Matriz and a Direct Test for Heteroscedasticity. Econometrica
48:817-838).
Para explicar la prueba de White para heteroscedasticidad, supóngase que se
tienen k variables regresoras incluyendo una constante xí = (1, xi2, … , xik). De acuerdo
a White, después de estimar el modelo de regresión, se pueden estimar los residuales y
la ecuación de regresión auxiliar:
e2i = α´zi + vi (9-20)
Donde α es un vector de parámetros, vi es un error y zi contiene todos los productos
cruzados de los elementos en xi, es decir:
zí = (1, xi2,….., xik, x2i2,….., x2ik, xi2xi3,….xi,k-1xik) (9-21)
9-57
Las pruebas de hipotesis nulas se pueden hacer de la siguiente manera:

Por ejemplo, la prueba de hipótesis de homoscedasticidad, es decir, de que la varianza
del error, σ2ε es constante es:
Ho:σ21 = σ22 = … = σ2n (9-22)
La prueba de hipótesis alternativa de heteroscedasticidad es:
Ho:σ21 ≠ σ22 ≠ … ≠ σ2n (9-23)
Cuando se usa la distribución de la JI cuadrada, si el producto de la estadistica R2 y el
tamaño de la muestra tiene una aproximación a χ2 con [k(k + 1) / 2] -1 grados de
libertad, entonces la función se da como:
nR2 ≈ χ2 (k[k + 1) / 2] – 1) (9-24)
Si el valor de nR2 es mayor que el valor crítico de la JI cuadrada χ2 se rechaza la

hipótesis nula a favor de la prueba alternativa de heteroscedasticidad.
9-58
9.1. Este es un ejercicio relacionado con el ajustamiento del mejor modelo de
regresión. La tabla de abajo da los datos.
X | 0 1 2 3 4 5 6 7 8 9
___________________________________________________________________
Y | 9.1 7.3 3.2 4.6 4.8 2.9 5.7 7.1 8.8 10.2
(a) Obtener el modelo de regresión más apropiado, es decir, lineal, cuadrático o cúbico
de acuerdo a los criterios R2, Rajustada, s y PRESS calculados.
(b) Complementar la decisión del mejor modelo candidato basándose en el diagnóstico
subjetivo del análisis gráfico.
La tabla de abajo da las respuestas objetivistas.
Tabla mostrando los datos. (Elaboración propia).
__________________________________________________________________
Tipo de modelo de regresión R2 R2ajustada s PRESS
Modelo de regresión cuadrático 46.3% 30.9% 2.102 100.404
Modelo de regresión cúbico 61.3% 42.0% 1.926 421.055
Modelo de regresión lineal 38.2% 30.5% 2.109 51.316
9.2. Se hace un experimento con un nuevo modelo de automóvil, para determinar la

distancia, después de frenar a varias velocidades. La siguiente data se da:
Velocidad, v (km/hr) | 37 52 67 82 97 113
Distancia después
de frenar el auto, d (m) | 17 27 43 63 89 120
(a) Ajustar el modelo o la curva de regresión múltiple poblacional µd|ν = βo + β1v1 +

β2v2, la cual es estimada por la ecuación de la muestra Y = bo + b1x1 + b2x2
(b) Estimar la distancia después de frenar, cuando el coche lleva una velocidad de 70
9-59
kilómetros por hora.

(c) Estimar la distancia después de frenar, cuando el coche lleva una velocidad de 120
Km/hr.
9.3. La viscosidad de un tipo de lubricante se midió con 6 velocidades diferentes. Se
asumió un modelo cuadrático de regresión como el más apropiado y la función de
regresión polinomial estimada resultante de una muestra de n = 6 fue:
y = -113.0937 + 3.3684x – 0.01780x2
(a) Identificar la variable dependiente.
(b) Identificar la variable independiente.
(c) Calcular la viscosidad del lubricante cuando la velocidad es 75 rpm. (39.41)
9.4. El texto de Probabilidad y Estadística para Ingenieros de los autores Ronald E.
Walpole et al. 1999, discuten un experimento con el fin de determinar si el flujo
sanguíneo cerebral en seres humanos se puede predecir a partir de la presión (en mm
Hg) del oxígeno arterial. Para esto se usaron 15 voluntarios en el estudio y se
observaron los siguientes datos:
___________________________________________________________________
Flujo sanguíneo (Y) | 84.33 87.80 82.20 78.21 78.44 80.01 83.53 79.46
75.22 76.58 77.90 78.80 80.67 86.60 78.20
Presión de oxígeno (x) | 603.40 582.50 556.20 594.60 558.90 575.20 80.10
451.20 404.00 484.00 452.40 448.40 320.30 350.30

___________________________________________________________________
Estimar la ecuación cuadrática o cúbica que mejor encaje en los datos. Una vez que se
decida por el mejor modelo polinomial (de segundo o tercer orden), predecir el flujo
sanguíneo cuando la presión del oxígeno es de 760 torr, es decir de 760 mm Hg = 1
9-60
atmósfera). Sugerencia: Usar una regresión por pasos.

9.5. Se dan los siguientes datos en la tabla de abajo. (Elaboración propia):
Tabla mostrando la información para este problema.
____________________
(X) | 0 1 2 3 4 5 6
____________________
(Y) | 1 4 5 3 2 3 4
____________________
(a) ¿Realmente encaja un modelo cúbico mejor que un modelo de regresión cuadrático
o lineal? Justificar el argumento. (Si, porque el valor de R2 = 87.5% es el más alto de los
3 modelos probados; además el valor de s = 0.6726 y el valor de PRESS = 18.43 son los
valores más bajos de los 3 modelos probados. Además, los diagnósticos gráficos
también apoyan a la noción de un modelo cúbico)
(b) Si el modelo cúbico es superior (justificando el argumento), entonces, pronosticar
Y cuando X = 2. (4.422)
9.6. El libro de Probabilidad y Estadística Aplicadas a la Ingeniería de Montgomery
et al. 1996, p.583 da un ejemplo relacionado con los paneles de las paredes laterales de
un avión formados en una prensa de 1500 toneladas. El costo de fabricación de cada
unidad cambia con el tamaño del lote de producción. La tabla de abajo proporciona los
datos.
(a) Hacer un diagrama de dispersión y decidir qué grado del modelo polinomial es
conveniente usar.
(b) Hacer un análisis de varianza y probar que los coeficientes son igual a cero.
Calcular el valor de p y sacar conclusiones.
(c) Obtener el modelo polinomial que mejor encaje en los datos usando la ecuación
(9-9), con su respectiva prueba de hipótesis.
9-61
Tabla mostrando los datos de este ejercicio.

__________________________________________________________________
y | 1.81 1.70 1.65 1.55 1.48 1.40 1.30 1.26 1.24 1.21 1.20 1.18
x | 20 25 30 35 40 50 60 65 70 75 80 90
9.7. Se dan los siguientes datos en la tabla de abajo.

___________________________________________________________________
Y | 24.60 24.71 23.90 39.50 39.60 57.12 67.11 67.24 67.15 77.87 80.11 84.67
X | 4.0 4.0 4.0 5.0 5.0 6.0 6.5 6.5 6.8 7.0 7.1 7.3
(a) Ajustar los datos a un modelo polinomial de segundo orden.

(b) Ajustar los datos a un modelo polinomial de tercer orden.
(c) Usando métodos subjetivos y objetivos, decidir cuál de los dos modelos encaja
mejor en los datos justificando el argumento. (Un modelo cuadrático es el mejor
candidato. Justificar la aserción)
9.8. Los datos de la tabla de abajo corresponden a un estudio para la obtención de cierto
producto etílico relacionado con el tiempo.
Tabla con los datos.
____________________________________________
x| 1 1 2 4 4 4 6
____________________________________________
y | 25.0 27.5 28.0 31.9 33.0 34.6 22.0
____________________________________________
(a) Obtener el modelo probabilístico (cuadrático o cúbico, sin asumir interacción), más
adecuado para los datos y estimar la función de regresión correspondiente.
(b) Validar el modelo determinado en (a) construyendo una gráfica con los residuales
9-62
estandarizados y analizando, subjetivamente, la conformación de los datos de la

gráfica.
(c) Estimar el coeficiente de determinación R2. De acuerdo con el criterio de R2, y
demás estadísticas ¿encajan bien los datos en el modelo de regresión seleccionado?
(d) Hacer un análisis de varianza y estimar el nivel de probabilidad p.
(e) Complementar el procedimiento usando la ecuación (9-12) y, de acuerdo a los
resultados, y a la prueba de hipótesis, decir cuál de los dos modelos encaja mejor en los
datos.
(f) Usar el criterio de Cp de Mallow para analizar si hubiere muchas variables
independientes o superfluas, que se puedan eliminar del modelo si Cp > (p + 1). No
obstante, si Cp < (p + 1) esto pudiera indicar que se han omitido variables
independientes importan.
9.9. En un estudio de seguridad para los motoristas en las carreteras estatales, se sabe
que el número de accidentes automovilísticos, en cierta parte de de una carretera, está
relacionado con el número de vehículos y la velocidad de éstos. Para esto, al encargado
de este estudio se le piden los promedios de las estadísticas de los últimos 10 años, con
el objeto de establecer un modelo de regresión para predecir el número de accidentes.
Siendo así, se decide poner como variable dependiente el número de accidentes (Y).
Además, como variables independientes se ponen el número de vehículos que pasan
por el trecho (x1) y, la velocidad promedio a que viajan (millas por hora), como (x2). Se
decide probar cuatro modelos de regresión, es decir, uno lineal múltiple sin interacción
y otro con interacción. Para el otro modelo probado se decide por uno cuadrático, con
y sin interacción. Todo esto se hace para ver cual de los modelos encaja mejor en los
datos. Hacer los siguientes cálculos:
(a) Calcular los valores de R2, R2ajustada, s, PRESS, F y el valor de p para cada uno de los
modelos probados.
9-63
(b) Hacer un resumen de los resultados de los 4 modelos de regresión probados y

decidir cual sistema es superior.
Tabla mostrando los promedios anuales del número de accidentes, en función del
número de vehículos y la velocidad (millas por hora) en que viajan. (Elaboración
propia)
Número de (Y) Número de (X1) Velocidad del (X2)
accidentes vehículos vehículo
5 40 53
9 55 73
15 64 90
3 25 55
4 27 60
6 30 70
1 5 50
10 56 85
6 35 80
8 60 67
(b) Completar la tabla de abajo con los resultados de los cuatro modelos probados
y decir cual es el modelo superior.
Tabla mostrando los datos del problema (Elaboración propia)

Tipo de modelo R2 R2ajustada s PRESS F p
Modelo lineal sin
interacción
Modelo lineal con
interacción
Modelo cuadrático
sin interacción
Modelo cuadrático
9-64
con interacción
9.10. Analizar las gráficas de abajo de y versus x1 para una variedad de valores de x2 y
determinar si hay o no interacción.
Gráficas (a), (b), (c), (d), (e) y (f) de y en función de varios valores de x. (Elaboración
propia)
9.11. El texto de los autores Michael J. Neter, H., Kutner, Christopher J. Nachtsheim
y William Wasserman, cuyo título es Applied Linear Regression Models (1996)
discute la eficiencia de un tipo de un mecanismo de transmisión que funciona a más
de la capacidad normal se prueba para reducir el consumo de gasolina y, por ende, la
reducción de la contaminación ambiental (por las emisiones de gases de
invernadero). Esto se estudió en 12 pruebas, con una camioneta equipada con este
tipo de transmisión. La tabla de abajo muestra la velocidad constante (xi), en millas
por hora, en función de las millas por galón obtenidas (yi). Asúmase un modelo de
regresión de segundo orden. Los datos se dan en la tabla de abajo.
9-65
Tabla mostrando los datos del problema del rendimiento de gasolina.

No. de prueba |1 2 3 4 5 6 7 8 9 10 11 12
Velocidad (xi) | 35 35 40 40 45 45 50 50 55 55 60 60
Rendimiento (yi) | 22 20 28 31 37 38 41 39 34 37 27 30
(Fuente: Neter et al. 1996)
(a) Graficar los de datos millas por galón versus velocidad.
(b) Ajustar el modelo de regresión polinomial de segundo orden. (Y = -183 +
8.98X – 0.0911(X 2))
(c) Validar la función probabilística cuadrática graficando los residuos versus valores
observados de y. También, hacer un histograma de frecuencia versus valores
residuales. También, preparar una gráfica de probabilidad normal, es decir, de residuos
versus valores de z.
(d) Validar el modelo cuadrático estimando el valor de SSe, R2 y R. Asimismo, hacer
una tabla de ANOVA y hacer pruebas de hipótesis con la t de estudiante. Sacar
conclusiones apropiadas.
(e) Probar un modelo cúbico y comparar los resultados con los del modelo cuadrático.
(f) ¿Cuál de los dos modelos es superior?
9.12. En una investigación científica agrícola, se estudió, en 10 pruebas, los efectos de
la humedad de la tierra (xi en pulgadas) y la temperatura (x2 en oC) en función del
rendimiento (en fanegas), de cierta variedad de plantas gramíneas (Y). Los datos se dan
abajo.
Tabla mostrando los datos. (Elaboración propia).
__________________________________________________________________
Humedad (x1) | 6 6 6 6 14 14 14 15 16 16
Temperatura (x2) | 20 21 22 22 22 23 23 23 24 24
Rendimiento (Y) | 49 48 48 48 48 42 44 44 40 40
9-66
El ingeniero agrónomo investigador espera un modelo de la forma:

yi = βo + β1xi1 + β2xi2 + β11x2i1 + β22x2i2 + β12xi1xi2 + ε
(a) Graficar los valores de yi contra los valores ajustados.
(b) Calcular R2.
(c) Calcular el valor de F y p.
(d) Estimar el rendimiento promedio (en fanegas), cuando la humedad es igual a 8 y
cuando la temperatura es igual 22 grados Celsius.
(e) ¿Se pudiera eliminar el término de interacción, sin menoscabar la eficiencia del
modelo de regresión, que espera el ingeniero agrónomo?
9.13. La suma de los cuadrados del error de un modelo de regresión polinomial
cuadrático completo, con interacción conteniendo dos variables independientes es de
SSe = 200.0. La suma de los cuadrados del modelo simple, sin interacción, con una
variable independiente es de SSa = 500. Asumir k1 = 4, k2 = 5, n = 50 y α = 0.05.
(a) Determinar cuál de los dos modelos es superior. (El modelo completo es
superior. Justificar el argumento)
9.14. Probar las siguientes hipótesis usando la función (9-9):
(a) Prueba de hipótesis nula es Ho: β3 = β4 = β5 = 0 contra la hipótesis alternativa de
cuando menos uno de los tres coeficientes β3, β4, β5 no es igual a cero. Asumir, k1 = 2,
k2 = 5, n = 100, α = 0.05, SSE1 = 7,000.0 del modelo abreviado y SSE2 = 6,000.0 del
modelo completo. De acuerdo a estos datos, ¿Cuál de los dos modelos es superior?
(b) Prueba de hipótesis nula Ho:β4 = β5 = β6 = β7 = 0 contra H1: cuando menos uno de
estos coeficientes no es igual a 0. Asumir k1 = 3, k2 = 7, n = 45, α = 0.05, SSe1 = 1,600,
SSe2 = 900.0. ¿Cuál de los dos modelos es el mejor?
(c) Ho:β3 = β4 = 0 contra H1:β3 ≠ β4 ≠ 0 de que cuando menos uno de los dos
coeficientes no es igual a 0. Asumir k1 = 2, k2 = 4, n = 30, α = 0.05, suma del error de las
9-67
cuadrados del modelo simple es 130.0 y la suma de los cuadrados del modelo complejo
es de 100.0.
9.15. En una investigación relacionada con la contaminación del aire por el ozono, a
nivel del suelo, se sacó una muestra de 5 años (1999-2003) procedente de una estación
muestreadora localizada en el Parque Chamizal en El Paso, Texas. El mantenimiento
y calibración de los aparatos de esta estación muestreadora fue hecha por la E. P. A. de
Los Estados Unidos. El estudio consistió en el procesamiento estadístico de variables,
como el ozono (O3), el monóxido de nitrógeno (NO), el bióxido de nitrógeno (NO2) y
la temperatura en grados Fahrenheit (oF). Esto se hizo con el objeto de obtener un
modelo de regresión estadístico para fines de predicción. El procedimiento consistió en
sacar los promedios (de los valores espacio-temporales de una hora), de cada una de las
4 variables independientes de cada una de las 24 horas del día de cada mes de cada uno
de los 5 años. Aproximadamente, se procesaron 178,560 datos (24 horas x 31 días x 12
meses x 5 años x 4 variables). Los promedios de los promedios, en partes por billón
(ppb) se dan abajo. Hacer los siguientes cálculos:
(a) Graficar los datos para ver el tipo de la función gráfica que se pueda esperar.
Sugerencia: Usar el paquete de computadora Excel.
(b) Para obtener el mejor candidato del modelo de regresión usar un “best subset
regresión” (mejor subconjunto de regresión) y un “Stepwise Regresión” (regresión por
pasos). Evaluar la utilidad del modelo usando los criterios R2, s, Cp y PRESS y los
criterios subjetivos (gráficas de residuales y prueba de normalidad).
(c) Usando el modelo de regresión seleccionado, para el mes de julio, predecir la
concentración de ozono, si la concentración de NO es igual a 4.0 ppb, NO2 igual a 11.8
ppb, y la temperatura es de 23.5 oC.
La tabla de abajo muestra la información requerida.
9-68
Tabla mostrando los datos del problema de arriba. (Elaboración propia).

Mes Ozono (ppb) NO (ppb) NO2 (ppb) Temperatura (oF)
Enero 16.7 28.2 21.0 49.68
Febrero 19.4 23.0 18.9 53.06
Marzo 30.0 12.5 16.3 58.82
Abril 34.4 10.2 14.4 68.00
Mayo 35.8 6.2 12.8 77.36
Junio 37.5 4.0 10.9 82.94
Julio 38.7 3.3 12.7 83.66
Agosto 36.4 3.9 14.4 83.12
Septiembre 30.7 8.8 16.6 78.44
Octubre 21.2 9.8 20.9 67.10
Noviembre 16.6 33.0 22.7 56.30
Diciembre 14.9 34.9 23.8 46.18
(a) Usando el programa Excel introducir los datos en la hoja de Excel, de la siguiente
manera: En la primera columna poner los meses del año, en la segunda columna poner
los valores de O3, en la tercera columna poner los valores de NO y en la última columna
poner los valores de NO2. Una vez hecho esto irse a:
Chart Wizard → En la ventana de Chart-Wizard-Step 1 of 4 Chart 5 → Chart Type →
Line → Next → Data Range (sombreando los datos) → Column → Next → Título →
Finísh. Todos estos órdenes generan la gráfica mostrada abajo.
90
80
70
60 Conc. O3
50 Conc. NO
40 Conc. NO
30 Temperatura
20
10
0
E F M A M J J A S O N D
9-69
Como se ve en la gráfica, las concentraciones de O3 son directamente proporcionales a

las temperaturas, pero inversamente proporcionales a las concentraciones de NO y
NO2. Con la química atmosférica, estas relaciones matemáticas están de acuerdo a una
lógica a posteriori. ¿Por qué es así? Se le pide al lector contestar esta pregunta.
Para el inciso (b) usando el Best Subsets Regression de la función del Minitab con Y
versus X2, X2, …… para obtener el siguiente esquema mostrado abajo: (Elaboración
propia).
___________________________________________________________________
XXXX
1234
SSSS
XXXQQQQ
Vars R-Sq R-Sq(adj) Cp s 2 2 4 R R R R
1 97.4 96.9 95.2 1.6294 X

1 96.7 96.0 123.5 1.8434 X
2 98.2 97.5 68.2 1.4597 X X
2 98.2 97.5 68.5 1.4630 X X
3 99.5 99.3 16.0 0.7796 X X X
3 98.9 98.3 40.9 1.2029 X X X
4 99.7 99.5 10.7 0.6489 X X X X
4 99.7 99.4 12.4 0.6995 X X X X
*5 99.9 99.8 5.4 0.4036 X X X X X
5 99.9 99.8 5.9 0.4294 X X X X X
6 99.9 99.8 7.0 0.4214 X X X X X X
6 99.9 99.8 7.2 0.4313 X X X X X X
7 99.9 99.7 9.0 0.4859 X X X X X X X
Stepwise regression: Y versus X1, X2, X3, X4,X1SQR, X3SQR
Alpha to enter: 0.15 Alpha to remove: 0.15
Response is: on 6 predictors, with N = 12
__________________________________________________________________
De acuerdo a lo observado arriba, se puede decir que, al juzgar por los valores de R2, s
y Cp, el modelo más apropiado es el que excluye a X 22 y a X 24, pero que incluye a
9-70
(NO2), como la mejor alternativa, es decir, usando un modelo de regresión cuadrático

de la forma de abajo (que excluye a X 22 y X 24).
Y = βo + β1X1 + β2X2 + β3X3 + β4X4 + β5X 21 + β6X 23
La utilidad del modelo candidato se da de acuerdo a los valores de: s = 0.4036, R2 =
99.9%, R2adj. = 99.8%, R2pred. = 99.7% y PRESS = 3.1174. Además, haciendo un
análisis de regresión por pasos se observa que, siempre se van despreciando los valores
de X 22 y X 24, pero siempre se selecciona a X 23 como mejor alternativa. Esta situación
es confirmada por los valores de T y de P mostrados en la tabla de abajo.
Tabla mostrando los coeficientes y los valores de T y P. (Elaboración propia)
Predictor Coef. SE Coef T P
Constant 17.273 6.2660 2.76 0.040
X1 -2.0544 0.1502 -13.67 0.000
X2 -0.3758 0.1159 -3.24 0.023
X3 1.4376 0.1991 7.22 0.001
X4 -10.8350 2.8080 -3.86 0.012
X1SQR 0.0323 0.0029 11.73 0.000
X3SQR -0.0120 0.0016 -7.47 0.001
Para contestar las preguntas del inciso (c) usar el modelo de regresion seleccionado.
9.16. Las tablas de abajo muestran datos sacados de un experimento, el cual consiste en
4 variables independientes. Se usa un paquete de computadora, el cual selecciona tres
de los modelos candidatos más apropiados.
(a) Confirmar la selección del los tres candidatos modelos de regresión más apropiados
usando el paquete Minitab, NCSS o SAS.
(b) De los tres modelos finalistas señalados en la tabla de abajo, seleccionar el modelo
más óptimo basando el criterio en los diagnósticos estadísticos R2, s, PRESS y Cp.
Complementar la decisión usando enfoques subjetivistas, es decir, analizando los
gráficos de los residuos estandarizados. Hacer, además, una prueba de normalidad.
9-71
Tabla mostrando los datos originales. (Elaboración propia)

__________________________________________________________________
(Y) X1 X2 X3 X4
_______
79.3 5.5 31 10 8
200.1 2.5 55 8 6
163.2 8.0 67 12 9
200.1 3.0 50 7 16
146.0 3.0 38 8 15
177.7 2.9 71 12 17
30.9 8.0 30 12 8
291.9 9.0 56 5 10
160.0 4.0 42 8 4
339.4 6.5 73 5 16
159.6 5.5 60 11 7
86.3 5.0 44 12 12
237.5 6.0 50 6 6
107.2 5.0 39 10 4
155.0 3.5 55 10 4
La tabla de abajo muestra los tres mejores candidatos de modelos, para que el lector
haga una decisión sobre cual de los tres modelos es el mejor. Hacer esta decisión final
basándose en los criterios estadísticos R2, s, PRESS y Cp. ¿Pudiera una interacción
mejorar el modelo de regresión?
Tabla mostrando los resultados. (Elaboración propia)
Modelo de regresión Fcalc. R2 s PRESS Cp Durbin-Watson
X2, X3 998 0.9940 6.6749 782.1896 11.4013 1.91
X1, X2, X3 1200 0.9970 4.9795 643.3578 3.4075 2.02
X1, X2, X3, X4 852 0.9971 5.1193 741.7557 5.0000 2.02
9.17. Este problema está relacionado con una información de datos de un experimento
relacionado entre el pH (X) y la conductividad eléctrica (Y). Los datos se dan en la tabla
9-72
de abajo (elaboración propia). Basando el razonamiento en los resultados dados por el

paquete Minitab, decidir si el modelo de regresión más apropiado es un modelo de
cuadrático o un modelo de regresión cúbico.
Quadratic Regression Analysis: (Y) versus (X), XSQR

(Y) = 46.9 – 19.9 (X) + 2.12 XSQ
Constant 46.907 9.432 4.97 0.000
(X) -19.909 4.310 -4.62 0.000
XSQ 2.1161 0.4911 4.31 0.001
S = 0.09332 R-Sq = 94.0% R-Sq(adj) = 93.1%

PRESS = 0.173201 R-Sq(pred) = 90.88%

Source DF SS MS F P
Regression 2 1.78578 0.89289 102.53 0.000
Residual Error 13 0.11322 0.00871
Total 15 1.89900
Cubic Regression Analysis: (Y) versus (X), XSQR, XSCUBE

(Y) = 248 – 158(X) + 33.6 XSQR – 2.40 XCUBE
9-73

Constant 247.9 206.4 1.20 0.253
(X) -157.9 141.6 -1.11 0.287
XSQ 33.64 32.35 1.04 0.319
XCUBE -2.397 2.459 -0.97 0.349
S = 0.09350 R-Sq = 94.5% R-Sq(adj) = 93.1%

PRESS = 0.172799 R-Sq(pred) = 90.90%

____________________________________________________
DF SS MS F P
Regression 3 1.79409 0.59803 68.41 0.000
Residual Error 12 0.10491 0.00874
Total 15 1.89900
9.18. Se dan los siguientes datos relacionados con la manufactura de chumaceras para
vehículos. Se sospecha que ciertas mediciones no están dentro del rango permitido,
posiblemente, debido a fallas de los operadores o tal vez de la maquinaria.
Tabla mostrando los datos del problema (Elaboración propia).

Mediciones | 2.75 2.62 2.74 3.85 2.34 2.74 3.93 4.21 3.88 4.33 3.46 4.52 2.43 3.65 2.78 3.56 3.01
No. muestra| 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

(a) Poner los datos en forma ascendente.
(b) Determinar el valor del cuarto inferior del cuarto superior.
(c) Calcular la cuarta dispersión fs, 1.5fs y 3fs.
(d) Calcular un modelo de regresión que incluya todos los datos.
(e) Calcular otro modelo de regresión que excluya los valores atípicos extremos
calculados en los incisos anteriores.
(f) De acuerdo a los diagnósticos objetivistas y subjetivistas, determinar cual de los dos
9-74
modelos es superior.
9.19. Se da la tabla de abajo con datos relacionados con las concentraciones de
monóxido de carbono (CO) emitidas por motores de combustión interna. Sin embargo,
se argumenta que, el aparato analizador que muestreaba el CO, pudo haber tenido fallas
durante el muestreo de CO debido a que se notaron valores fuera de lo normal. Para
verificar si en verdad hubo valores atípicos en las concentraciones de CO, se requiere
saber, cuales fueron los valores extremos. Para tales fines usar diagramas de caja que
identifiquen valores atípicos extremos. Para esto se da la tabla de abajo.
Tabla mostrando los valores de las concentraciones de monóxido de carbono (ppm).
Concentración de CO | 95 90 90 80 75 65 45 60 57 95 97 130 130 120
105 103 100 99 99
No. de observación | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
18 19

(a) Ordenar los datos en forma ascendente.
(b) Estimar la mediana, el valor máximo, el valor mínimo, el cuarto inferior, el cuarto
superior, la cuarta dispersión fs, 1.5fs, 3fs, el cuarto inferior Q1 y el cuarto superior Q3.
(95, 130, 45, 77.5, 104, 26.5, 75, 103)
(c) Hacer una gráfica con un diagrama de caja y hacer comentarios al respecto.
(d) Identificar los valores atípicos inusuales extremos de CO.
(e) Correr un modelo de regresión, es decir, asumiendo un modelo de regresión
cuadrático, con los valores originales y, otro más, con los valores extremos eliminados.
¿Hay un mejoramiento significante en el modelo corregido, es decir, de acuerdo a los
valores de R2, R2ajustada, s y PRESS, de cada uno de los dos modelos de regresión
cuadráticos, esto es, incluyendo y excluyendo los valores atípicos extremos? (Tal
parece que si hay un mejoramiento significante con el modelo de regresión cuadrático,
9-75
que no incluye los valores extremos. Bajo estas condiciones, los valores de los
diagnósticos estadísticos, para el modelo de regresión, sin los valores atípicos extremos
son: R2 = 98,4%, R2ajustada = 98.2%, s = 2.51, PRESS = 135.74. En contraste, para el
modelo de regresión cuadrático, que incluye todos los valores atípicos extremos, los
valores de los diagnósticos estadísticos son: R2 = 93.6, R2ajustada = 92.8%, s = 6.26 y
PRESS = 949.77)
(f) De acuerdo a los diagnósticos objetivistas y subjetivistas, determinar cual de los
dos modelos es superior.
9.20. El texto de Jay L. Devore intitulado Probabilidad y Estadística para Ingeniería
y Ciencias (2001) cita una investigación para determinar la concentración de cocaína
en la sangre (mg/L) en una muestra de individuos quienes murieron de delirio excitado
(DE) debido al uso de la cocaína. Además, hubo otra muestra de cocaína en la sangre
de otro grupo de adictos a esta droga, quienes murieron por sobredosis, sin delirio
excitado. El tiempo de supervivencia de ambos grupos fue de 6 horas. Los datos
adjuntos se graficaron en un diagrama de caja. Este estudio se publicó en la revista
“Fatal Excited Delirium Following Cocaine Use” (J. of Forensic Sciences, 1997, pp.
25-31). Los datos de este estudio se dan en la tabla de abajo.
9-76
Tabla mostrando los resultados de este problema.

Con delirio excitado (DE)
0 0 0 0 .1 .1 .1 .1 .2 .2 .3 .3 .3 .4 .5 .7 .8 1.0 1.5 2.7
2.8 3.5 4.0 8.9 9.2 11.7 21.0
Sin delirio excitado (Sin DE)
0 0 0 0 .1 .1 .1 .1 .2 .2 .2 .3 .3 .3 .4 .5 .6 .5 .7 .6 .8
1.0 1.2 1.4 1.5 1.7 2.0 3.2 3.5 4.1 4.3 4.8 5.0 5.6 5.9 6.0 6.4
7.9 8.3 8.7 9.1 9.6 9.9 11.0 11.5 12.2 12.7 14.0 16.6 17.8
(a) Determinar las medianas, el cuarto inferior Q1, el cuarto superior Q2, los cuartos
inferiores y superiores y las cuartas dispersiones fs de las dos muestras y el promedio.
(Para ED: .4,.12.75,2.65, 2.607; para no ED: 1.6, .3, 7.9, 7.60, 4.25)
(b) Identificar los valores atípicos moderados y extremos. (ED: 8.9 y 9.2 son valores
atípicos moderados y 11.7 y 21.0 son valores atípicos extremos. En la muestra de no
ED: no hay valores atípicos).
(c) Trazar un diagrama de caja comparativo y usarlo para comparar y diferenciar las
muestras con y sin delirio excitado. (Existe una asimetría positiva apreciable en ED y
en no ED; menor variabilidad en observaciones de la muestra ED, esto es, menor fs.
Además, las observaciones de la muestra no ED son mayores que las de la muestra no
ED)
9.21. El texto de química intitulado Chemistry: The Central Science de Brown et. al.
(2000), discute la fase gaseosa de la descomposición de NO2, la cual es dada por:
NO2(gas) → NO(gas) + ½ O2(gas)
(a) Decir si la reacción es de primero o segundo orden con respecto a la concentración
de NO2. Después, ratificar la decisión hecha usando técnicas de regresión evaluadas
9-77
por estadísticos objetivistas (como R2, s, PRESS y ANOVA) y complementadas por

medio de gráficos subjetivistas (como prueba de normalidad, residuos vs. valores
ajustados, etc.). Además, calcular el valor de la constante de la reacción k (pendiente).
Los valores se dan abajo.
Tabla mostrando los datos del problema
___________________________
Tiempo (seg) [NO2] (M)
___________________________
0.0 0.1000
5.0 0.0170
10.0 0.0090
15.0 0.0062
20.0 0.0047
___________________________
Fuente: Chemistry: The Central Science. Brown et al. (2000)
9.22. Los autores Sawyer C. N., Perry L. McCarty del libro Chemistry for Sanitary
Engineers, 2nd. Edition (1967) proporcionan los siguientes datos provenientes de un
experimento para evaluar la desinfección de un almacenamiento de agua con una
dosis de cloro dada para matar las bacterias coliformes. Usando el programa Minitab
o cualquier otro programa de computadora, correr un análisis de regresión
estadístico y hacer lo siguiente:
(a) Decir el orden de la reacción de estos datos. (Primer orden)
(b) ¿Que tan bien encajan los datos en el modelo de regresión? Para esto, usar un
criterio objetivista y uno subjetivista para justificar la aserción.
(c) Calcular la vida media
(d) Calcular la tasa de la reacción (0.1848)
(e) ¿Predecir el tiempo que se llevaría para aniquilar el 50% de las bacterias
coliformes?
9-78

____________________________________________
Tiempo (min) Porcentaje de coliformes
que van quedando
____________________________________________
0 100
10 70
20 21
30 6.3
60 0.6
____________________________________________
(Fuente: Sawyer et al. 1967)
9.23. El texto de Mongomery, Peck y Vining, intitulado Introducción al Análisis de

Regresión Lineal (2001) da un estudio relacionado con la ingeniería química y
mecánica en la cual se necesita conocer la presión de vapor de agua a diversas
temperaturas; para esto se pueden usar la “infames” tablas de vapor. Los datos de la
presión de vapor y del agua a diversas temperaturas se dan abajo.
_________________________________________________________________
y = presión de vapor de agua (mm Hg) x = Temperatura (oC)
__________________________________________________________________
9.2 10
17.5 20
31.8 30
55.3 40
92.5 50
149.4 60
Fuente: Montgomery et al. (2001)
(a) Ajustar un modelo de regresión de primer orden sustentado por estadísticos

objetivos y gráficos.
(b) Ajustar un modelo de regresión de segundo orden sustentado con estadísticos
objetivos y gráficos.
9-79
(c) De acuerdo a los resultados obtenidos en los incisos (a) y (b) decidir cual de los
dos modelos es superior, es decir, el modelo de regresión que ajusta mejor a los
datos.
9.24. En un experimento relacionado con la velocidad del vehículo y el consumo de
gasolina se estudia en una muestra de un tamaño 15, es decir, usando un solo
vehículo. Los datos se dan en la tabla de abajo.
Tabla mostrando los datos de este experimento.
__________________________________________________________________
Velocidad (km/hr) | 57 57.6 64 66 66 80 81 89.6 98 99
Consumo de gasolina (L/km) | 20 21 25 26.3 26.5 29 29 27 25.5 25

(a) Identificar la variable dependiente y la variable independiente
(b) Graficar los datos de la variable dependiente versus la variable independiente.
(c) Ajustar el modelo de regresión que mejor encaje en los datos
(d) Evaluar la utilidad del modelo candidato mediante análisis objetivistas (R2, R2ajustada,
error estándar de lo estimado s, PRESS, y análisis de varianza). Complementar la
decisión obtenida usando gráficos subjetivistas (Gráficos de prueba de normalidad,
residuales versus valores ajustados de Y, residuales versus ordenes, etc.)
(e) Una vez que se haya obtenido el modelo superior, predecir el consumo de gasolina
cuando la velocidad es de 96 km/hr
9-80
CAPITULO 10
Estadística no paramétrica. El modelo de ANOVA libre
Ventajas de los métodos no paramétricos.- Desventajas de los métodos no
paramétricos.- Prueba de H de Kruskal-Wallis para análisis de varianza por
rangos.- Pruebas de hipótesis con las funciones no paramétricas.-
Procedimientos de pruebas de Kruskal-Wallis para ANOVA simple.- Pruebas
de hipótesis no tradicionales, para la prueba de Kruskal-Wallis, es decir,
usando el valor de la probabilidad p.-
Cuando se estudian procedimientos libres o de pruebas no paramétricas se incluyen
la prueba de suma de rangos de Wilcoxon, la prueba de Kruskal-Wallis para
diseños completamente aleatorizados, la prueba de Friedman, la prueba de
Kolmogorov-Smirnov, etc. Existen muchas aplicaciones en la ciencia y en la
ingeniería donde los datos se reportan, no como valores continuos, sino en una
escala ordinal de tal manera que se puedan asignar rangos a los datos obtenidos.
Todos los métodos discutidos anteriormente, como la distribución normal, la
distribución de t de estudiante, la distribución de F, el modelo de regresión, etc., se
llaman métodos estadísticos paramétricos. Esto se debe a qué, estas distribuciones
continuas asumen que la variación aleatoria de los datos debe de seguir a la
suposición de normalidad. Sin embargo, existen situaciones en que las
suposiciones de normalidad no se satisfacen para las pruebas de hipótesis. Para
resolver este problema, los estadísticos han diseñado varias alternativas para
aquellos investigadores que estén renuentes a aceptar las suposiciones de
normalidad, es decir, de funciones no paramétricas. Estos procedimientos no
paramétricos se aplican igualmente a distribuciones paramétricas y a distribuciones
no paramétricas.
10-1
En el uso de las estadísticas no paramétricas, como la prueba de Kruskal-

Wallis, la prueba de signos, la prueba de Wilcoxon, la prueba de rangos de signos,
etc., es necesario aclarar qué, estos procedimientos no paramétricos no son tan
poderosos como sus contrapartes, es decir, los métodos paramétricos, como la
distribución normal, la t de estudiante, etc. Esto se debe a qué, para una
probabilidad de error I, las pruebas no paremétricas darán una probabilidad más
alta del error tipo II. Esto también ocurre, porque una prueba que ignore la
normalidad de los datos (como lo hacen las pruebas no paramétricas), no será tan
buena como aquellas pruebas que la sigan (como las paramétricas). Otra limitación
de las pruebas no paramétricas es que las poblaciones muestreadas deben se ser
independientes. Esto quiere decir qué, un grupo no debe de tener influencia sobre
el otro. Sin embargo, haciendo a un lado la condición de normalidad, en que se
basan las estadísticas paramétricas, las pruebas no paramétricas tienen muchas
aplicaciones en el campo de la ingeniería.
Ventajas de los métodos no paramétricos
1. Estos métodos pueden aplicarse a un gran número de situaciones, porque no
requieren de las condiciones de normalidad requeridas por sus contrapartes
paramétricas y son más simples que su contraparte, los métodos paramétricos.
2. En contraste con los métodos paramétricos, los métodos no paramétricos pueden
ser aplicados a datos no numéricos.
Desventajas de los métodos no paramétricos
1. Los métodos no paramétricos tienden desperdiciar información, porque los datos
numéricos exactos usualmente se reducen a forma cualitativa. Por ejemplo, en una
prueba no paramétrica, digamos de pruebas de signos, la pérdida de peso por
dietistas se registran simplemente signos negativos. Con este método de signos, la
10-2
pérdida de peso de una sola libra, recibe la misma representación que la pérdida de
50 libras.
2. Las pruebas no paremétricas no tienen la eficiencia de las pruebas paramétricas.
Esto se debe a qué, con los métodos no paramétricos, en las pruebas de hipótesis se
necesita una fuerte evidencia, antes de que se pueda rechazar la hipótesis.
La TABLA 10.0 muestra una comparación entre los métodos paramétricos y los
no paramétricos.
TABLA 10.0. Tabla mostrando una comparación entre los métodos paramétricos y
los métodos no paramétricos. (Elaboración propia)
Aplicación Prueba Prueba no Eficiencia
paramétrica paramétrica
Datos pareados para Prueba de z Prueba de 0.63
muestras dependientes o de t* signo
Datos para muestras Prueba de z Prueba de signos de 0.95

independientes o de t** rangos de Wilcoxon
Varias muestras independientes Análisis de varianza Prueba de Kruskal- 0.95

(ANOVA) (prueba F) Wallis
Correlación Correlación lineal Prueba de correlación 0.91

de rangos
Aleatoriedad Prueba no paramétrica Pruebas corridas
No hay
base
______________________________________________________________________________
* t = ( D - µo)/ sD/√ n
2 1 1
** t = ( X 1 – X 2) – (µ1 – µ2) / s ( + )
p
n n
1 2
σ +σ
2 2
** z = ( X 1 – X 2) – (µ1 – µ2) / 1 2
con σ1 y σ2 conocidas
n 1 n 2
10-3
Prueba de H de Kruskal-Wallis para análisis de varianza por rangos

La única prueba que se discutirá en este capítulo es la prueba de Kruskal-Wallis, la
cual está relacionada con la estadística paramétrica del análisis de varianza. El
análisis de varianza o ANOVA paramétrico se aplica para ver si tres o más
promedios poblacionales son iguales, es decir, que no hay diferencias en los
promedios. Sin embargo, aquí se asume qué, las poblaciones muestreadas, están
normalmente distribuidas y, las desviaciones estándar de estas distribuciones son
iguales.
No obstante, si no se pueden seguir las suposiciones de la ANOVA
paramétrica, lo apropiado es usar las pruebas no paramétricas, como la prueba de
Kruskal-Wallis, prueba de signos de rangos de Wilcoxon o prueba U de Mann-
Whitney. Empero, como ya se dijo, aquí debe existir independencia entre las
poblaciones muestreadas. De cualquier manera, si se reúne esta condición,
entonces si podemos usar la función de Kruskal-Wallis para hacer análisis de
varianza, para ver si existen diferencias entre los promedios poblacionales.
Procedimientos de pruebas de Kruskal-Wallis para ANOVA simple
1. Todos los valores de la muestra son combinados.
2. Los rangos ordenados son del más alto al más bajo.
3. Los valores ordenados se reemplazan por rangos empezando por uno para el más
pequeño hasta el más alto.
4. Para la prueba de hipótesis se usa la distribución de la JI cuadrada y es unilateral
derecha. Para la prueba no tradicional se usa el cálculo de la probabilidad p usando
la tabla de la distribución de la JI cuadrada (χ2).
La función de Kruskal-Wallis se designa por la función H que está muy
cercana a la distribución de la JI cuadrada. Esta función se da como:
10-4
12 (ΣR1)2 (ΣR2)2 (ΣRk)2

H = ─────── [─────── + ────── + …… + ──────] – 3(N + 1) (10-1)
N(N+1) n1 n2 nk
Con ν = k – 1 grados de libertad

Donde k es el número de poblaciones muestreadas o número de muestras
Donde:
ΣR1, ΣR2,… ΣRk = suma de los rangos para la k-ésima muestra n1, n2, …,nk =
tamaños de muestras 1, 2, .., k
N = número total de las observaciones para todas las muestras combinadas.
Si el valor computado de la estadística H cae en la región crítica derecha (las
pruebas siempre son unilaterales derechas), es decir, H > χ2α;ν, con ν = k – 1 grados
de libertad, entonces, se rechaza Ho: al nivel de significancia usado. De otra
manera se retiene Ho:
Pruebas de hipótesis con las funciones no paramétricas
Para las pruebas de hipótesis tradicionales se usan los mismos términos que en las
pruebas paramétricas de ANOVA, es decir, si H > χ2α, con ν = k – 1 grados de
libertad cae en la región crítica derecha, se rechaza la hipótesis sustentada, Ho:. De
otra manera se retiene, se acepta o no se hace ninguna decisión.
La prueba de hipótesis nula para la prueba de Kruskal-Wallis es la
tradicional, es decir:
Ho: µ1 = µ2 = µ3 = …… = µk (10-2)
La hipótesis alternativa es:
H1:µ1 ≠ µ2 ≠ µ3 ≠ ….≠ µk (10-3)
10-5
Los niveles de significancia son los mismos que las pruebas paramétricas, es decir,
α = .05 y α = .01. Estos valores se buscan en la tabla de la JI cuadrada con χ2α,
donde α es igual a .05 o .01 (extremo derecho de la tabla).
Pruebas de hipótesis no tradicionales, para la prueba de Kruskal-Wallis, es
decir, usando el valor de la probabilidad p
Para hacer estas pruebas de hipótesis no tradicionales usando el valor de p, se
siguen los mismos criterios usado anteriormente. El procedimiento se hace
buscando el valor de la estadística calculada H en la tabla de la distribución de JI
cuadrada, y se hace una interpolación usando la misma fórmula usada con las
pruebas paramétricas.
Ejemplos usando la prueba de Kruskal-Wallis
Ejemplo #1. Se quiere probar si existen diferencias en las concentraciones de
óxidos de nitrógeno (NO2) provenientes de tres muestreadores (1, 2 y 3)
localizados en diferentes lugares. Probar que no hay diferencias entre las
concentraciones de óxido de nitrógeno, entre las tres poblaciones muestreadas.
Usar α = 0.05. Las concentraciones de NO2 se dan en la tabla de abajo.
TABLA 10.1. Tabla mostrando las concentraciones de óxidos de nitrógeno (NOx)
en ppm provenientes de los tres muestreadores. (Elaboración propia)
Muestreador 1 Muestreador 2 Muestreador 3
51 14 89
32 31 20
17 68 60
69 87 72
86 20 56
62 28 22
96 77
97
10-6
Solución:
Primeramente, se tienen que ordenar los rangos, para cada uno de los tres
muestreadores. Aquí, sin embargo, hay que tener cuidado de tomar en
consideración situaciones donde hay repeticiones. En este caso hay dos
repeticiones en los muestreadores 2 y 3. Estas situaciones se modifican como se ve
en la TABLA 10.2 de abajo. Analizando la tabla de abajo, vemos que, el marcador
más bajo, es el 14 de la columna dos, el 17 de la columna uno y, el 20 de la
columna dos y tres. La tabla de abajo muestra el orden de los rangos.
TABLA 10.2. Tabla mostrando los datos de los marcadores con sus respectivos
rangos. (Elaboración propia)
__________________________________________________________________
Mestreador 1 Muestreador 2 Muestreador 3
Marcador Rango Marcador Rango Marcador Rango

51 9 14 1 89 19
32 8 31 7 20 *3.5
17 2 68 13 60 11
69 14 87 18 72 15
86 17 20 *3.5 56 10
62 12 28 6 22 5
96 20 77 16
97 21
*Debido a que hay dos números 20 entonces, (3 + 4)/2 = 3.5

Ahora se procede a sumar los rangos para cada una de las tres columnas:
ΣR1 = 82 ΣR2 = 85.5 ΣR3 = 63.5
n1 = 7 n2 = 8 n3 = 6
La región crítica derecha se calcula usando la distribución de la JI cuadrada. El
valor de χ2α;ν, es decir, χ20.05;ν que, en este caso, es de χ2 0.05;2 = 5.991, esto es, con ν =
k – 1 = 3 – 1 = 2 grados de libertad.
10-7
Enseguida, sustituyendo los valores de la fórmula de Kruskal-Wallis (10-1) y

resolviendo por H da:
12 (82)2 (85.5)2 (63.5)2
H = ────────[───── + ────── + ─────] – 3 (21+1)
21(21+1) 7 8 6
= (0.026)[(960.57) + (913.78) + (672.04)] - 66

= 0.21
Conclusión: Debido a que el valor de la estadística χ2 = H = 0.21 es menor que
χ20.05;2 = 5.991, no se puede rechazar la hipótesis nula de igualdad de promedios y
se dice que la prueba no es significante. Esto dice que tenemos una evidencia muy
insuficiente para rechazar la hipótesis nula de que las concentraciones de las tres
poblaciones de NO2 provenientes de los tres muestreadores son iguales.
Ejemplo #2. En un estudio de toxicología, con el objeto de verificar el contenido de
alquitrán se prueban cuatro muestras aleatorias de cigarrillos. Como no se sabe si la
población muestreada es normal, en lugar de usar un análisis de varianza
paramétrico, se decide usar un método no paramétrico, es decir, el de Kruskal-
Wallis. Usando un nivel de significancia de α = .05 probar que no hay diferencias
entre las cuatro poblaciones de marcas de cigarrillos. Los datos de las cuatro
marcas de cigarrillos con sus respectivas concentraciones de alquitrán se dan en la
tabla de abajo. También calcular el valor de la probabilidad p.
Marca A Marca B Marca C Marca D
10 18 15 20
11 14 14 19
13 15 12 21
14 16 16 17
Solución:
10-8
1. Primero sacamos los rangos correspondientes, como se ve en la tabla de abajo.

TABLA 10.4. Tabla mostrando los rangos. (Elaboración propia)
Marca A Rango Marca B Rango Marca C Rango Marca D Rango
10 1 18 13 15 8.5 20 15
11 2 14 6 14 6 19 14
13 4 15 8.5 12 3 21 16
14 6 16 10.5 16 10.5 17 12
2. Enseguida, establecemos la región crítica unilateral derecha (no hay más que
esa, ¿por qué?).
χ2[α;k-1] = χ2[.05;4-1] = χ2[.05;3] = 7.82 (de la tabla de la JI cuadrada)
3. Usando la fórmula de Kruskal-Wallis (10-1) y sustituyendo:
N = 16, (ΣR1)2 = (13)2 = 169, (ΣR2)2 = (38)2 = 1444, (ΣR3)2 = (28)2 = 784, (ΣR4)2 =
(57)2 = 3249, n1 = n2 = n3 = n4 = 4, da:
H = 12/16(16+1) [169/4 + 1444/4 + 784/4 + 3249/4] – 3(16+1)
= 11.06.
4. Conclusión: Debido a que 11.27 > 7.82 se rechaza la hipótesis de igualdad de
poblaciones, y se dice que si hay diferencias entre los promedios de las
concentraciones de alquitrán en los cigarrillos.
5. El valor de la probabilidad p se saca buscando 11.06, con 3 grados de libertad en
la tabla de la JI cuadrada y está entre .025 y .01. Si se requiere mas precisión se
puede usar la fórmula de interpolación (5-28), es decir, buscando el valor de 11.27.
Los valores interpolados son:
λ2 = 0.99, χ2 = 11.345, λ1 = 0.975, χ2 = 9.348, H = 11.06
Sustituyendo estos valores en la fórmula de interpolación:
(λ2 – λ1) / (χ22 – χ21) = (λ2 – X) / (λ2 – χ2calc.)
(0.99 – 0.975)/(11.345 – 9.348) = (0.99 – X)/(11.345 – 11.06)
10-9
Ahora, resolviendo por X da X = .9879. El valor de p es igual a p = 1 - .9879 =

0.01. Este valor de la probabilidad p es significante.
Ejemplo #3. El libro Statistics for Modern Business Decision de Lawrence L.
Lapin, menciona un estudio de química analítica, relacionado con las impurezas
que contienen los reactivos químicos, las cuales pueden interferir en las reacciones
químicas, es decir, en cuanto a la cantidad de tiempo requerido para que se logre la
reacción química. Los datos se dan en la tabla de abajo.
TABLA 10.5. Tabla mostrando los niveles de impurezas en los reactivos químicos
en función del tiempo para que se haga la reacción.
Niveles de impurezas
.001 .01 .05 .10
Tiempo de reacción en minutos
103 104 153 207
111 113 127 183
107 117 143 173
105 120 119
113 138
143
Fuente: Lapin (1982)
(a) Calcular la estadística H de Kruskal-Wallis.
(b) Usando un nivel de significancia de α = 0.05 probar la hipótesis nula de que los
niveles de impurezas en los reactivos químicos no afectan el tiempo de reacción.
Hacer esto, usando la prueba de hipótesis tradicional y la prueba de hipótesis no
tradicional.
Solución:
10-10
La tabla de abajo enlista los marcadores y sus rangos correspondientes.

TABLA 10.6 Tabla mostrando los valores de los marcadores en forma ascendente
de los cuatro niveles de impurezas en los reactivos químicos y el tiempo.
Marcador | 103 104 105 107 111 113 113 117 119 120 127 138 143 143 153 173 183 207
Rango | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 118
TABLA 10.7. Tabla mostrando los cuatro marcadores con sus correspondientes
rangos.
(1) (2) (3) (4)
.001 .01 .05 .10
_______________ ______________ ______________ _______________
Marcador Rango Marcador Rango Marcador Rango Marcador Rango
103 1 104 2 153 15 207 18
111 5 113 6.5* 127 11 183 17
107 4 117 8 143 13.5* 173 16
105 3 120 10 119 9
113 6.5* 138 12
143 13.5*
*Debido a que hay dos 113 y dos 143, entonces el rango correspondiente a 113 es
(6+7)/2 = 6.5 y el rango correspondiente a 143 es (13 + 14)/2 = 13.5
Ahora se procede a sumar los rangos para cada una de las cuatro columnas.
ΣR1 = 13 ΣR2 = 33 ΣR3 = 74 ΣR4 = 51
n1 = 4 n2 = 5 n=6 n=3
La región crítica derecha se calcula usando la distribución de JI cuadrada. El valor
de χ2α;ν = χ20.05;3 = 7.82, es decir, donde ν = k – 1 = 4 – 1 = 3.
Enseguida sustituyendo los valores de arriba en la ecuación (10-1)
10-11
12 (13)2 (33)2 (74)2 (51)2
[
H = ─────── ─────── + ────── + ────── + ────── – 3(18 + 1) ]
18(18+1) 4 5 6 3
= 0.035 [42.25 + 217.8 + 912.67 + 867.0] - 57

= 0.035(2039.72) – 57
= 14.39
Conclusión: debido a que el valor de la estadística χ2 = H = 14.39 es mayor que
7.82 se rechaza la hipótesis nula y se dice que los niveles de impurezas si están
afectando el tiempo de las reacciones químicas.
Ahora bien, para hacer la prueba de hipótesis de p o no tradicional, se hace
usando la fórmula de interpolación de abajo:
(λ2 – λ1) / (χ22 – χ21) = (λ2 – X) / (χ22 - χ2calc.)
Se busca en la tabla de JI cuadrada el valor de χ2calc. = 14.39 con 4 g.l. y está entre
14.86 con valor porcentual de .005 y 13.277 con valor porcentual de .01. Es decir,
con los valores de λ2 = .005, λ1= .01, χ22 = 14.86, χ21 = 13.277, y χ2calc. = 14.39.
Sustituyendo todos estos valores en la fórmula de arriba y resolviendo por X da:
(.005 - .01) / (14.86 – 13.277) = (.005 – X) / (14.86 – 14.39)
X = 0.0072 = p
Este valor de 0.0072 es mucho muy significante y refrenda la decisión tomada en
afirmar que si hay diferencias entre los niveles de impurezas que retardan las
reacciones químicas.
10-12
10.1. En un experimento para determinar, cuál de tres tipos de motores usaban

menos gasolina, se hizo un estudio tratando de mantener todas las demás variables
constantes. Usar un nivel significante de α = 0.05.
(a) Establecer Ho: y H1: y calcular H. (Ho:µ1 = µ2 = µ3; H1:µ1 ≠ µ2 ≠ µ3,
H = 1.66 y se retiene Ho:)
(b) Establecer la región crítica. (h > χ20.05;2 = 5.991)
(c) Usar la prueba no paramétrica de Kruskal-Wallis y probar que no hay
diferencias en el consumo de gasolina de los tres motores, en cuanto al millaje
obtenido. (H = 1.66 y se retiene Ho:)
Motor 1 Motor 2 Motor 3
24.0 23.2 18.4

16.7 19.8 19.1
22.8 18.1 17.3
19.8 17.6 17.3
18.9 20.2 19.7
17.8 18.9
18.8
19.3
10.2. La tabla de abajo da las temperaturas de 5 sujetos seleccionados,

aleatoriamente, de tres grupos diferentes. Usando un nivel de significancia de α =
0.05 probar que las tres poblaciones de temperaturas son iguales. Calcular p.
10-13
Tabla mostrando las temperaturas del cuerpo (oF) clasificadas por edades.
18-20 años 21-29 años >30 años
98.0 99.6 98.6

98.4 98.2 98.6
97.7 99.0 97.0
98.5 98.2 97.5
97.1 97.9 97.5
10.3. Un panel de siete expertos fue consultado para calificar a cinco industrias (A,
B, C, D, E) en cuanto a la probabilidad de que cambios tecnológicos produzcan
mejoras en el control de la contaminación ambiental, en el curso de los próximos
10 años. Las calificaciones en se dan en la tabla de abajo.
Industrias
_________________________________________________
A B C D E
_________________________________________________
Experto
1 0.15 0.75 0.10 0.00 0.30
2 0.30 0.60 0.20 0.05 0.25
3 0.20 0.80 0.30 0.00 0.50
4 0.00 0.50 0.25 0.10 0.60
5 0.10 0.55 0.15 0.15 0.40
6 0.25 0.70 0.35 0.25 0.45
7 0.40 0.95 0.45 0.20 0.35
(a) Probar con el nivel de significancia de α = 0.05, que las poblaciones son
idénticas.
(b) Calcular el valor de la probabilidad p.
10-14
10.4. El libro Probabilidad y Estadística para Ingeniería y Ciencias de Jay L.

Devore (p. 662) proporciona los siguientes datos, los cuales se refieren a la
concentración del isótopo estroncio 90, en muestras de leche obtenidas de 5
lecherías seleccionadas, aleatoriamente, en cada una de cuatro regiones diferentes.
Tabla mostrando los datos de las concentraciones de estroncio en leche.
Región 1 6.4 5.8 6.5 7.7 6.1

Región 2 7.1 9.9 11.2 10.5 8.8
Región 3 5.7 5.9 8.2 6.6 5.1
Región 4 9.5 12.1 10.3 12.4 11.7

(a) Probar con el nivel de significancia de 0.10 para verificar si el promedio de
concentraciones de estroncio 90 difiere, al menos en dos de las regiones.
(c) Hacer un análisis de varianza paramétrico y comparar los resultados.
10.5. Los datos de abajo muestran 4 tratamientos para determinado proceso, en el
cual no se sabe si la población muestreada es normal. Usar la ANOVA paramétrica
y, luego, usar el método no paramétrico de Kruskal-Wallis. ¿Hay suficiente
evidencia, con α = 0.05, que nos permita concluir que existen diferencias entre los
4 tratamientos? En ambos casos comparar los resultados y examinar el valor de F y
de p. ¿Cuál de los dos métodos (paramétricos o no paremétricos) sería el más
preciso, si se supiera que la población muestreada fuera normal?
10-15
Datos del problema de arriba. (Elaboración propia)

Tratamientos
1 2 3 4
12 10 10 9
15 12 8 6
13 11 12 8
18 14 15 7
20 10 13 9
19 11 11 7
15 12 13 6
________________________________________________________________
10-16
CAPITULO 11
Series de tiempo
Clasificación de los movimientos de las series de tiempo.- Tendencias a largo
plazo.- Componentes cíclicos de series de tiempo.- Variaciones estacionales.-
Variación irregular.- Métodos para encontrar líneas de tendencia.- Línea de los
cuadrados mínimos y parábolas de los cuadrados mínimos.-
Cualquier variable en función del tiempo, en sucesión, se llama series de tiempo. Las
series de tiempo son una secuencia de valores de variables tomadas en periodos de
tiempo sucesivos. La gráfica de una serie de tiempo es un diagrama, con el eje vertical
mostrando el valor observado (y) y, con el eje horizontal denotando el tiempo
(minutos, días, años, etc.).
Las gráficas como los histogramas o diagramas de tallo y hoja son métodos
visuales útiles para mostrar la variación en los datos. Sin embargo, el tiempo es un
factor muy importante que contribuye a la variación observada de los datos, que los
histogramas o las gráficas de caja no los toman en cuenta.
Las series de tiempo son un conjunto de observaciones tomadas a tiempos
específicos, usualmente, a intervalos iguales en un orden cronológico. Las series de
tiempo o secuencias de tiempo se definen como datos estadísticos que son
coleccionados, registrados u observados en incrementos de tiempos sucesivos. El
análisis de los datos de las series de tiempo es de interés para aquéllos quienes deseen
entender la naturaleza de los datos pasados y presentes. También, las series de tiempo
son de interés para aquellos investigadores, quienes deseen usar el conocimiento de
datos pasados para predecir el futuro.
Las aplicaciones de las series de tiempo son muy comunes en la economía,
pero también en la economía o la ingeniería. Por ejemplo:
11-1

1. Los gobiernos de las naciones industrializadas quieren saber los valores futuros de
las tasa de intereses monetarios. Las naciones en desarrollo quieren saber las
tendencias de las tasas de devaluación de la moneda. También es deseable predecir las
tasas de empleos o de desempleos. Igualmente, es importante saber los porcentajes de
los incrementos de los costos de la vida.
2. Otras aplicaciones de las series de tiempo son los pronósticos de las tasas de interés
para la construcción de viviendas y el costo de los materiales de construcción.
3. También las compañías manufacturadoras quieren pronosticar la demanda de sus
productos y sus acciones en el mercado.
4. En ingeniería ambiental, los activistas y protectores del medio ambiente quieren
saber cuáles son las tendencias en los aumento de los gases de invernadero, como el
bióxido de carbono (ocasionado por la emisiones vehiculares, la industria, fuegos
forestales, etc.) que están calentando la tierra, fundiendo los glaciares montañosos y
las capas polares y cambiando el clima mundial. También es interesante saber las
tendencias y los aumentos de la radiación ultravioleta, que tanto daño está causando al
ser humano, por la destrucción del ozono natural estratosférico, causado por la
irracionalidad del hombre moderno.
5. Las series de tiempo también aplican para saber las tendencias y pronósticos de los
incrementos de la población mundial, etc.
Cuando se grafican las mediciones de series de tiempo, a menudo se observan
tendencias, ciclos o variaciones importantes de los datos que, de otra manera, pasarían
inadvertidos.
Definición: Matemáticamente, una serie de tiempo se define por valores Y1, Y2,....... de
una variable Y, como la temperatura, concentraciones de contaminantes, como CO2,
SO2, partículas atmosféricas, etc., a tiempos t1, t2,.... Por lo tanto, Y es una función de t
11-2

simbolizada por Y = F(t).

Clasificación de los movimientos de las series de tiempo
Los movimientos característicos de las series de tiempo pueden clasificarse en cuatro
tipos llamados componentes de series de tiempo. Estos componentes de las series de
tiempo se describen como sigue:
1. Tendencias a largo plazo o movimientos seculares.
2. Movimientos o fluctuaciones cíclicas.
3. Variaciones estacionales o movimientos estacionales.
4. Variaciones o movimientos irregulares o aleatorios.
Tendencias a largo plazo
La tendencia a largo plazo o tendencia secular de una serie de tiempo es el
componente uniforme de las series que representan el crecimiento o decremento de
tiempos, sobre un periodo grande de tiempo. La tendencia secular se refiere a la
dirección general en la cual la gráfica de unas series aparecen moverse durante un
intervalo de tiempo. Por ejemplo, la población de los Estados Unidos durante los
últimos 40 años ha mostrado una tendencia de crecimiento de 137 millones de
personas a 246 en 1988. Las tendencias a largo plazo se ve en la Figura 11.0(a).
La determinación de las tendencias de las líneas y de las curvas se puede hacer
usando el método de ajustamiento de curvas. También se puede hacer por medio del
análisis de los diagramas esparcidos, para encontrar la función matemática que mejor
encaje en los datos.
Componentes cíclicos de series de tiempo
Los componentes cíclicos se refieren a los movimientos recurrentes de arriba y abajo
de las tendencias de las series de tiempo. Estas fluctuaciones de onda, llamadas ciclos
de los negocios, son diferentes de las fluctuaciones estacionales. Es decir, en el
11-3

sentido de que cubren periodos largos de tiempo, tienen causas diferentes y son
menos predecibles. Las fluctuaciones duran de 2 a 10 años, o más, cuando se miden
las ondas de cresta a cresta o de canal a canal. Ejemplos de componentes ciclos son
periodos de recesiones económicas o de periodos de inflación, demanda de productos
a largo plazo, etc. Esta situación se ve en la Figura 11.0 (b)
Variaciones estacionales
Este tipo de series de tiempo se refieren a variaciones periódicas, pero no están
limitadas a variaciones con la estación del año. Estos son patrones de periodos en las
series de tiempo que se completan en un año y, luego se repiten de acuerdo al mismo
patrón de periodo en años, subsecuentes. Por ejemplo, los precios de los mercados
financieros pueden mostrar tendencias altas o bajas en un día o en una semana.
En estudios ambientales, las fluctuaciones de los contaminantes muestran
tendencias cíclicas durante el día, como en el caso del estudio de las concentraciones
de ozono troposferico. Otros ejemplos son la producción de ciertos productos de
granjas agrícolas, el número de vehículos que pasan por cierto punto, entre dos sitios,
etc. La unidad de tiempo en variaciones estacionales es menos que un año, pero
pueden ser de un mes, una semana, o parte del día. Esta situación se ve en la Figura
11.0(c).
Variación irregular
Este es un tipo de variación que no está considerado por tendencias, ciclos o factores
estacionales, sino que se compone de fuerzas no recurrentes, esporádicas que no se
describen como o atribuidas a factores de tendencias, ciclos, o estacionales. Ejemplos
de variaciones irregulares son movimientos esporádicos de series de tiempo debido a
inundaciones, granizadas, heladas, tornados, huracanes, sequías, fuegos forestales,
etc.
11-4

Además, las figuras de abajo muestran ejemplos de algunos posibles patrones

de tendencia en series de tiempo. Por ejemplo, la Figura 11.1(a) muestra una
tendencia no lineal. La Figura 11.1(b) muestra una tendencia lineal que disminuye. La
Figura 11.1(c) muestra una gráfica sin tendencia.
Figura 11.0. Gráficas mostrando los tipos de tendencias. La gráfica (a) muestra una
tendencia de línea a largo plazo o de movimiento secular. La gráfica (b) muestra una
línea de tendencia a largo plazo con un movimiento cíclico sobrepuesto. La gráfica (c)
muestra tendencias cíclicas a largo plazo y movimientos estacionales. (Spiegel, 1961).
Figura 11.1. Ejemplos de algunos patrones de tendencias en series de tiempo.

Aplicaciones de las funciones de series de tiempo
Las aplicaciones en ingeniería de las tendencias a largo plazo o tendencias seculares
son varias. Ejemplos de estas aplicaciones son los incrementos de la contaminación
ambiental. Un ejemplo clásico es el aumento constante de las concentraciones de
bióxido de carbono, gas metano, vapor de agua, etc., a nivel mundial, que han estado
ocurriendo desde el inicio de la era industrial hasta al presente. Esto, como es bien
11-5

sabido, está corrompiendo el clima de nuestro planeta, al estarse calentando la tierra y

las aguas marinas.
Otros ejemplos, a los cuales se les pueden aplicar las series de tiempo, son los
incrementos en la radiación ultravioleta (en sus formas de UV-A y UV-B), que están
causando cáncer en la piel (en sus tres formas, melanoma, basal y escamoso) y daños
en la visión y alteraciones en la estructura del DNA.
Otras aplicaciones de las series de tiempo están relacionadas con los
crecimientos poblacionales o demográficos. Otros más están relacionados con la
producción industrial, la producción de energía, la economía, etc.
Tipos de funciones matemáticas para líneas de tendencia
Las ecuaciones o funciones matemáticas más comunes para aproximar los datos
gráficos de líneas de tendencia de un diagrama esparcido se dan el la tabla de abajo.
Aquí, las letras a, b y c representan valores constantes y, las letras X e Y, representan
las variables independientes y dependientes, respectivamente.
11-6

TABLA 11.0. Tabla mostrando los tipos de funciones matemáticas más comunes
usadas para líneas de tendencia. (Elaboración propia)
Función matemática Descripción
(1) y = a + bx Línea recta

(2) y = f(x) = ax2 + bx + c Curva cuadrática o parabólica
(3) y = ax3 + bx2 + cx + d Curva cúbica
(4) y = ax4 + bx3 + cx2 + dx + e Curva cuártica
(5) y = a + bx + cx2 + ... + an xn Polinomial generalizado
(6) y = abx o Log y = Log a + (Log b) x Curva exponencial
(7) y = axb o Log y = Log a + b Log x Curva geométrica
(8) y = 1/a + bx o 1/y = a + bx Función hipérbola
(9) y = pqbx o Log y = Log p + bx Log q Curva de Gompertz
(10) y = abx + g Curva exponencial modificada
(11) y = axb + g Curva geométrica modificada
(12) y = Ln x Función logarítmica
(13) y = a – (a – b) exp(-(c)|x|)d Función de Weibull
(14) y = a – (a – b)/(1 + (c|x|)d Función de Morgan-Mercer-Floding
(15) y = a(1 + (b – 1) exp(-c(x – d))1/(1 - b) Función de Richards
Para decidir, cuál función matemática es la más apropiada, para ajustar los
datos se puede hacer viendo un diagrama esparcido de la gráfica de los datos. Por
ejemplo, si el diagrama esparcido en papel semilogaritmo de Log (y) vs. x muestra
una relación lineal, la ecuación tiene la forma de la curva exponencial (6). Si se usa el
papel logaritmo completo, Log y-Log x, y los datos muestran una relación lineal, la
ecuación tiene la forma de una curva geométrica (7). De cualquier manera, los
programas de computadora, como el SAS, Minitab, NCSS, etc., son las mejores
herramientas para encontrar la función que mejor ajuste los datos.
Métodos para encontrar líneas de tendencia
1. El método a mano libre o visual.
11-7

2. El método de los cuadrados mínimos.

3. El método de semipromedios.
4. El método de promedios en movimiento.
1. El método a mano libre consiste en ajustar la tendencia de una línea o curva,
examinando la gráfica visualmente. Sin embargo, este método subjetivo depende
mucho del juicio individual.
2. El método de los cuadrados mínimos puede usarse para encontrar la ecuación de la
tendencia de la curva. Hay muchos programas de computadora que ayudan a esto.
3. El método del promedio del movimiento. Usando los órdenes apropiados del
movimiento de promedios, los patrones cíclicos, estacionales o irregulares pueden ser
eliminados dejando, solamente, la tendencia del movimiento.
4. Método de semipromedios. Este método consiste en separar los datos en dos partes
(preferentemente iguales) promediando los datos en cada parte, obteniendo dos
puntos en la gráfica de las series de tiempo. Enseguida, una línea de tendencia se
dibuja obteniendo dos puntos en la gráfica de las series de tiempo. Este método es
simple, pero puede dar resultados pobres. Este método es aplicable, solamente,
cuando la tendencia es lineal o aproximadamente lineal.
Método a mano libre para el ajustamiento de curvas
Este es el método más simple para las series de tiempo. Consiste en graficar las series
de tiempo y, por medio de observación visual, trazar una línea recta sobre los puntos.
Una vez hecho esto, se estima la ecuación de la línea recta para después calcular
cualquier valor de Yc sustituyendo el valor de X.
Método de los cuadrados mínimos
Este método es el más usado y preciso para encontrar la ecuación de una serie de
tiempo. Considérese la Figura 11.2 de abajo.
11-8

Figura 11.2. Gráfica mostrando el método de los cuadrados mínimos. Fuente: Spiegel
(1961).
Los puntos de los datos se dan por (X1, Y1), (X2, Y2), ..., (Xn, Yn). Para un valor dado de
X, digamos, X1, habrá una diferencia entre el valor Y1 y el valor correspondiente como
se determinó de la curva C. Como se ve en la gráfica, denotamos esta diferencia por
D1, la cual, en algunas ocasiones se refiere como la desviación, error o residual y
puede ser positivo, negativo o cero. Similarmente, correspondiendo a los valores de
X1, X2,.. Xn, obtenemos las desviaciones D2, D3, ..., Dn. La medición de “bondad de
ajuste” se da por la relación D21 + D22 + ... + D2n. De esta manera, si la suma de estos
cuadrados D21, D22, D23, etc., es pequeña, el ajuste es bueno. Pero, si la suma es
grande, el ajuste es malo, lo cual quiere decir que, el error o residual será grande,
indicando mucha variación entre los datos (Spiegel, 1961).
Definición. De todas las curvas que aproximan un grupo de datos en el sentido de los
cuadrados mínimos, la curva que tiene la propiedad de: D21 + D22 +... + D2n es un
mínimo y se llama la curva que mejor ajusta los datos. Una curva que tenga esta
propiedad se dice que ajusta los datos en el sentido del mejor cuadrado mínimo y se
llama la curva de los cuadrados mínimos. Por lo tanto, una línea que tenga esta
propiedad se llama la línea de los cuadrados mínimos, parábola de los cuadrados
mínimos, etc.
11-9

Línea de los cuadrados mínimos y parábolas de los cuadrados mínimos

La línea de los cuadrados mínimos, que aproxima el conjunto de puntos (X1, Y1), (X2,
Y2), ... (Xn, Yn), ya se discutió en el Capítulo 8, donde se habló de regresión y
correlación simple y múltiple. En ese capítulo se describieron modelos de regresión
de una línea recta. Análogamente, en el Capítulo 9, se describieron modelos
polinomiales, con una o más de dos variables independientes. También, en ese
capítulo se describieron modelos cúbicos. Siendo así, entonces, no se repetirán los
mecanismos usados para ajustar los datos a los modelos más apropiados.
Ejemplos usando las series de tiempo
Ejemplo #1. Se dan los datos de las siguientes concentraciones de bióxido de carbono
(CO2) (Y) en función del tiempo (X) en la tabla de abajo.
TABLA 11.1. Tabla mostrando los datos de CO2 en función del tiempo. (Elaboración
propia)
Conc. de CO2 (Y) | 1 2 4 4 5 7 8 9 10 11.5
(Millones de toneladas)
Tiempo (X) | 1900 1920 1930 1940 1950 1960 1970 1980 1990 2000
(Años codificados) | 1 3 4 6 8 9 11 14 15 16

(a) Trazar a mano en la gráfica obtenida los datos y una línea recta.
(b) Encontrar la ecuación de esta línea.
(c) Usando estadística encontrar la línea ajustada de los cuadrados mínimos y
comparar los valores de la pendiente y del intercepto Y encontrados en el inciso (b).
(d) Trazar en la gráfica la línea de la ecuación encontrada (a).
(e) Usando las ecuaciones encontradas en los incisos (b) y (c), estimar las
concentraciones de CO2 para el año 2010.
Solución:
11-10

(a) Graficamos los puntos (1,1), (2,3), (4,4), (6,4), (8,5), (9,7), (11,8), (14,9) en un
sistema de coordenadas rectangulares como se muestra en la Figura 11.3 de abajo.
Gráfica mostrando las concentraciones de bióxido de carbono vs. tiempo
12
10
8
Conc. de CO2 (Y)
0
0 2 4 6 8 10 12 14 16
Tiempo (X)
Figura 11.3. Gráfica mostrando las concentraciones de CO2 en función del tiempo.
(b) Para obtener la ecuación de la línea, usamos la gráfica de arriba y seleccionamos

cualesquiera de dos puntos sobre la línea trazada a mano, esto es, como punto P y
punto Q. Enseguida, estimamos las coordenadas de estos dos pares puntos que son (1,
1) y (12, 7.5). Ahora usando la ecuación de los cuadrados mínimos dada por la
función Y = a + b(X) y sustituyendo los valores de Y1 = 1, X1 = 0, Y2 = 7.5 y X2 = 12
nos da:
1.0 = a + b(0)
7.5 = a + b(12)
Resolviendo da
a = 1. 7.5 = 1 + b (12) y b = .542. Por lo tanto, la ecuación es:
Yc = 1 + .542(X)
Otra forma de hacer lo mismo es con la ecuación de la forma del punto de la
pendiente de una línea, Y = Y1 = m(X – X1), donde m = (Y2 – Y1)/(X2 – X1), para dar:
Y – Y1 = (Y2 – Y1)/(X2 – X1) (X – X1) (11-1)
11-11

Ahora sustituyendo los valores en (11-1) da:

Y – 1 = (7.5 – 1)/(12 – 0) (X – 0), Y – 1 = .542 X, esto es
Yc = 1 + .542 (X)
(c) Para encontrar la ecuación de la línea recta usamos métodos estadísticos, es decir,
usando las ecuaciones que estiman el intercepto en Y y la pendiente de la línea (Ver
capítulo de regresión).
(Σ Y)(Σ X 2) – (Σ X)(Σ XY)
a = ──────────────── (11-2)
n Σ X 2 – (Σ X)2
n ΣXY – (ΣX)(ΣY)
b = ──────────── (11-3)
n ΣX 2 – (ΣX)2
Para esto, podemos usar una calculadora de bolsillo o un programa de computadora y

estimamos las siguientes sumatorias:
ΣX = 56, ΣY = 40, ΣX 2 = 524, ΣY 2 = 256, (ΣY)2 = 1600, ΣXY = 364, ΣXΣY = 2240,
(ΣX)2 = 3136, n = 8.
Ahora, sustituyendo todos estos valores en las ecuaciones (11-2) y (11-3), para a y b
dan los siguientes resultados:
(40)(524) – (56)(364)
Intercepto en Y = a = ────────────── = .545
(8)(524) – (56)2
11-12

(8)(364) – (56)(40)
Pendiente = b = ───────────── = .636
(8)(524) – (56)2
Por lo tanto, la ecuación de los cuadrados mínimos es:

Yc = .545 + .636(X)
Aquí, se puede ver que esta ecuación es más precisa, que la obtenida por medio del
juicio individual.
Ahora, para trazar la línea en la gráfica correspondiente a la ecuación de arriba,
ponemos Y = 0 y resolvemos por X para dar X = -0.857. Enseguida, ponemos X = 0 y
resolvemos por Y para dar Y = 0.545. Enseguida, usando estos dos pares de
coordenadas, es decir, (–0.857, 0) y (0, 0.545) podemos trazar en la gráfica una línea
más precisa que aquélla hecha a mano.
(e) Usando las ecuaciones Y = 1 + .542(X) e Y = .545 + .636(X), cuando X = 17 (año
2010), nos da, respectivamente, Y = 10.21 y 11.36, este último valor siendo más
preciso que el anterior.
Ejemplo #2. Una compañía de programas de computadora reporta la demanda para un
determinado paquete de computadora, sobre un periodo de tres años. Los datos se dan
en la tabla de abajo:
Demanda trimestral (Y) | 37 22 62 80 77 95 94 131 148 155 126 161
Periodos de tiempo (X) | 1 2 3 4 5 6 7 8 9 10 11 12

(a) Visualmente ajustar una línea recta a los datos de la gráfica.
(b) Usando métodos estadísticos estimar la ecuación lineal de las series de tiempo, es
11-13

decir, Yc = a + b(X) Nótese que también se puede usar Y en lugar de Yc).

(c) Trazar una línea recta usando el par de coordenadas derivados de esta ecuación.
(d) Comparar la línea hecha a mano con la línea obtenida en (c).
(e) Predecir el valor de Yc cuando X = 140
Solución:
(a) La gráfica de abajo muestra el diagrama esparcido de los datos.
Gráfica mostrando la demanda trimestral vs. periodos de tiempo
180
160
140
Demanda trimestral (Y)
120
100
80
60
40
20
0 2 4 6 8 10 12
Periodos de tiempo (X)
Figura 11.4. Gráfica mostrando los datos del ejemplo de arriba. (Elaboración propia)
(a) Para obtener la ecuación de la línea, usamos la gráfica de arriba y seleccionamos
punto Q. Enseguida, estimamos las coordenadas de estos pares de puntos que son (1,
1) y (12, 7.5). Ahora, usando la ecuación de los cuadrados mínimos dada por:
Y = a + b(X) (11-3)
Ahora, sustituyendo todos los valores de Y1 = 1, X2 = 0 y Y2 = 7.5 y X2 = 12, en la
ecuación (11-3) de arriba, nos da:
1.0 = a + b(0) y 7.5 = a + b(12).
(b) Usando métodos estadísticos calculamos las sumatorias:
ΣX = 78, ΣX 2 = 650, (ΣX)2/n = 507, ΣY = 1188, ΣY 2 = 140774, (ΣY)2/n = 117,612
Intercepto Y = 20.55, Pendiente = 12.07, R = 0.95.
11-14

Por lo tanto, la ecuación de lineal de las series de tiempo para este problema es:
Yc = 20.55 + 12.07(X)
Para trazar una línea recta sobre los datos, seleccionamos dos puntos, digamos X = 3 y
X = 9 y resolviendo por Yc en la ecuación lineal de las series de tiempo, da las
coordenadas (3, 56.76) y (9, 129.18). Ahora, juntamos los puntos de estas dos
coordenadas y trazamos la línea como se ve en la figura de arriba, la cual muestra la
demanda trimestral (Y) por un periodo de 3 años (X).
(c) Para predecir el valor de Yc cuando X = 140 los podemos hacer por interpolación
usando la Figura 11.4 o, simplemente, sustituyendo el valor de X = 140 en la ecuación
de las series de tiempo, esto es:
Yc = 20.55 + 12.07(X)
= 20.55 + 12.07(140)
= 1,710.35
Ejemplo #3. En un estudio hipotético relacionado con los casos de SIDA, se da la
tabla de abajo. Estimar la función ajustada de tendencia usando análisis de tendencia
con una función exponencial.
11-15

TABLA 11.3. Tabla mostrando los casos de SIDA de un estudio hipotético.

Años Número hipotético de casos de SIDA
1981 1991 1,200 390,000
1982 1992 6,500 500,000
1983 1993 12,000 900,000
1984 1994 15,000 1,500,000
1985 1995 27,000 2,900,000
1986 1996 50,000 4,000,000
1987 1997 63,000 7,000,000
1988 1998 110,000 10,000,000
1989 1999 170,000 15,000,000
1990 2000 210,000 25,000,000
_____________________________________________________________________________________________
Hacer lo siguiente:
(a) Derivar la ecuación del modelo propuesto. Con este modelo predecir el número de
casos de SIDA para el año 2008. (El lector lo deberá hacer).
No. de casos de SIDA para periodo (1981-2000)

Growth Curve Model
Yt = 2097.90 * (1.60517**t)
30000000 Variable
A ctual
Fits
25000000
A ccuracy Measures
MA PE 2.04662E+01
20000000 MA D 2.83975E+05
Casos de SIDA
MSD 4.13874E+11
15000000
10000000
5000000
2 4 6 8 10 12 14 16 18 20
Index
Figura 11.5. Gráfica mostrando la relación de los casos de SIDA en función del
tiempo.
11-16

Ejercicios Capítulo 11.

11.1. Los datos de abajo muestran los millones de toneladas de bióxido de carbono
emitidos a la atmósfera durante los años de 1950 a 1955 en cierta región industrial.
________________________________________________________________
Años (X) Codificados Millones de toneladas de CO2 (Y)
1950 (50) 5
1951 (51) 8
1952 (52) 12
1953 (53) 15
1954 (54) 20
1955 (55) 23

(a) Graficar los datos del diagrama esparcido.
(b) Trazar una línea visualmente que mejor conecte los datos y derivar la ecuación y
estimar la ecuación por juicio individual.
(c) Estimar la ecuación de los cuadrados mínimos, es decir, usando métodos
estadísticos. (Y = 5 + 3.6 X)
(d) Predecir los millones de toneladas de CO2 (el valor de Y) para el aňo 2005.
Sugerencia: Para resolver estos problemas usar el programa de computadora Minitab
o SAS.
11.2. Este problema está relacionado con un estudio de contaminación atmosférica, de
partículas menores que 10 micras emitidas en cierta región industrial, durante el
periodo de 1984 a 1999. Los datos de las concentraciones promedio de las partículas
(a) Hacer una gráfica con los datos
(b) Usando métodos estadísticos (no de juicio individual) estimar la ecuación de la
11-17

línea de las series de tiempo (Yc) y trazar una línea recta sobre los datos gráficos
(c) Estimar las concentraciones promedio de partículas para el año 2003 por medio de
interpolación y por medio de la ecuación.
________________________________________________________________
Años Conc. promedio Años Conc. promedio
(ppm) (ppm)
1984 (84) 100 1992 (92) 116

1985 (85) 110 1993 (93) 117
1986 (86) 112 1994 (94) 118

1987 (87) 115 1995 (95) 120
1988 (88) 113 1996 (96) 123

1989 (89) 116 1997 (97) 125
1990 (90) 117 1998 (98) 124
1991 (91) 117 1999 (99) 125
11.3. Decir si la gráfica de abajo muestra tendencia o estacionalidad.
Ventas
Tiempo
11.4. Qué tipo de tendencia muestra la gráfica de abajo, es decir, ¿tendencia o
11-18

estacionalidad?
11.5. La gráfica de abajo muestra, ¿tendencia o estacionalidad? (tendencia)
Ventas anuales (unidades)
Precio
11-19

CAPITULO 11
Series de tiempo
Clasificación de los movimientos de las series de tiempo.- Tendencias a largo
plazo.- Componentes cíclicos de series de tiempo.- Variaciones estacionales.-
Variación irregular.- Métodos para encontrar líneas de tendencia.- Línea de los
cuadrados mínimos y parábolas de los cuadrados mínimos.-
Cualquier variable en función del tiempo, en sucesión, se llama series de tiempo. Las
series de tiempo son una secuencia de valores de variables tomadas en periodos de
tiempo sucesivos. La gráfica de una serie de tiempo es un diagrama, con el eje vertical
mostrando el valor observado (y) y, con el eje horizontal denotando el tiempo
(minutos, días, años, etc.).
Las gráficas como los histogramas o diagramas de tallo y hoja son métodos
visuales útiles para mostrar la variación en los datos. Sin embargo, el tiempo es un
factor muy importante que contribuye a la variación observada de los datos, que los
histogramas o las gráficas de caja no los toman en cuenta.
Las series de tiempo son un conjunto de observaciones tomadas a tiempos
específicos, usualmente, a intervalos iguales en un orden cronológico. Las series de
tiempo o secuencias de tiempo se definen como datos estadísticos que son
coleccionados, registrados u observados en incrementos de tiempos sucesivos. El
análisis de los datos de las series de tiempo es de interés para aquéllos quienes deseen
entender la naturaleza de los datos pasados y presentes. También, las series de tiempo
son de interés para aquellos investigadores, quienes deseen usar el conocimiento de
datos pasados para predecir el futuro.
Las aplicaciones de las series de tiempo son muy comunes en la economía,
pero también en la economía o la ingeniería. Por ejemplo:
11-1

1. Los gobiernos de las naciones industrializadas quieren saber los valores futuros de
las tasa de intereses monetarios. Las naciones en desarrollo quieren saber las
tendencias de las tasas de devaluación de la moneda. También es deseable predecir las
tasas de empleos o de desempleos. Igualmente, es importante saber los porcentajes de
los incrementos de los costos de la vida.
2. Otras aplicaciones de las series de tiempo son los pronósticos de las tasas de interés
para la construcción de viviendas y el costo de los materiales de construcción.
3. También las compañías manufacturadoras quieren pronosticar la demanda de sus
productos y sus acciones en el mercado.
4. En ingeniería ambiental, los activistas y protectores del medio ambiente quieren
saber cuáles son las tendencias en los aumento de los gases de invernadero, como el
bióxido de carbono (ocasionado por la emisiones vehiculares, la industria, fuegos
forestales, etc.) que están calentando la tierra, fundiendo los glaciares montañosos y
las capas polares y cambiando el clima mundial. También es interesante saber las
tendencias y los aumentos de la radiación ultravioleta, que tanto daño está causando al
ser humano, por la destrucción del ozono natural estratosférico, causado por la
irracionalidad del hombre moderno.
5. Las series de tiempo también aplican para saber las tendencias y pronósticos de los
incrementos de la población mundial, etc.
Cuando se grafican las mediciones de series de tiempo, a menudo se observan
tendencias, ciclos o variaciones importantes de los datos que, de otra manera, pasarían
inadvertidos.
Definición: Matemáticamente, una serie de tiempo se define por valores Y1, Y2,....... de
una variable Y, como la temperatura, concentraciones de contaminantes, como CO2,
SO2, partículas atmosféricas, etc., a tiempos t1, t2,.... Por lo tanto, Y es una función de t
11-2

simbolizada por Y = F(t).

Clasificación de los movimientos de las series de tiempo
Los movimientos característicos de las series de tiempo pueden clasificarse en cuatro
tipos llamados componentes de series de tiempo. Estos componentes de las series de
tiempo se describen como sigue:
1. Tendencias a largo plazo o movimientos seculares.
2. Movimientos o fluctuaciones cíclicas.
3. Variaciones estacionales o movimientos estacionales.
4. Variaciones o movimientos irregulares o aleatorios.
Tendencias a largo plazo
La tendencia a largo plazo o tendencia secular de una serie de tiempo es el
componente uniforme de las series que representan el crecimiento o decremento de
tiempos, sobre un periodo grande de tiempo. La tendencia secular se refiere a la
dirección general en la cual la gráfica de unas series aparecen moverse durante un
intervalo de tiempo. Por ejemplo, la población de los Estados Unidos durante los
últimos 40 años ha mostrado una tendencia de crecimiento de 137 millones de
personas a 246 en 1988. Las tendencias a largo plazo se ve en la Figura 11.0(a).
La determinación de las tendencias de las líneas y de las curvas se puede hacer
usando el método de ajustamiento de curvas. También se puede hacer por medio del
análisis de los diagramas esparcidos, para encontrar la función matemática que mejor
encaje en los datos.
Componentes cíclicos de series de tiempo
Los componentes cíclicos se refieren a los movimientos recurrentes de arriba y abajo
de las tendencias de las series de tiempo. Estas fluctuaciones de onda, llamadas ciclos
de los negocios, son diferentes de las fluctuaciones estacionales. Es decir, en el
11-3

sentido de que cubren periodos largos de tiempo, tienen causas diferentes y son
menos predecibles. Las fluctuaciones duran de 2 a 10 años, o más, cuando se miden
las ondas de cresta a cresta o de canal a canal. Ejemplos de componentes ciclos son
periodos de recesiones económicas o de periodos de inflación, demanda de productos
a largo plazo, etc. Esta situación se ve en la Figura 11.0 (b)
Variaciones estacionales
Este tipo de series de tiempo se refieren a variaciones periódicas, pero no están
limitadas a variaciones con la estación del año. Estos son patrones de periodos en las
series de tiempo que se completan en un año y, luego se repiten de acuerdo al mismo
patrón de periodo en años, subsecuentes. Por ejemplo, los precios de los mercados
financieros pueden mostrar tendencias altas o bajas en un día o en una semana.
En estudios ambientales, las fluctuaciones de los contaminantes muestran
tendencias cíclicas durante el día, como en el caso del estudio de las concentraciones
de ozono troposferico. Otros ejemplos son la producción de ciertos productos de
granjas agrícolas, el número de vehículos que pasan por cierto punto, entre dos sitios,
etc. La unidad de tiempo en variaciones estacionales es menos que un año, pero
pueden ser de un mes, una semana, o parte del día. Esta situación se ve en la Figura
11.0(c).
Variación irregular
Este es un tipo de variación que no está considerado por tendencias, ciclos o factores
estacionales, sino que se compone de fuerzas no recurrentes, esporádicas que no se
describen como o atribuidas a factores de tendencias, ciclos, o estacionales. Ejemplos
de variaciones irregulares son movimientos esporádicos de series de tiempo debido a
inundaciones, granizadas, heladas, tornados, huracanes, sequías, fuegos forestales,
etc.
11-4

Además, las figuras de abajo muestran ejemplos de algunos posibles patrones

de tendencia en series de tiempo. Por ejemplo, la Figura 11.1(a) muestra una
tendencia no lineal. La Figura 11.1(b) muestra una tendencia lineal que disminuye. La
Figura 11.1(c) muestra una gráfica sin tendencia.
Figura 11.0. Gráficas mostrando los tipos de tendencias. La gráfica (a) muestra una
tendencia de línea a largo plazo o de movimiento secular. La gráfica (b) muestra una
línea de tendencia a largo plazo con un movimiento cíclico sobrepuesto. La gráfica (c)
muestra tendencias cíclicas a largo plazo y movimientos estacionales. (Spiegel, 1961).
Figura 11.1. Ejemplos de algunos patrones de tendencias en series de tiempo.

Aplicaciones de las funciones de series de tiempo
Las aplicaciones en ingeniería de las tendencias a largo plazo o tendencias seculares
son varias. Ejemplos de estas aplicaciones son los incrementos de la contaminación
ambiental. Un ejemplo clásico es el aumento constante de las concentraciones de
bióxido de carbono, gas metano, vapor de agua, etc., a nivel mundial, que han estado
ocurriendo desde el inicio de la era industrial hasta al presente. Esto, como es bien
11-5

sabido, está corrompiendo el clima de nuestro planeta, al estarse calentando la tierra y

las aguas marinas.
Otros ejemplos, a los cuales se les pueden aplicar las series de tiempo, son los
incrementos en la radiación ultravioleta (en sus formas de UV-A y UV-B), que están
causando cáncer en la piel (en sus tres formas, melanoma, basal y escamoso) y daños
en la visión y alteraciones en la estructura del DNA.
Otras aplicaciones de las series de tiempo están relacionadas con los
crecimientos poblacionales o demográficos. Otros más están relacionados con la
producción industrial, la producción de energía, la economía, etc.
Tipos de funciones matemáticas para líneas de tendencia
Las ecuaciones o funciones matemáticas más comunes para aproximar los datos
gráficos de líneas de tendencia de un diagrama esparcido se dan el la tabla de abajo.
Aquí, las letras a, b y c representan valores constantes y, las letras X e Y, representan
las variables independientes y dependientes, respectivamente.
11-6

TABLA 11.0. Tabla mostrando los tipos de funciones matemáticas más comunes
usadas para líneas de tendencia. (Elaboración propia)
Función matemática Descripción
(1) y = a + bx Línea recta

(2) y = f(x) = ax2 + bx + c Curva cuadrática o parabólica
(3) y = ax3 + bx2 + cx + d Curva cúbica
(4) y = ax4 + bx3 + cx2 + dx + e Curva cuártica
(5) y = a + bx + cx2 + ... + an xn Polinomial generalizado
(6) y = abx o Log y = Log a + (Log b) x Curva exponencial
(7) y = axb o Log y = Log a + b Log x Curva geométrica
(8) y = 1/a + bx o 1/y = a + bx Función hipérbola
(9) y = pqbx o Log y = Log p + bx Log q Curva de Gompertz
(10) y = abx + g Curva exponencial modificada
(11) y = axb + g Curva geométrica modificada
(12) y = Ln x Función logarítmica
(13) y = a – (a – b) exp(-(c)|x|)d Función de Weibull
(14) y = a – (a – b)/(1 + (c|x|)d Función de Morgan-Mercer-Floding
(15) y = a(1 + (b – 1) exp(-c(x – d))1/(1 - b) Función de Richards
Para decidir, cuál función matemática es la más apropiada, para ajustar los
datos se puede hacer viendo un diagrama esparcido de la gráfica de los datos. Por
ejemplo, si el diagrama esparcido en papel semilogaritmo de Log (y) vs. x muestra
una relación lineal, la ecuación tiene la forma de la curva exponencial (6). Si se usa el
papel logaritmo completo, Log y-Log x, y los datos muestran una relación lineal, la
ecuación tiene la forma de una curva geométrica (7). De cualquier manera, los
programas de computadora, como el SAS, Minitab, NCSS, etc., son las mejores
herramientas para encontrar la función que mejor ajuste los datos.
Métodos para encontrar líneas de tendencia
1. El método a mano libre o visual.
11-7

2. El método de los cuadrados mínimos.

3. El método de semipromedios.
4. El método de promedios en movimiento.
1. El método a mano libre consiste en ajustar la tendencia de una línea o curva,
examinando la gráfica visualmente. Sin embargo, este método subjetivo depende
mucho del juicio individual.
2. El método de los cuadrados mínimos puede usarse para encontrar la ecuación de la
tendencia de la curva. Hay muchos programas de computadora que ayudan a esto.
3. El método del promedio del movimiento. Usando los órdenes apropiados del
movimiento de promedios, los patrones cíclicos, estacionales o irregulares pueden ser
eliminados dejando, solamente, la tendencia del movimiento.
4. Método de semipromedios. Este método consiste en separar los datos en dos partes
(preferentemente iguales) promediando los datos en cada parte, obteniendo dos
puntos en la gráfica de las series de tiempo. Enseguida, una línea de tendencia se
dibuja obteniendo dos puntos en la gráfica de las series de tiempo. Este método es
simple, pero puede dar resultados pobres. Este método es aplicable, solamente,
cuando la tendencia es lineal o aproximadamente lineal.
Método a mano libre para el ajustamiento de curvas
Este es el método más simple para las series de tiempo. Consiste en graficar las series
de tiempo y, por medio de observación visual, trazar una línea recta sobre los puntos.
Una vez hecho esto, se estima la ecuación de la línea recta para después calcular
cualquier valor de Yc sustituyendo el valor de X.
Método de los cuadrados mínimos
Este método es el más usado y preciso para encontrar la ecuación de una serie de
tiempo. Considérese la Figura 11.2 de abajo.
11-8

Figura 11.2. Gráfica mostrando el método de los cuadrados mínimos. Fuente: Spiegel
(1961).
Los puntos de los datos se dan por (X1, Y1), (X2, Y2), ..., (Xn, Yn). Para un valor dado de
X, digamos, X1, habrá una diferencia entre el valor Y1 y el valor correspondiente como
se determinó de la curva C. Como se ve en la gráfica, denotamos esta diferencia por
D1, la cual, en algunas ocasiones se refiere como la desviación, error o residual y
puede ser positivo, negativo o cero. Similarmente, correspondiendo a los valores de
X1, X2,.. Xn, obtenemos las desviaciones D2, D3, ..., Dn. La medición de “bondad de
ajuste” se da por la relación D21 + D22 + ... + D2n. De esta manera, si la suma de estos
cuadrados D21, D22, D23, etc., es pequeña, el ajuste es bueno. Pero, si la suma es
grande, el ajuste es malo, lo cual quiere decir que, el error o residual será grande,
indicando mucha variación entre los datos (Spiegel, 1961).
Definición. De todas las curvas que aproximan un grupo de datos en el sentido de los
cuadrados mínimos, la curva que tiene la propiedad de: D21 + D22 +... + D2n es un
mínimo y se llama la curva que mejor ajusta los datos. Una curva que tenga esta
propiedad se dice que ajusta los datos en el sentido del mejor cuadrado mínimo y se
llama la curva de los cuadrados mínimos. Por lo tanto, una línea que tenga esta
propiedad se llama la línea de los cuadrados mínimos, parábola de los cuadrados
mínimos, etc.
11-9

Línea de los cuadrados mínimos y parábolas de los cuadrados mínimos

La línea de los cuadrados mínimos, que aproxima el conjunto de puntos (X1, Y1), (X2,
Y2), ... (Xn, Yn), ya se discutió en el Capítulo 8, donde se habló de regresión y
correlación simple y múltiple. En ese capítulo se describieron modelos de regresión
de una línea recta. Análogamente, en el Capítulo 9, se describieron modelos
polinomiales, con una o más de dos variables independientes. También, en ese
capítulo se describieron modelos cúbicos. Siendo así, entonces, no se repetirán los
mecanismos usados para ajustar los datos a los modelos más apropiados.
Ejemplos usando las series de tiempo
Ejemplo #1. Se dan los datos de las siguientes concentraciones de bióxido de carbono
(CO2) (Y) en función del tiempo (X) en la tabla de abajo.
TABLA 11.1. Tabla mostrando los datos de CO2 en función del tiempo. (Elaboración
propia)
Conc. de CO2 (Y) | 1 2 4 4 5 7 8 9 10 11.5
(Millones de toneladas)
Tiempo (X) | 1900 1920 1930 1940 1950 1960 1970 1980 1990 2000
(Años codificados) | 1 3 4 6 8 9 11 14 15 16

(a) Trazar a mano en la gráfica obtenida los datos y una línea recta.
(b) Encontrar la ecuación de esta línea.
(c) Usando estadística encontrar la línea ajustada de los cuadrados mínimos y
comparar los valores de la pendiente y del intercepto Y encontrados en el inciso (b).
(d) Trazar en la gráfica la línea de la ecuación encontrada (a).
(e) Usando las ecuaciones encontradas en los incisos (b) y (c), estimar las
concentraciones de CO2 para el año 2010.
Solución:
11-10

(a) Graficamos los puntos (1,1), (2,3), (4,4), (6,4), (8,5), (9,7), (11,8), (14,9) en un
sistema de coordenadas rectangulares como se muestra en la Figura 11.3 de abajo.
Gráfica mostrando las concentraciones de bióxido de carbono vs. tiempo
12
10
8
Conc. de CO2 (Y)
0
0 2 4 6 8 10 12 14 16
Tiempo (X)
Figura 11.3. Gráfica mostrando las concentraciones de CO2 en función del tiempo.
(b) Para obtener la ecuación de la línea, usamos la gráfica de arriba y seleccionamos

punto Q. Enseguida, estimamos las coordenadas de estos dos pares puntos que son (1,
1) y (12, 7.5). Ahora usando la ecuación de los cuadrados mínimos dada por la
función Y = a + b(X) y sustituyendo los valores de Y1 = 1, X1 = 0, Y2 = 7.5 y X2 = 12
nos da:
1.0 = a + b(0)
7.5 = a + b(12)
Resolviendo da
a = 1. 7.5 = 1 + b (12) y b = .542. Por lo tanto, la ecuación es:
Yc = 1 + .542(X)
Otra forma de hacer lo mismo es con la ecuación de la forma del punto de la
pendiente de una línea, Y = Y1 = m(X – X1), donde m = (Y2 – Y1)/(X2 – X1), para dar:
Y – Y1 = (Y2 – Y1)/(X2 – X1) (X – X1) (11-1)
11-11

Ahora sustituyendo los valores en (11-1) da:

Y – 1 = (7.5 – 1)/(12 – 0) (X – 0), Y – 1 = .542 X, esto es
Yc = 1 + .542 (X)
(c) Para encontrar la ecuación de la línea recta usamos métodos estadísticos, es decir,
usando las ecuaciones que estiman el intercepto en Y y la pendiente de la línea (Ver
capítulo de regresión).
(Σ Y)(Σ X 2) – (Σ X)(Σ XY)
a = ──────────────── (11-2)
n Σ X 2 – (Σ X)2
n ΣXY – (ΣX)(ΣY)
b = ──────────── (11-3)
n ΣX 2 – (ΣX)2
Para esto, podemos usar una calculadora de bolsillo o un programa de computadora y

estimamos las siguientes sumatorias:
ΣX = 56, ΣY = 40, ΣX 2 = 524, ΣY 2 = 256, (ΣY)2 = 1600, ΣXY = 364, ΣXΣY = 2240,
(ΣX)2 = 3136, n = 8.
Ahora, sustituyendo todos estos valores en las ecuaciones (11-2) y (11-3), para a y b
dan los siguientes resultados:
(40)(524) – (56)(364)
Intercepto en Y = a = ────────────── = .545
(8)(524) – (56)2
11-12

(8)(364) – (56)(40)
Pendiente = b = ───────────── = .636
(8)(524) – (56)2
Por lo tanto, la ecuación de los cuadrados mínimos es:

Yc = .545 + .636(X)
Aquí, se puede ver que esta ecuación es más precisa, que la obtenida por medio del
juicio individual.
Ahora, para trazar la línea en la gráfica correspondiente a la ecuación de arriba,
ponemos Y = 0 y resolvemos por X para dar X = -0.857. Enseguida, ponemos X = 0 y
resolvemos por Y para dar Y = 0.545. Enseguida, usando estos dos pares de
coordenadas, es decir, (–0.857, 0) y (0, 0.545) podemos trazar en la gráfica una línea
más precisa que aquélla hecha a mano.
(e) Usando las ecuaciones Y = 1 + .542(X) e Y = .545 + .636(X), cuando X = 17 (año
2010), nos da, respectivamente, Y = 10.21 y 11.36, este último valor siendo más
preciso que el anterior.
Ejemplo #2. Una compañía de programas de computadora reporta la demanda para un
determinado paquete de computadora, sobre un periodo de tres años. Los datos se dan
en la tabla de abajo:
Demanda trimestral (Y) | 37 22 62 80 77 95 94 131 148 155 126 161
Periodos de tiempo (X) | 1 2 3 4 5 6 7 8 9 10 11 12

(a) Visualmente ajustar una línea recta a los datos de la gráfica.
(b) Usando métodos estadísticos estimar la ecuación lineal de las series de tiempo, es
11-13

decir, Yc = a + b(X) Nótese que también se puede usar Y en lugar de Yc).

(c) Trazar una línea recta usando el par de coordenadas derivados de esta ecuación.
(d) Comparar la línea hecha a mano con la línea obtenida en (c).
(e) Predecir el valor de Yc cuando X = 140
Solución:
(a) La gráfica de abajo muestra el diagrama esparcido de los datos.
Gráfica mostrando la demanda trimestral vs. periodos de tiempo
180
160
140
Demanda trimestral (Y)
120
100
80
60
40
20
0 2 4 6 8 10 12
Periodos de tiempo (X)
Figura 11.4. Gráfica mostrando los datos del ejemplo de arriba. (Elaboración propia)
(a) Para obtener la ecuación de la línea, usamos la gráfica de arriba y seleccionamos
punto Q. Enseguida, estimamos las coordenadas de estos pares de puntos que son (1,
1) y (12, 7.5). Ahora, usando la ecuación de los cuadrados mínimos dada por:
Y = a + b(X) (11-3)
Ahora, sustituyendo todos los valores de Y1 = 1, X2 = 0 y Y2 = 7.5 y X2 = 12, en la
ecuación (11-3) de arriba, nos da:
1.0 = a + b(0) y 7.5 = a + b(12).
(b) Usando métodos estadísticos calculamos las sumatorias:
ΣX = 78, ΣX 2 = 650, (ΣX)2/n = 507, ΣY = 1188, ΣY 2 = 140774, (ΣY)2/n = 117,612
Intercepto Y = 20.55, Pendiente = 12.07, R = 0.95.
11-14

Por lo tanto, la ecuación de lineal de las series de tiempo para este problema es:
Yc = 20.55 + 12.07(X)
Para trazar una línea recta sobre los datos, seleccionamos dos puntos, digamos X = 3 y
X = 9 y resolviendo por Yc en la ecuación lineal de las series de tiempo, da las
coordenadas (3, 56.76) y (9, 129.18). Ahora, juntamos los puntos de estas dos
coordenadas y trazamos la línea como se ve en la figura de arriba, la cual muestra la
demanda trimestral (Y) por un periodo de 3 años (X).
(c) Para predecir el valor de Yc cuando X = 140 los podemos hacer por interpolación
usando la Figura 11.4 o, simplemente, sustituyendo el valor de X = 140 en la ecuación
de las series de tiempo, esto es:
Yc = 20.55 + 12.07(X)
= 20.55 + 12.07(140)
= 1,710.35
Ejemplo #3. En un estudio hipotético relacionado con los casos de SIDA, se da la
tabla de abajo. Estimar la función ajustada de tendencia usando análisis de tendencia
con una función exponencial.
11-15

TABLA 11.3. Tabla mostrando los casos de SIDA de un estudio hipotético.

Años Número hipotético de casos de SIDA
1981 1991 1,200 390,000
1982 1992 6,500 500,000
1983 1993 12,000 900,000
1984 1994 15,000 1,500,000
1985 1995 27,000 2,900,000
1986 1996 50,000 4,000,000
1987 1997 63,000 7,000,000
1988 1998 110,000 10,000,000
1989 1999 170,000 15,000,000
1990 2000 210,000 25,000,000
_____________________________________________________________________________________________
Hacer lo siguiente:
(a) Derivar la ecuación del modelo propuesto. Con este modelo predecir el número de
casos de SIDA para el año 2008. (El lector lo deberá hacer).
No. de casos de SIDA para periodo (1981-2000)

Growth Curve Model
Yt = 2097.90 * (1.60517**t)
30000000 Variable
A ctual
Fits
25000000
A ccuracy Measures
MA PE 2.04662E+01
20000000 MA D 2.83975E+05
Casos de SIDA
MSD 4.13874E+11
15000000
10000000
5000000
2 4 6 8 10 12 14 16 18 20
Index
Figura 11.5. Gráfica mostrando la relación de los casos de SIDA en función del
tiempo.
11-16

Ejercicios Capítulo 11.

11.1. Los datos de abajo muestran los millones de toneladas de bióxido de carbono
emitidos a la atmósfera durante los años de 1950 a 1955 en cierta región industrial.
________________________________________________________________
Años (X) Codificados Millones de toneladas de CO2 (Y)
1950 (50) 5
1951 (51) 8
1952 (52) 12
1953 (53) 15
1954 (54) 20
1955 (55) 23

(a) Graficar los datos del diagrama esparcido.
(b) Trazar una línea visualmente que mejor conecte los datos y derivar la ecuación y
estimar la ecuación por juicio individual.
(c) Estimar la ecuación de los cuadrados mínimos, es decir, usando métodos
estadísticos. (Y = 5 + 3.6 X)
(d) Predecir los millones de toneladas de CO2 (el valor de Y) para el aňo 2005.
Sugerencia: Para resolver estos problemas usar el programa de computadora Minitab
o SAS.
11.2. Este problema está relacionado con un estudio de contaminación atmosférica, de
partículas menores que 10 micras emitidas en cierta región industrial, durante el
periodo de 1984 a 1999. Los datos de las concentraciones promedio de las partículas
(a) Hacer una gráfica con los datos
(b) Usando métodos estadísticos (no de juicio individual) estimar la ecuación de la
11-17

línea de las series de tiempo (Yc) y trazar una línea recta sobre los datos gráficos
(c) Estimar las concentraciones promedio de partículas para el año 2003 por medio de
interpolación y por medio de la ecuación.
________________________________________________________________
Años Conc. promedio Años Conc. promedio
(ppm) (ppm)
1984 (84) 100 1992 (92) 116

1985 (85) 110 1993 (93) 117
1986 (86) 112 1994 (94) 118

1987 (87) 115 1995 (95) 120
1988 (88) 113 1996 (96) 123

1989 (89) 116 1997 (97) 125
1990 (90) 117 1998 (98) 124
1991 (91) 117 1999 (99) 125
11.3. Decir si la gráfica de abajo muestra tendencia o estacionalidad.
Ventas
Tiempo
11.4. Qué tipo de tendencia muestra la gráfica de abajo, es decir, ¿tendencia o
11-18

estacionalidad?
11.5. La gráfica de abajo muestra, ¿tendencia o estacionalidad? (tendencia)
Ventas anuales (unidades)
Precio
11-19

CAPITULO 12
Selección del tamaño de la muestra
Derivación de la fórmula para estimar el tamaño más apropiado de la
muestra para el promedio.- Selección del tamaño de la muestra para dos
poblaciones.-
En estudios de diseños experimentales estadísticos es necesario estimar el tamaño

de la muestra más apropiado para la estimación de promedios, proporciones, etc.
La selección más apropiada del tamaño de la muestra es importante, porque no
queremos sacar un tamaño de muestra excesivamente grande, que va a ser muy
costoso. Por la misma razón, tampoco queremos sacar un tamaño de muestra
pequeño, que nos incline a aceptar hipótesis nulas, es decir, de cometer el error II.
De esta manera, el tamaño apropiado de la muestra es importante, porque tamaños
de muestras innecesariamente grandes son costosos y desperdician dinero y tiempo
y, también, porque tamaños de muestras pequeños dan resultados pobres.
Existen varias funciones estadísticas para determinar el tamaño más
apropiado de la muestra estadística, es decir, para estimar el promedio poblacional
µ, la varianza σ2, la desviación estándar σ, la proporción ρ, etc. Para estimar estos
parámetros usamos la distribución normal, pero es necesario saber si la población
muestreada es normal o aproximadamente normal. Esto se hace para las pruebas de
hipótesis usando los niveles de significancia de 0.05 y 0.01, que dan los
coeficientes críticos de 1.96 y 2.58, es decir, correspondientes a los niveles de
confianza de 95% y 99%.
En situaciones donde puede controlarse el tamaño de la muestra es posible
elegir un tamaño de muestra n, de modo que se tenga una confianza del 100(1 – α)
12-1

por ciento de que el error, al estimar, digamos µ, sea menor que el error
especificado E, esto es, lo que queremos arriesgar.
En la determinación del tamaño de la muestra en un experimento estadístico
tenemos que saber dos cosas:
1. Qué tan cerca deseamos que nuestra estimación esté del verdadero valor del
parámetro poblacional.
2. Qué tanta certeza deseamos que nuestra estimación esté dentro del número de
unidades seleccionadas del valor del parámetro.
muestra para el promedio
Para derivar la fórmula para estimar el tamaño óptimo de la muestra, usamos la
distribución de la estadística del promedio X . Por ejemplo, sabemos qué, de la
distribución del promedio X mostrada abajo, el intervalo µ ± 2σX contiene,
aproximadamente, el 95% de los valores de la estadística del promedio X .
Figura 12.0. Gráfica mostrando la distribución de la estadística del promedio.

Acordemente, si deseamos estar, a no más de E unidades de µ con nuestro
12-2

estimador estadístico del promedio X , entonces, dejamos que E = 2σX esto es,
E = 2 σ / √n (12-1)
Ahora, resolviendo por n da:
n = 4σ2 / E2 (12-2)
Esta función (12-2) tiene un coeficiente de confianza de (1 – α) = 0.9544. Si
queremos un coeficiente de confianza de (1 – α), entonces, se deja que:
zα/2 σX = E o bien zα/2 σ/√n = E (12-3)
Que resulta en la fórmula:
n = zα/2 σ2/E2 (12-4)
= (zα/2 σ/E)2 (12-5)
Donde:
zα/2 = valor de la distribución normal estándar de tal manera que, P(Z ≥ zα/2) = α/2.
Aquí, usualmente, los valores críticos de
zα/2 son de 1.97 y 2.58, σ = desviación estándar poblacional.
E = error máximo de la estimación
De acuerdo a la ecuación anterior, el error E es dado por:
E = zα/2(σ√n) (12-6)
Para poder usar la fórmula (12-4) necesitamos conocer (1 – α), E y σ. Si el
tamaño de la muestra es n ≥ 30 casos o si la población muestreada es normal,
entonces, se puede aproximar σ a s.
Definición: Si el promedio X se usa como estimación de µ, entonces, puede
tenerse una confianza del 100(1 – α) por ciento de que el error | X – µ| no será
mayor que una cantidad específica E cuando el tamaño de la muestra sea
n = (zα/2 σ / E)2. Esta función puede ser usada para determinar el tamaño de
12-3

muestra necesario, para producir buenos resultados a un grado de confianza

deseado y margen de error. No obstante, esta fórmula requiere de los valores de σ o
de σ2. Estos valores se pueden conocer de estudios previos o pueden ser
razonablemente, estimados de estudios anteriores o estudios pilotos.
Ejemplos ilustrando la determinación del tamaño de muestra más apropiado
para el promedio X
Ejemplo #1. Un consultor estadístico intenta usar el promedio de una muestra
aleatoria de tamaño n = 150, para estimar la aptitud mecánica promedio (promedio
mediante cierta prueba) de obreros de la línea de montaje de una industria. Si con
base en la experiencia, el estadístico puede suponer que σ = 6.2, entonces, para
estos datos, ¿qué puede afirmar este consultor, con probabilidad de 0.99, acerca de
la dimensión máxima del error E?
Solución:
Para estimar E usamos n = 150, σ = 6.2, zα/2 = z0.01/2 = 2.575.
Usando la fórmula (12-5) y sustituyendo da:
E = zα/2 (σ/√n)
= 2.575(6.2/√150)
= 1.30
Con este resultado, el estadístico puede afirmar, con un nivel de confianza de 99%
(o con una probabilidad de 0.99), que su error será cuando más de 1.30.
Ejemplo #2. Refiriéndose al problema anterior, supongamos ahora que el consultor
estadístico desea un nivel de confianza del 95%, siendo así, ¿cuál sería la magnitud
del error, E?
Solución:
Usando, nuevamente, la fórmula (12-6), con zα/2 = z0.05/2 = z.025 = 1.96
12-4

E = 1.96(6.2/√150) = 0.992
Aquí, nótese que debido a que queremos menos precisión (usando el nivel de
confianza de 95%) el error es más pequeño que si usamos el nivel de confianza de
99%. También es de notarse que, a medida que el tamaño de n se hace más grande,
el error E disminuye.
Ejemplo #3. En un estudio de química, en un artículo publicado en el Journal of
Heat Transfer, se describe un nuevo método para medir la conductividad térmica
del hierro Armco. Supóngase que se desea que el error promedio en la
conductividad térmica del hierro Armco sea menor que 0.05 Btu/hr-ft-oF, con un
nivel de confianza del 95%. Entonces, si de estudios previos se sabe que la
desviación estándar es de σ = 0.10, estimar el tamaño de muestra requerido.
Solución:
Aquí, zα/2 = z0.05/2 = z0.025 = ±1.96, σ = 0.10, E 0.05.
Usando la ecuación (12-4): n = (zα/2 σ/ E)2 y sustituyendo estos valores nos da:
n = [(1.96)(0.10) / 0.05)]2
= 15.37 ≈ 16
Nota 1. Siempre queremos redondear el tamaño de la muestra de manera que, el
número requerido en la muestra sea cuando menos adecuado, en lugar de un poco
adecuado. Esto es un convencionalismo.
Ejemplo #4. En un estudio de recolección de basura desechada por el sector
doméstico, es decir, del salvamento de basura reciclable, queremos estimar el
promedio del plástico desechado por las casas. ¿Qué tamaño de muestra de casas
debe ser seleccionado, aleatoriamente, si queremos estar seguros, en 99%, que el
promedio muestral esté dentro de 0.250 kilogramos del verdadero promedio
poblacional µ? Asumir que estudios pilotos dan una desviación estándar conocida
12-5

de σ = 1.100 kilogramos.
Solución:
Queremos un tamaño de muestra n, dado que α = 0.01 (99% de nivel de confianza)
de manera que, zα/2 = z0.01/2 = 2.575 (valor constante de la tabla de la distribución
normal con 99% nivel de confianza). Además, E = 0.250, σ = 1.100. Así, usando la
fórmula (12-5) nos da:
n = (zα/2 σ / E)2
= [(2.575)(1.100) / (0.250)]2
= 128.37
≈ 129
En conclusión, debemos de obtener una muestra, de cuando menos 129 casas
domésticas seleccionadas aleatoriamente (que están descartando el plástico). Con
semejante muestra, estaremos confiados en un 99% de que el promedio muestral
X estará dentro de 0.250 kilos de µ.
Ejemplo #5. Refiriéndose al ejemplo anterior, si quisiéramos tener resultados

menos precisos usando un margen de error de 0.500 kilos, calcular el tamaño de la
muestra n asumiendo las mismas condiciones anteriores.
Solución:
Usando la fórmula (12-4) obtenemos:
n = [(2.575)(1.100) / (0.500)]2
= 32.09
≈ 33
Se observan los siguientes puntos en la relación general entre el tamaño de la
muestra, la longitud deseada del intervalo 2E, el nivel de confianza 100(1 – α) por
ciento y σ:
12-6

1. Conforme disminuye la longitud del intervalo 2E, el tamaño requerido de la

muestra n aumenta para un valor fijo de σ y para el nivel de confianza
especificado.
2. A medida que σ aumenta, el tamaño requerido de la muestra n aumenta, para una
longitud deseada 2E fija y un nivel de confianza especificado.
3. Conforme aumenta el nivel de confianza, el tamaño requerido de la muestra n
aumenta para una longitud fija deseada 2E y una desviación estándar σ.
Selección del tamaño de la muestra para dos poblaciones
También se puede seleccionar el tamaño de la muestra, más apropiado, para la
diferencia de dos promedios. Por ejemplo, si se conocen las desviaciones estándar
de las muestras uno y dos, es decir, σ1 y σ2, y los tamaños de las dos muestras son
iguales, es decir, n1 = n2 = n, entonces, puede determinarse el tamaño más
apropiado de la muestra. Esto se hace de modo que se tenga una confianza de
100(1 – α) por ciento en que el error E en la estimación de la diferencia de µ1 – µ2,
por los promedios de las muestras X 1 – X 2 sea menor que E.
La ecuación usada para calcular el tamaño de la muestra más apropiado para
la diferencia de dos poblaciones es:
n = (zα/2 / E)2 (σ21 + σ22) (12-7)
Nota 1. Recuérdese que es necesario redondear n, si este valor no es un entero. Con
esto, se asegura que el nivel de confianza no sea menor que 100(1 – α) por ciento.
Ejemplo #6. Se prueban dos fórmulas diferentes de gasolina oxigenada para
reducir las emisiones de monóxido de carbono (CO) emitidas por los motores de
combustión interna. Se sabe de antemano que la varianza para la primera fórmula
es de σ21 = 1.5, mientras que la varianza para la segunda fórmula es de σ22 = 1.2.
¿Qué tamaño de muestra debe usarse para cada población muestreada, si se desea
12-7

tener una confianza del 95% de que el error, al estimar la diferencia entre los
promedios de las dos fórmulas diferentes, sea menor que 1?
Solución:
Aquí, usamos la fórmula (12-7) para calcular el tamaño de la muestra de dos
poblaciones, es decir,
n = (zα/2 / E)2 (σ21 + σ22)
Donde:
zα/2 = z0.05/2 = z.025 = 1.97, E = 1, σ21 = 1.5, σ22 = 1.2
Sustituyendo estos valores en la fórmula de arriba da:
n = (1.95 / 1)2 (1.5 + 1.2)
= 10.27 ≈ 11
Por lo tanto, el tamaño de la muestra para las poblaciones µ1 y µ2 es:
n = n1 = n2 = 11
12-8

12.1. Se sabe que la duración, en horas, de un foco de 75 watts tiene una
distribución, aproximadamente normal, con una desviación estándar de 25 horas.
Supóngase que se desea una confianza del 95% en que el error en la estimación de
la duración promedio sea menor que 5 horas. ¿Qué tamaño de muestra debe
usarse? (≈ 97)
12.2. Hacer el mismo problema que el anterior, pero ahora usando una confianza
de 99% y un error E = 1 y comparar los resultados.
12.3. Un ingeniero automotriz desea determinar el tiempo promedio que tardaría
un mecánico en girar las llantas de un auto. Este ingeniero quiere estimar, con una
confianza de 95%, que el promedio de su muestra es imprecisa en cuando más 0.50
minutos. Si sabe de estudios pilotos anteriores que la desviación estándar es de σ =
1.6 minutos, ¿qué tan grande deberá ser la muestra que debe de seleccionar,
aleatoriamente? Sugerencia: Usar la fórmula n = (zα/2 σ/E)2 (39.3 ≈ 40 mecánicos)
12.4. El director de cierta universidad desea usar el promedio de una muestra
aleatoria para estimar el monto promedio de tiempo que se les lleva a los
estudiantes para ir de un salón a otro y tomar sus clases sin llegar tarde. Para esto
desea afirmar con 99% de confianza que el error es cuando más de 0.25 minutos.
Experiencias anteriores estiman una desviación estándar de σ = 1.40 minutos.
Siendo así, ¿qué tan grande deberá ser la muestra que se deba tomar?
12.5. La Environmental Protection Agency (EPA) de los Estados Unidos desea
conducir una prueba de millaje de cierto modelo de un auto importado. El
ingeniero estadístico de la EPA desea estimar el promedio µ, de millas por galón
de combustible usado por este modelo, con 95% de nivel de confianza. Asumiendo
12-9

que σ = 2.5 millas por galón, ¿qué tamaño de muestra (número de autos de este
modelo) deberá tomar para conducir esta prueba? (n = 25)
12.6. Considerar el ejemplo 12.1 de la gasolina oxigenada, para la estimación del
tamaño de las muestras para las poblaciones uno y dos. Siendo así, estimar los
tamaños de las muestras apropiados, si queremos una confianza de 99% y el error
de la estimación de las diferencias entre los promedios sea menor que 4.
12-10

CAPITULO 12
Selección del tamaño de la muestra
muestra para el promedio.- Selección del tamaño de la muestra para dos
poblaciones.-
En estudios de diseños experimentales estadísticos es necesario estimar el tamaño

de la muestra más apropiado para la estimación de promedios, proporciones, etc.
La selección más apropiada del tamaño de la muestra es importante, porque no
queremos sacar un tamaño de muestra excesivamente grande, que va a ser muy
costoso. Por la misma razón, tampoco queremos sacar un tamaño de muestra
pequeño, que nos incline a aceptar hipótesis nulas, es decir, de cometer el error II.
De esta manera, el tamaño apropiado de la muestra es importante, porque tamaños
de muestras innecesariamente grandes son costosos y desperdician dinero y tiempo
y, también, porque tamaños de muestras pequeños dan resultados pobres.
Existen varias funciones estadísticas para determinar el tamaño más
apropiado de la muestra estadística, es decir, para estimar el promedio poblacional
µ, la varianza σ2, la desviación estándar σ, la proporción ρ, etc. Para estimar estos
parámetros usamos la distribución normal, pero es necesario saber si la población
muestreada es normal o aproximadamente normal. Esto se hace para las pruebas de
hipótesis usando los niveles de significancia de 0.05 y 0.01, que dan los
coeficientes críticos de 1.96 y 2.58, es decir, correspondientes a los niveles de
confianza de 95% y 99%.
En situaciones donde puede controlarse el tamaño de la muestra es posible
elegir un tamaño de muestra n, de modo que se tenga una confianza del 100(1 – α)
12-1

por ciento de que el error, al estimar, digamos µ, sea menor que el error
especificado E, esto es, lo que queremos arriesgar.
En la determinación del tamaño de la muestra en un experimento estadístico
tenemos que saber dos cosas:
1. Qué tan cerca deseamos que nuestra estimación esté del verdadero valor del
parámetro poblacional.
2. Qué tanta certeza deseamos que nuestra estimación esté dentro del número de
unidades seleccionadas del valor del parámetro.
muestra para el promedio
Para derivar la fórmula para estimar el tamaño óptimo de la muestra, usamos la
distribución de la estadística del promedio X . Por ejemplo, sabemos qué, de la
distribución del promedio X mostrada abajo, el intervalo µ ± 2σX contiene,
aproximadamente, el 95% de los valores de la estadística del promedio X .
Figura 12.0. Gráfica mostrando la distribución de la estadística del promedio.

Acordemente, si deseamos estar, a no más de E unidades de µ con nuestro
12-2

estimador estadístico del promedio X , entonces, dejamos que E = 2σX esto es,
E = 2 σ / √n (12-1)
Ahora, resolviendo por n da:
n = 4σ2 / E2 (12-2)
Esta función (12-2) tiene un coeficiente de confianza de (1 – α) = 0.9544. Si
queremos un coeficiente de confianza de (1 – α), entonces, se deja que:
zα/2 σX = E o bien zα/2 σ/√n = E (12-3)
Que resulta en la fórmula:
n = zα/2 σ2/E2 (12-4)
= (zα/2 σ/E)2 (12-5)
Donde:
zα/2 = valor de la distribución normal estándar de tal manera que, P(Z ≥ zα/2) = α/2.
Aquí, usualmente, los valores críticos de
zα/2 son de 1.97 y 2.58, σ = desviación estándar poblacional.
E = error máximo de la estimación
De acuerdo a la ecuación anterior, el error E es dado por:
E = zα/2(σ√n) (12-6)
Para poder usar la fórmula (12-4) necesitamos conocer (1 – α), E y σ. Si el
tamaño de la muestra es n ≥ 30 casos o si la población muestreada es normal,
entonces, se puede aproximar σ a s.
Definición: Si el promedio X se usa como estimación de µ, entonces, puede
tenerse una confianza del 100(1 – α) por ciento de que el error | X – µ| no será
mayor que una cantidad específica E cuando el tamaño de la muestra sea
n = (zα/2 σ / E)2. Esta función puede ser usada para determinar el tamaño de
12-3

muestra necesario, para producir buenos resultados a un grado de confianza

deseado y margen de error. No obstante, esta fórmula requiere de los valores de σ o
de σ2. Estos valores se pueden conocer de estudios previos o pueden ser
razonablemente, estimados de estudios anteriores o estudios pilotos.
Ejemplos ilustrando la determinación del tamaño de muestra más apropiado
para el promedio X
Ejemplo #1. Un consultor estadístico intenta usar el promedio de una muestra
aleatoria de tamaño n = 150, para estimar la aptitud mecánica promedio (promedio
mediante cierta prueba) de obreros de la línea de montaje de una industria. Si con
base en la experiencia, el estadístico puede suponer que σ = 6.2, entonces, para
estos datos, ¿qué puede afirmar este consultor, con probabilidad de 0.99, acerca de
la dimensión máxima del error E?
Solución:
Para estimar E usamos n = 150, σ = 6.2, zα/2 = z0.01/2 = 2.575.
Usando la fórmula (12-5) y sustituyendo da:
E = zα/2 (σ/√n)
= 2.575(6.2/√150)
= 1.30
Con este resultado, el estadístico puede afirmar, con un nivel de confianza de 99%
(o con una probabilidad de 0.99), que su error será cuando más de 1.30.
Ejemplo #2. Refiriéndose al problema anterior, supongamos ahora que el consultor
estadístico desea un nivel de confianza del 95%, siendo así, ¿cuál sería la magnitud
del error, E?
Solución:
Usando, nuevamente, la fórmula (12-6), con zα/2 = z0.05/2 = z.025 = 1.96
12-4

E = 1.96(6.2/√150) = 0.992
Aquí, nótese que debido a que queremos menos precisión (usando el nivel de
confianza de 95%) el error es más pequeño que si usamos el nivel de confianza de
99%. También es de notarse que, a medida que el tamaño de n se hace más grande,
el error E disminuye.
Ejemplo #3. En un estudio de química, en un artículo publicado en el Journal of
Heat Transfer, se describe un nuevo método para medir la conductividad térmica
del hierro Armco. Supóngase que se desea que el error promedio en la
conductividad térmica del hierro Armco sea menor que 0.05 Btu/hr-ft-oF, con un
nivel de confianza del 95%. Entonces, si de estudios previos se sabe que la
desviación estándar es de σ = 0.10, estimar el tamaño de muestra requerido.
Solución:
Aquí, zα/2 = z0.05/2 = z0.025 = ±1.96, σ = 0.10, E 0.05.
Usando la ecuación (12-4): n = (zα/2 σ/ E)2 y sustituyendo estos valores nos da:
n = [(1.96)(0.10) / 0.05)]2
= 15.37 ≈ 16
Nota 1. Siempre queremos redondear el tamaño de la muestra de manera que, el
número requerido en la muestra sea cuando menos adecuado, en lugar de un poco
adecuado. Esto es un convencionalismo.
Ejemplo #4. En un estudio de recolección de basura desechada por el sector
doméstico, es decir, del salvamento de basura reciclable, queremos estimar el
promedio del plástico desechado por las casas. ¿Qué tamaño de muestra de casas
debe ser seleccionado, aleatoriamente, si queremos estar seguros, en 99%, que el
promedio muestral esté dentro de 0.250 kilogramos del verdadero promedio
poblacional µ? Asumir que estudios pilotos dan una desviación estándar conocida
12-5

de σ = 1.100 kilogramos.
Solución:
Queremos un tamaño de muestra n, dado que α = 0.01 (99% de nivel de confianza)
de manera que, zα/2 = z0.01/2 = 2.575 (valor constante de la tabla de la distribución
normal con 99% nivel de confianza). Además, E = 0.250, σ = 1.100. Así, usando la
fórmula (12-5) nos da:
n = (zα/2 σ / E)2
= [(2.575)(1.100) / (0.250)]2
= 128.37
≈ 129
En conclusión, debemos de obtener una muestra, de cuando menos 129 casas
domésticas seleccionadas aleatoriamente (que están descartando el plástico). Con
semejante muestra, estaremos confiados en un 99% de que el promedio muestral
X estará dentro de 0.250 kilos de µ.
Ejemplo #5. Refiriéndose al ejemplo anterior, si quisiéramos tener resultados

menos precisos usando un margen de error de 0.500 kilos, calcular el tamaño de la
muestra n asumiendo las mismas condiciones anteriores.
Solución:
Usando la fórmula (12-4) obtenemos:
n = [(2.575)(1.100) / (0.500)]2
= 32.09
≈ 33
Se observan los siguientes puntos en la relación general entre el tamaño de la
muestra, la longitud deseada del intervalo 2E, el nivel de confianza 100(1 – α) por
ciento y σ:
12-6

1. Conforme disminuye la longitud del intervalo 2E, el tamaño requerido de la

muestra n aumenta para un valor fijo de σ y para el nivel de confianza
especificado.
2. A medida que σ aumenta, el tamaño requerido de la muestra n aumenta, para una
longitud deseada 2E fija y un nivel de confianza especificado.
3. Conforme aumenta el nivel de confianza, el tamaño requerido de la muestra n
aumenta para una longitud fija deseada 2E y una desviación estándar σ.
Selección del tamaño de la muestra para dos poblaciones
También se puede seleccionar el tamaño de la muestra, más apropiado, para la
diferencia de dos promedios. Por ejemplo, si se conocen las desviaciones estándar
de las muestras uno y dos, es decir, σ1 y σ2, y los tamaños de las dos muestras son
iguales, es decir, n1 = n2 = n, entonces, puede determinarse el tamaño más
apropiado de la muestra. Esto se hace de modo que se tenga una confianza de
100(1 – α) por ciento en que el error E en la estimación de la diferencia de µ1 – µ2,
por los promedios de las muestras X 1 – X 2 sea menor que E.
La ecuación usada para calcular el tamaño de la muestra más apropiado para
la diferencia de dos poblaciones es:
n = (zα/2 / E)2 (σ21 + σ22) (12-7)
Nota 1. Recuérdese que es necesario redondear n, si este valor no es un entero. Con
esto, se asegura que el nivel de confianza no sea menor que 100(1 – α) por ciento.
Ejemplo #6. Se prueban dos fórmulas diferentes de gasolina oxigenada para
reducir las emisiones de monóxido de carbono (CO) emitidas por los motores de
combustión interna. Se sabe de antemano que la varianza para la primera fórmula
es de σ21 = 1.5, mientras que la varianza para la segunda fórmula es de σ22 = 1.2.
¿Qué tamaño de muestra debe usarse para cada población muestreada, si se desea
12-7

tener una confianza del 95% de que el error, al estimar la diferencia entre los
promedios de las dos fórmulas diferentes, sea menor que 1?
Solución:
Aquí, usamos la fórmula (12-7) para calcular el tamaño de la muestra de dos
poblaciones, es decir,
n = (zα/2 / E)2 (σ21 + σ22)
Donde:
zα/2 = z0.05/2 = z.025 = 1.97, E = 1, σ21 = 1.5, σ22 = 1.2
Sustituyendo estos valores en la fórmula de arriba da:
n = (1.95 / 1)2 (1.5 + 1.2)
= 10.27 ≈ 11
Por lo tanto, el tamaño de la muestra para las poblaciones µ1 y µ2 es:
n = n1 = n2 = 11
12-8

12.1. Se sabe que la duración, en horas, de un foco de 75 watts tiene una
distribución, aproximadamente normal, con una desviación estándar de 25 horas.
Supóngase que se desea una confianza del 95% en que el error en la estimación de
la duración promedio sea menor que 5 horas. ¿Qué tamaño de muestra debe
usarse? (≈ 97)
12.2. Hacer el mismo problema que el anterior, pero ahora usando una confianza
de 99% y un error E = 1 y comparar los resultados.
12.3. Un ingeniero automotriz desea determinar el tiempo promedio que tardaría
un mecánico en girar las llantas de un auto. Este ingeniero quiere estimar, con una
confianza de 95%, que el promedio de su muestra es imprecisa en cuando más 0.50
minutos. Si sabe de estudios pilotos anteriores que la desviación estándar es de σ =
1.6 minutos, ¿qué tan grande deberá ser la muestra que debe de seleccionar,
aleatoriamente? Sugerencia: Usar la fórmula n = (zα/2 σ/E)2 (39.3 ≈ 40 mecánicos)
12.4. El director de cierta universidad desea usar el promedio de una muestra
aleatoria para estimar el monto promedio de tiempo que se les lleva a los
estudiantes para ir de un salón a otro y tomar sus clases sin llegar tarde. Para esto
desea afirmar con 99% de confianza que el error es cuando más de 0.25 minutos.
Experiencias anteriores estiman una desviación estándar de σ = 1.40 minutos.
Siendo así, ¿qué tan grande deberá ser la muestra que se deba tomar?
12.5. La Environmental Protection Agency (EPA) de los Estados Unidos desea
conducir una prueba de millaje de cierto modelo de un auto importado. El
ingeniero estadístico de la EPA desea estimar el promedio µ, de millas por galón
de combustible usado por este modelo, con 95% de nivel de confianza. Asumiendo
12-9

que σ = 2.5 millas por galón, ¿qué tamaño de muestra (número de autos de este
modelo) deberá tomar para conducir esta prueba? (n = 25)
12.6. Considerar el ejemplo 12.1 de la gasolina oxigenada, para la estimación del
tamaño de las muestras para las poblaciones uno y dos. Siendo así, estimar los
tamaños de las muestras apropiados, si queremos una confianza de 99% y el error
de la estimación de las diferencias entre los promedios sea menor que 4.
12-10

APENDICE A. LISTA DE TABLAS
TABLA 1. Probabilidades binomiales acumuladas
TABLA 2. Probabilidades de Poisson acumuladas
TABLA 3. Áreas bajo la curva normal P(z ≤ zo)
TABLA 4. Puntos porcentuales de t[λ;ν] de la distribución de t de Estudiante
TABLA 5. Puntos porcentuales de χ2( λ;ν) de la distribución de JI cuadrada
TABLA 6. Función de gamma incomplete
TABLA 7. Valores críticos para la distribución de F P(F ≤ Fo)
TABLA 8. Puntos porcentuales de la distribución de r10

Fuente: Daniel W. W. y James Terrell. Business Statistics. Houghton Mifflin

Company (1989).
Por ejemplo, si F(X) = P(X ≤ x), y si p = 0.20, x = 2, n = 7, entonces,

F(2) = P(X ≤ 2) = 0.8520
Apéndice A-1

TABLA 1. Probabilidades binomiales acumuladas (Continuación)
Apéndice A-2

Apéndice A-3

Apéndice A-4

Apéndice A-5

Apéndice A-6

Tabla 1. Probabilidades binomiales acumuladas (Continuación)
Apéndice A-7

Apéndice A-8

Apéndice A-9

Apéndice A-10

Apéndice A-11

Apéndice A-12

Apéndice A-13

Apéndice A-14

Apéndice A-15

Apéndice A-16

Apéndice A-17

Apéndice A-18

Apéndice A-19

Apéndice A-20

Apéndice A-21

Apéndice A-22

Apéndice A-23

Apéndice A-24

Apéndice A-25

TABLA 2. Probabilidades acumuladas de Poisson.
c
F(c) = P(X ≤ c) = Σ µx e-µ / x!
x=0
Fuente: Morris Hamburg. Statistical Analysis for Decision Making. Harcourt Brace
Javanovich, Inc. (1991).
Ejemplo: Si µ = 1.00 y x = c = 2, entonces, F(2) = P(X ≤ 2) = 0.9200
Apéndice A-26

TABLA 2. Probabilidades acumuladas de Poisson (Continuación)
Apéndice A-27

Apéndice A-28

Apéndice A-29

TABLA 3. Áreas bajo la curva normal
Fuente: Daniel W. W. y James Terrel. Business Statistics. Houghton Mifflin

Company (1989).
Apéndice A-30

TABLA 3. Áreas bajo la curva normal (Continuación)
Apéndice A-31

TABLA 3. Áreas bajo la curva normal (Continuación)
Apéndice A-32

TABLA 3. Áreas bajo la curva normal. (Continuación)
Apéndice A-33

TABLA 3. Áreas bajo la curva normal. (Continuación)
Apéndice A-34

TABLA 4. Puntos porcentuales de t(λ;ν) de la distribución de t de Estudiante.
____________________________________________________________________
Fuente: Dunn, O. J. y Virginia A. Clark. Applied Statistics: Analysis of Variance and
Regression. John Wiley and Sons, Inc., New York (1974).
Ejemplo de interpolación usando ν = 32 grados de libertad con λ = 0.95
35 – 1.609 (32 – 30)/(35 – 30) = X/(1.697 - 1.690), x = .0028

32 – x Enseguida agregar .0028 a 1.690 para dar 1.6923.
30 – 1.697 Por lo tanto, el valor de t[.95;32] = 1.693
Apéndice A-35

TABLA 4. Puntos porcentuales de t(λ;ν) de la distribución de t de
Estudiante (Continuación).
________________________________________________
Apéndice A-36

TABLA 5. Distribución de JI cuadrada (χ2).
Fuente: Mario F. Triola. Elementary Statistics. Addison-Wesley Publishing Company

(1995).
Apéndice A-37

Tabla 7. Valores críticos para la distribución F(P)F ≤ Fo)
____________________________________________________________
Fuente: J. L. Devore. Probabilidad y Estadística para Ingeniería y Ciencias.
Thomson Learning (2001).
Apéndice A-38

TABLA 7. Valores críticos para la distribución F (P(F ≤ Fo)
(Continuación).
_______________________________________________________________
Apéndice A-39

TABLA 7. Valores críticos para la distribución F (P(F ≤ Fo) (Continuación).
_________________________________________________________________
Apéndice A-40

TABLA 7. Valores críticos para la distrtibución F (P(F ≤ Fo) Continuación).
________________________________________________________________
Apéndice A-41

TABLA 7. Valores críticos para la distribución F (P(F ≤ Fo) (Continuación).
_____________________________________________________________________
Apéndice A-42

x
TABLA 6. Función de gamma incompleta. F(x;α) = ∫ 0 1 / Γ(α) yα-1 e-ydy
Fuente: Jay L. Devore. Probabilidad y estadística para ingeniería y ciencias. Thomson-

Learning (2001).
Apéndice A-43

TABLA 8. Puntos porcentuales de la distribución de r10.
________________________________________________________
Fuente: Dunn, O. J. y Virginia A. Clark. Applied Statistics: Analysis of
Variance and Regression. John Wiley and Sons, Inc. New York (1974)
Apéndice A-44

Apéndice B
Bibliografía
Anderson, D. R, Dennis J. Sweeney, Thomas A. Williams. Estadística para

Administración y Economía. Vol. 1. Séptima edición. South-Western
Publishing (1999).
Berthoux, P. M., Linfield C. Brown. Statistics for Environmental Engineers.

Lewis Publishers (1994).
Brown L. Theodore, H. Eugene Le May, Jr., Bruce E. Bursten. Chemistry.

The Central Science. Prentice Hall, Upper Saddle River, New Jersey. Eight
Edition, (2000).
Daniel, W. W., James C. Terrell. Business Statistics. First Edition. Houghton

Mifflin Company (1989).
Devore, J. L. Probabilidad y Estadística Para Ingeniería y Ciencias. Quinta

edición. Thomson Learning. (2001)
Dunn, O. J., Virginia A. Clark. Applied Statistics: Analysis of Variance and

Regression. John Wiley and sons. New York London, Sydney, Toronto
(1974).
Freund, J.E. Statistics. A First Course. Second Edition. Prentice Hall, Inc.
Englewood Cliffs, New Jersey (1976).
Goldber, Ss. Probability. An Introduction. Published by Prentince Hall, Inc.

Englewood Cliffs, N. J. (1960).
Hamburg, M. Statistical Analysis for Decision Making. Fifth Edition.

Harcourt Brace Jovanovich, Publishers. Academic Press. San Diego, New
York, Chicago, Austin, Washington, D. C. (1989).
Herber A., Raymond R. Colton. Statistical Methods. Fourth Edition. Barnes

and Noble, Inc. New York (1966).

Jerome, C. R. Li. Statistical Inference. Distributed by Edwards Brothers, Inc.
Ann Arbor, Michigan. (1964).
Keller, G., Brian Warrock, Henry Bartel. Statistics for Management and
Economics: a Systematic Approach. Second Edition. Wardsworth Publishing
Company, Belmont, California (1990).
Kutner, M. H., Chistopher J. Nachtsheim, John Neter, Willliam Li. Applied

Linear Statistical Models. Fifth edition. McGraw-Hill International Edition
(2005).
Lapin, L. L. Statistics for Modern Business Decisions. Harcourt Brace

Javanovich, Inc. (1981).
Manly, B. F. J. Statistics for Environmental Science and Management.

Chapman & Hall/CRC (2001).
Montgomery, D., George C. Runger. Probabilidad y Estadística Aplicadas a

la Ingeniería. Mcgraw Hill Interamericana Editores, S.A. De C. V. (1996).
Montgomery, D. C. Elizabeth A. Peck, G. Geoffrey Vining. Introducción al

Análisis Lineal. Grupo Patria Cultural, S. A. De C. V. (2002).
Myers, W., Raymond H. Myers. Probabilidad y Estadística. Cuarta Edición.

Mcgraw Hill/Interamericana de Mexico, S. S. De C. V. (1992).
Neter, J., Michael H. Kutner, Christopher J. Nachtsheim, William

Wasserman. Applied Linear Regression Models. Third Edition. Irwin (1996).
Sanders, D. H. Statistics. A First Course. Fifth Edition.
Sawyer, N.C., Perry L. Mccarty. Chemistry for Sanitary Engineers. Second

Edition. Mcgraw-Hill (1967).
Smith, G. Statistical Reasoning. Allyn And Bacon, Inc. Boston London

Sydney Toronto (1985).
Spiegel, M. R. Schaum's Outline of Theory and Problems of Statistics.

Schaum Publishing Company, New York (1961).

Standard Methods for the Examination of Water and Wastewater. Prepared
And Published Jointly by: American Public Health Association, American
Water Works Association and Water Pollution Control Federation. American
Public Health Association, 1015 Eighteenth Street, N.W., Washington, D.C.
20036 (1971).
McClave, J. T., George Benson. Statistics for Business and Economics.

Second Edition. Dellen Publishing Company, San Francisco and Santa Clara,
California (1982).
Triola, M. F. Elementary Statistics. Sixth Edition. Copyright 1995. Addison-

Wesley Publishing Company, Inc.
Walpole, E. R., Raymond H. Myers. Probability and Statistics for Engineers

and Scientists. Fifth Edition. Prentice Hall, Inc. (1993).
Yamane, T. Statistics, an Introductory Analysis. Harper & Row, Publishers,

Incorporated, 49 East 33rd Street, New York 16, N.Y. (1964).

Apéndice C
Papel de gráfica
Papel de gráfica semilogarítmico de 5 ciclos
Papel de gráfica logarítmico
Papel de gráfica de probabilidad
Papel de gráfica de probabilidad binomial para analizar datos enumerados
Papel de gráfica de frecuencia relativa acumulada en función de la variable

aleatoria X
Apéndice C

Papel de escala semilogarítmica

Papel de gráfica de escala logarítmica completa.

Papel de gráfica logarítmico de 2x2 ciclos

Papel de gráfica de escala aritmética

Papel de grafica de frecuencia relativa acumulada en función de la
variable aleatoria X

Apéndice D
Índice
Ajustamiento de curvas, 9-29, 9-30

Análisis de varianza en dos sentidos, 7-25
Análisis de varianza en tres sentidos, 7-36 – 7-39
Análisis de varianza, 7-1
análisis de varianza de bloques completamente aleatorizados, 7-17
diseños de ANOVA completamente aleatorizados, 7-3
ANOVA con tres factores usando el Minitab, 7-50, 7-53
Aplicaciones de la distribución de Poisson, 4-1. Ver distribución de Poisson
dentro de sus propios términos y como una aproximación a la distribución binomial, 4-6, 4-7
Aplicaciones de la distribución de t de Estudiante, 6-4
Aplicaciones de la distribución hipergeométrica usando el programa Minitab, 3-40
Áreas bajo la curva normal, 5-7
Autocorrelación, 8-30, 8-58, 9-9, 9-47, 9-48, 9-49, 9-54
Axiomas y propiedades básicas de la probabilidad, 2-6
Coeficiente de correlación R, 8-9, 8-17

Coeficiente de determinación R2, 8-8, 8-17
Combinaciones ortogonales, 7-43
Combinaciones, 2-32
Complemento, 2-11
Componentes de la prueba de hipótesis, 5-41
Cuartiles, 1-30, 1-31
Curvas de frecuencia, tipos de, 1-19
Desviación estándar, 1-10

Desviaciones del promedio, 1-13
Diagramas de árbol, 2-24
Diagramas de tallo y hoja, 1-27
Diagramas de Venn, 2-18
Diferencias entre la distribución de Poisson y la distribución binomial, 4-2
Distribución binomial, 3-1
Distribución de gamma, 5-28
Distribución de JI cuadrada, 6-24
Distribución de Poisson, 4-1
Distribución de t de Estudiante, 6-1
Distribución de Weibull, 5-31
Distribución exponencial, 5-24
Distribución hipergeométrica, 3-1, 3-31
Distribución normal estándar y distribución normal no estándar, 5-10
Distribución normal, 5-6
Distribuciones de frecuencia, 1-17, 1-21
Distribuciones de probabilidad continua, 5-1
Durbin-Watson, prueba de autoacorrelación, 9-48- 9-53

Estadística inferencial, 5-34
Error estándar, 1-14, 5-36
Estadística, definición de, 1-1
Estadística no paramétrica, 10-1
Ensayo de Bernoulli, 3-2
Ecuación de la línea de regresión, 8-2
Eventos mutuos excluyentes, 2-13
Eventos dependientes e independientes, 2-16
Estocástico, definición de, 2-18
Estadística descriptiva, 1-1, 1-3
Espacio muestral, 2-8
Evaluaciones de los modelos de regresión, 8-37, 9-8
Función de densidad de probabilidad de la variable aleatoria continua x, 5-2

Fórmula empírica para hacer interpolaciones para calcular el valor de la probabilidad p, 5-53
Fórmula fundamental del cálculo, 5-3
Heteroscedasticidad y homoscedasticidad, 9-55

prueba de hipótesis para heteroscedasticidad, 9-57
Hipótesis nula para β, α, y µY|X, 8-11, 8-12
Histogramas, 1-20
Interacción con ANOVA de dos factores, 7-26, 7-27, 7-28

Interacción con ANOVA de tres factores, 7-39, 7-40
Intersección de eventos, 2-10
Intervalo de confianza para el coeficiente β, 8-10
Intervalos de confianza para la diferencia de dos promedios (µ1 – µ2) con varianzas conocidas, 5-72
Intervalos de confianza para proporciones, 5-77
Intervalos de confianza para σ2 usando la distribución de JI cuadrada, 6-28
Intervalos de confianza para µ con varianza σ2, conocida, 5-32
Intervalo de confianza para α, 8-10
Kolmogorov-Smirnov para prueba de normalidad, 5-63

Kurtosis, 1-14
Mediana, 1-6
Medidas de tendencia central, 1-4
Moda, 1-7
Modelo de regresión cuadrático con 2 y 3 variables independientes, con y sin interacción, 9-24
Modelo de regresión múltiple generalizado, 8-33
Modelo de segundo orden con mas de dos variables independientes con interacción, 9-5
Modelos de regresión múltiple con mas de dos variables regresoras, 8-34
Modelos de regresión no lineales y de regresión logística, 9-24, 9-25
Multicolinealidad, diagnóstico de, 8-17, 8-58, 9-21, 9-31, 9-32, 9-33

Niveles de significancia, 5-33, 5-38, 5-40, 4-49, 5-50, 5-55, 9-5
Niveles de confianza. Ver niveles de significancia
Papel de probabilidad, uso de, 1-24

Permutaciones, 2-28
Probabilidad de frecuencia relativa, 2-4
Probabilidad subjetiva, 2-5Rango, 1-13
Probabilidad, definición de, 2-1, 2-2
Promedio aritmético, 1-4, 1-5
Promedio geométrico, 1-9
Prueba de bondad de ajuste usando la distribución de JI cuadrada, 6-31, 9-32
Prueba de Kruskall-Wallis para funciones no paramétricas, 10-4
Prueba de normalidad, usando la función de Anderson-Darling, 5-63
Prueba de White para heteroscedasticidad, 9-56
Pruebas de hipótesis para el promedio µ usando la t de Estudiante, 6-5
Pruebas de hipótesis para observaciones pares, 6-6
Pruebas de hipótesis para proporciones, 5-74, 5-75
Pruebas de hipótesis, 5-34
Pruebas estadísticas para seleccionar el mejor modelo de regresión, 9-15
Rango, 1-13
Regla aditiva para eventos mutuos excluyentes y no mutuos excluyentes, 2-40
Regla de multiplicación mas general, 2-22
Regla de multiplicación para eventos dependientes e independientes, 2-37
Regla del producto para pares ordenados, 2-12
Regla factorial, 2-23
Regresión lineal múltiple, 8-1
Regresión múltiple usando el paquete Minitab, 8-54
Regresión polinomial, 9-31
modelos polinomiales de segundo orden, 9-2
modelos polinomiales de tercer orden, 9-3
Relación entre la distribución binomial y la distribución de Poisson, 3-6
Relación entre la distribución binomial y la distribución normal, 3-6
Relación entre la distribución hipergeométrica y la distribución binomial, 3-33
Series de tiempo, 11-1

clasificaciones de los movimientos de series de tiempo, 11-3
Sesgo, 1-14
Tamaño de la muestra, 12-1

Técnicas de conteo, 2-20
Tipos de errores I y II, 5-37
Triángulo de Pascal, 3-4
Unión, 2-9
Valor de la probabilidad p, 5-48, 5-50, 6-16, 6-17

metodología para calcular el valor de p, 5-42
Valores atípicos extremos, diagnóstico de, 9-31

Valores de varianza inflada (VIF), 9-33
Variable aleatoria continua definición de, 1-4, 2-18
Variable aleatoria discreta, 2-18
Variable aleatoria estandarizada z, 1-12, 5-8
Variable aleatoria, definición de, 2-17
Varianza, 1-10

Métodos Estadísticos para La Ingeniería Ambiental y La Ciencia - Dr. Héctor Adolfo Quevedo Urias

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Métodos Estadísticos para La Ingeniería Ambiental y La Ciencia - Dr. Héctor Adolfo Quevedo Urias

Uploaded by

Copyright:

Available Formats

UNIVERSIDAD AUTÓNOMA DE CD.

INSTITUTO DE INGENIERÍA Y TECNOLOGÍA

DEPARTAMENTO DE INGENIERÍA CIVIL Y AMBIENTAL

MÉTODOS ESTADÍSTICOS PARA LA

DR. HÉCTOR ADOLFO QUEVEDO URIAS

Es propiedad del autor. Queda hecho el depósito que marca la ley.

Para revisores, críticos o reseñadores literarios, a quienes se les asigne la tarea de

Impreso en Cd. Juárez, Chihuahua, México

Library of Congress Cataloging in Publication Data

La dirección electrónica del libro es:

Estadísticos e-Books & Papers

Capítulo 1 Estadística Descriptiva 1-1

Definición de estadística.- Población y muestra.- Estadística inductiva y de inferencia.-

Capítulo 2 Probabilidad 2-1

Probabilidad de frecuencia relativa.- Probabilidad subjetiva.- Axiomas y propiedades

Capítulo 3 Distribución Binomial e Hipergeométrica 3-1

Aplicaciones generales de la distribución binomial.- Relación entre la distribución normal

Capítulo 4 Distribución de Poisson 4-1

Aplicaciones de la distribución de Poisson.- Condiciones que se requieren para aplicar la

Capítulo 5 Distribuciones de Probabilidad Continua 5-1

Función de densidad de probabilidad de la variable aleatoria continua X.- Fórmula

Estadísticos e-Books & Papers

Capítulo 6 Distribuciones de t de Estudiante, JI Cuadrada y F 6-1

Propiedades de la distribución de t de Estudiante.- Intervalos de confianza para el promedio

Capítulo 7 Análisis de Varianza 7-1

Diseños de análisis de varianza completamente aleatorizados y diseño de bloques

Capítulo 8 Regresión Lineal Simple y Múltiple 8-1

Suposiciones del modelo de regresión lineal.- Ecuaciones normales para calcular el

Estadísticos e-Books & Papers

Capítulo 9 Regresión Polinomial 9-1

Modelos polinomiales de segundo orden (k = 2) con una variable independiente.- Modelo de

Capítulo 10 Estadística no Paramétrica. El modelo de Distribución

Ventajas de los métodos no paramétricos.- Desventajas de los métodos no paramétricos.-

Capítulo 11 Series de Tiempo 11-1

Clasificación de los movimientos de las series de tiempo.- Tendencias a largo plazo.-

Capítulo 12 Selección del Tamaño de la Muestra 12-1

Derivación de la fórmula para estimar el tamaño más apropiado de la muestra para el

Apéndice A Lista de Tablas Estadísticas Apéndice-A

Estadísticos e-Books & Papers

Apéndice C Papel de gráfica Apéndice-C

Apéndice D Índice Apéndice-D

Estadísticos e-Books & Papers

Estadísticos e-Books & Papers

Estadísticos e-Books & Papers

Estadísticos e-Books & Papers

Definición de estadística.- Población y muestra.- Estadística inductiva y de

Estadística es el estudio de los métodos para coleccionar, resumir, organizar,

y hacer mediciones de la resistencia del colorante. La muestra consiste de 10 piezas

presentación de los resultados o conclusiones.

trabajos de investigación y en la producción de calidad y construcción. Por ejemplo,

Medidas de tendencia central o de localización: el promedio, la mediana y la

Xjs, desde j = 1 hasta j = N.

Nótese la diferencia entre ΣX 2 y (ΣX)2

La suma de los cuadrados (SS), es decir, la suma de las desviaciones al cuadrado de X

de población, µ y se define como:

X = (X1 + X2 + X3 +...+ Xn) / n = ΣXj / n = ΣX/n (1-2)

Con las distribuciones continuas, es de notarse qué, el promedio aritmético, X

Ejemplo #4. El promedio de una muestra de observaciones de ciertos análisis de

X = (8 + 3 + 5 + 12 + 10)/5 = 38/5 = 7.6

Ejemplo # 6. La muestra de observaciones 3, 4, 4, 5, 6, 8, 8, 10 tiene una mediana de

Relación entre el promedio aritmético, la mediana y la moda

Figura 1.0. Distribución oblicua Figura 1.1. Distribución oblicua

Ejemplo #11. Encontrar el promedio aritmético, la mediana y la moda para una