Ajuste de Curva SnapStat

STATGRAPHICS – Rev.
9/14/2006
Ajustando Curva SnapStat
Resumen
El procedimiento Ajustando Curva SnapStat crea un resumen de una pagina que describe la
relación entre un solo factor cuantitativo X y una variable dependiente Y. Cualquiera de los 27
modelos lineales y no lineales pueden ser ajustados, usando mínimos cuadrados o un
procedimiento de estimación resistente. Pruebas son corridas para determinar la significancia
estadística del modelo. El modelo ajustado es graficado con límites de confianza y/o limites de
predicción, y los residuos son graficados también. Los cálculos realizados son un subconjunto de
aquéllos realizados en el procedimiento de Regresión Simple. Aunque, la salida es ajustada a una
sola pagina.
Ejemplo StatFolio: curvefitsnapstat.sgp
Datos del Ejemplo:

El archivo nonlin.sf3 contiene datos de clorina disponible en muestras de un producto como una
función del numero de semanas desde que fue producido. Los datos, de Draper y Smith (1998),
consisten de n = 44 muestras, una porción de las cuales es mostrada enseguida:
Semanas Clorina
8 0.49
8 0.49
10 0.48
10 0.47
10 0.48
10 0.47
12 0.46
12 0.46
12 0.45
12 0.43
14 0.45
14 0.43
14 0.43
… …
© 2005 por StatPoint, Inc. Ajustando Curva SnapStat - 1

STATGRAPHICS – Rev. 9/14/2006
Entrada de Datos
La caja de dialogo de entrada requiere los nombres de las columnas que contienen la variable
dependiente Y y la variable independiente X:
• Y: columna numérica que contiene las n observaciones para la variable dependiente Y.
• X: columna numérica que contiene los n valores para la variable independiente X.
• Selección: Selección de un subconjunto de los datos.

Salida
La salida del SnapStat consiste de una sola pagina de estadísticas graficas y numéricas.
SnapStat: Ajuste de Curva

Gráfico del Modelo Ajustado
chlorine = 0.48551 - 0.00271679*weeks Con intervalos de previsión del 99.0% Límites de Predicción
0.5
Estimado Valor-P
Intercepto 0.48551 0.0000 0.48
Pendiente -0.00271679 0.0000
0.46
chlorine
Coeficiente de Correlación = -0.8651
R-cuadrada = 74.83 porciento 0.44
R-cuadrado (ajustado para g.l.) = 74.23 porciento
0.42
Error Estándar Est. = 0.015385
Error Absoluto medio = 0.012834 0.4
Estadístico Durbin-Watson = 0.992081 (P=0.0001)
Autocorrelación de residuos en Retraso 1 = 0.451981 0.38
0 10 20 30 40 50
weeks
Predicho Límite de Pred. Límite de Pred.

Gráfico de Residuos X Y Inferior 99.0% Superior 99.0%
chlorine = 0.48551 - 0.00271679*weeks 0.0 0.48551 0.441062 0.529959
2.1 10 0.458342 0.415599 0.501086
20 0.431175 0.389169 0.47318
Rediduo Estudentizado
30 0.404007 0.361723 0.44629

1.1 40 0.376839 0.333279 0.420398
50 0.349671 0.303921 0.39542
0.1 Predicho Límite de Conf. Límite de Conf.
X Y Inferior 99.0% Superior 99.0%
0.0 0.48551 0.469617 0.501404
-0.9 10 0.458342 0.448146 0.468539
20 0.431175 0.424742 0.437607
30 0.404007 0.395954 0.41206
-1.9 40 0.376839 0.363634 0.390044
0 10 20 30 40 50 50 0.349671 0.330437 0.368905
weeks
Gráfico de chlorine Gráfico de Residuos

chlorine = 0.48551 - 0.00271679*weeks
0.5 2.1
Rediduo Estudentizado
0.48
1.1
0.46
observado
0.44 0.1
0.42
-0.9
0.4
0.38 -1.9
0.38 0.4 0.42 0.44 0.46 0.48 0.5 0 10 20 30 40 50
predicho número de fila

Modelo Estadístico (Izquierda superior)
La parte superior izquierda de la salida muestra el modelo estadístico ajustado y estadísticas del
resumen. Incluidos están:
• Modelo Ajustado: Identificación del modelo que fue ajustado. Por defecto, un modelo lineal
de la forma
Y=a+bX (1)
Es ajustado, aunque un modelo diferente puede ser seleccionado usando Opciones del
Análisis.
• Coeficientes: Los coeficientes estimados y P-valores que resultan de la pruebas t de las

hipótesis nulas que corresponden a que el parámetro del modelo sea igual a 0. P-Valores
pequeños (menores que 0.05 si se opera a un nivel de confianza del 95%) indican que un
coeficiente del modelo es significativamente distinto de 0. En los datos del ejemplo, ambos
intercepto y pendiente son estadísticamente significantes.
• Estadísticas: Resumen de las estadísticas para el modelo ajustado, incluyendo:
Coeficiente de correlación- Mide la fuerza de la relación lineal entre Y y X en una escala de-
1 (correlación lineal negativa perfecta) a +1 (correlación lineal positiva perfecta). En los
datos del ejemplo, la correlación entre chlorine y weeks es relativamente fuerte, con el signo
negativo indicando que la chlorine cae como las weeks crecen.
R-cuadrada – Representa el porcentaje de variabilidad en Y el cual ha sido explicado por el

modelo ajustado, en una escala de 0% a 100%. Para los datos del ejemplo, la regresión ha
acumulado alrededor del 75% de variabilidad en las medidas de chlorine. El restante 25% es
atribuido a las desviaciones alrededor de la línea, lo cual puede ser debido a otros factores,
para mediar el error, o una falla del modelo lineal para ajustar los datos.
R-cuadrada Ajustada – El estadístico R-cuadrada, ajustado por el número de coeficientes en

el modelo. Este valor es frecuentemente usado para comparar modelos con diferente número
de coeficientes.
Error Estándar de Est. – la desviación estándar estimada de los residuos (la desviación
estándar alrededor del modelo). Este valor es usado para crear límites de predicción para
observaciones nuevas.
Media del Error Absoluto – El valor absoluto promedio de los residuos.
Estadístico Durbin-Watson – Una medida de la correlación serial en los residuos. Si los

residuos varían aleatoriamente, este valor debería ser cercano a 2. Un P-valor pequeño indica
que un patrón no aleatorio existe en los residuos. Para datos registrados en el tiempo, un P-
valor pequeño indicaría que alguna tendencia en el tiempo no ha sido tomada en cuenta. En
el ejemplo actual, un P-valor pequeño es indicador de que el modelo lineal no ha ajustado
bien a todos los datos, esto tan bien puede ser visto en los residuos graficados.

Lag 1 Autocorrelación Residual – la correlación estimada entre residuos consecutivos, en
una escala de –1 a 1. Valores lejanos de 0 indican que una estructura significante permanece
no tomada en cuenta por el modelo.
Opciones del Análisis
• Tipo de Modelo: El modelo que será estimado. Todos los modelos mostrados pueden ser
linealizados transformando X, Y, o ambos. Cuando ajustamos un modelo no lineal,
STATGRAPHICS primero transforma los datos, después se ajusta el modelo, y entonces
invierte la transformación para desplegar los resultados.
• Ajuste Alternativo: Un procedimiento de estimación alternativo. Si se selecciona, un

conjunto adicional de estimadores serán adheridos a la salida. Dos métodos de estimación
son disponibles, ambos de los cuales son resistentes a datos atípicos:
Minimizar desviaciones absolutas – Minimiza la suma de los valores absolutos de las

desviaciones alrededor del modelo ajustado.
Uso de medianas de 3 grupos – Usa el método de Tukey de ajustar una línea recta, en la
cual los datos son divididos en 3 grupos de acuerdo al valor de X, las medianas son
calculadas dentro de cada grupo, y una línea es determinada de las 3 medianas.
Los modelos disponibles son mostrados en la siguiente tabla:

Modelo Ecuación Transformación en Y Transformación en X

Lineal y = β0 + β1 x ninguna ninguna
y = ( β0 + β1 x )
Raíz cuadrada-Y 2 Raíz cuadrada ninguna
Exponencial
y = e( β0 +β1x ) Logaritmo ninguna
y = (β 0 + β 1 x )
Reciproco-Y −1 reciproco ninguna
Cuadrada-Y y = β 0 + β1 x cuadrada ninguna
Raíz cuadrada-X y = β0 + β1 x ninguna raíz cuadrada

Doble raíz cuadrada
(
y = β 0 + β1 x ) 2 raíz cuadrada raíz cuadrada
Log-Y raíz cuadrada-X

y = e (β 0 + β 1 x ) Logaritmo raíz cuadrada
Reciproco-Y raíz cuadrada-X

(
y = β 0 + β1 x ) −1 reciproco raíz cuadrada
Cuadrada-Y raíz cuadrada-X cuadrada raíz cuadrada

y = β 0 + β1 x
Logarítmica-X y = β0 + β1 ln( x ) ninguna Logaritmo
Raíz cuadrada-Y log-X y = (β 0 + β 1 ln( x) ) raíz cuadrada Logaritmo
2
Multiplicativa y = β0 x β1 Logaritmo Logaritmo

Reciproco-Y log-X 1 reciproco Logaritmo
y=
β 0 + β 1 ln( x)
Cuadrada-Y log-X y = β 0 + β 1 ln( x) cuadrada Logaritmo
Reciproco-X y = β 0 + β1 / x ninguna reciproco

Raíz cuadrada-Y reciproco-
y = (β 0 + β 1 / x ) raíz cuadrada reciproco
2
X
S-curve
y = e( β0 + β1 / x ) Logaritmo reciproco
y = [β 0 + β / x ]
Doble reciproco −1 reciproco reciproco
Cuadrada-Y reciproco-X y = β 0 + β1 / x cuadrada reciproco
Cuadrada-X y = β 0 + β1 x 2 ninguna cuadrada
y = (β 0 + β 1 x 2 )
Raíz cuadrada-Y cuadrada-X 2 raíz cuadrada cuadrada
Log-Y cuadrada-X
y = e (β 0 + β 1 x ) Logaritmo cuadrada
2
y = (β 0 + β 1 x 2 )
Reciproco-Y cuadrada-X −1 reciproco cuadrada
Doble cuadrada cuadrada cuadrada

y = β 0 + β1 x 2
e( β0 + β1x )
Logístico y/(1-y) ninguna
y=
[1 + e( β0 + β1x )
]
Log probit y = ϕ ( β0 + β1 ln( x )) ϕ −1 ( y ) Logaritmo
(inv. normal)

Grafica del Modelo Ajustado (derecha superior)
Este panel muestra el o los modelos ajustados, junto con límites de confianza y predicción. La
grafica incluye:
• La línea del mejor ajuste o la ecuación de predicción:
yˆ = aˆ + bˆx (2)
Esta es la ecuación que seria usada para predecir valores de la variable dependiente Y
dados los valores de la variable independiente X. Note que hace un trabajo relativamente
bueno de escoger mucha de la correlación negativa entre chlorine y weeks.
• Intervalos de Confianza para la respuesta media en X. Estos son limites internos en la

grafica anterior y describen que tan buena es la localización de la línea que ha sido
estimada dada la muestra de datos disponible. Así como el tamaño de la muestra n
aumente, estos limites se harán mas delgados. Deberías notar que el ancho de los límites
varía como una función de X, con la línea estimada más precisamente cerca del valor
promedio x .
• Limites de Predicción para nuevas observaciones. Estos son limites externos en la

grafica anterior y describen que tan bien se podría predecir donde una nueva observación
debería yacer. Sin importar el tamaño de la muestra, nuevas observaciones variaran
alrededor de la línea verdadera con una desviación estándar igual a σ.
La inclusión de limites de confianza y predicción y su defecto nivel de confianza es determinado

por lo fijado en la pestaña ANOVA/Regresión de la caja de dialogo Preferencias, accesible en el
menú Editar.
Grafica de Residuos (izquierda central)

La grafica en el centro izquierdo grafica los residuos de el modelo ajustado contra X. En una
regresión los residuos son definidos por
ei = y i − yˆ i (3)
i.e., los residuos son la diferencia entre los valores observados y el modelo ajustado.
Dependiendo de lo fijado en la pestaña ANOVA/Regresión de la caja de dialogo Preferencias,
accesible en el menú Editar, tú puedes graficar cualquiera de los siguientes:
1. Residuos Ordinarios – Los residuos del ajuste de mínimos cuadrados.

2. Residuos Estandarizados – La diferencia entre los valores observados yi y los valores
predichos ŷ i cuando el modelo es ajustado usando todas las observaciones excepto la i-
esima, dividida por el error estándar estimado. Los residuos son algunas veces llamados
residuos borrados externamente, ya que ellos miden que tan lejos este cada valor del
modelo ajustado, cuando este modelo es ajustado usando todos los datos excepto los
puntos que son considerados. Esto es importante, ya que un dato atípico grande puede
afectar el modelo de tal forma que no parecería un valor inusual.
Pronósticos (derecha central)

La tabla en el centro derecho muestra predicciones del modelo ajustado en los valores
seleccionados de X. Incluidos en la salida están:
• X – El valor de la variable independiente en el cual la predicción será hecha.
• Y Predicha- El valor predicho de la variable dependiente usando el modelo ajustado.
• Limites de Predicción- Limites de predicción para nuevas observaciones en el nivel de

confianza seleccionado (corresponde a los limites exteriores de la grafica del modelo
ajustado).
• Limites de Confianza- Limites de confianza para el valor medio de Y en el nivel de

confianza seleccionado (corresponde a los limites interiores de la grafica del modelo
ajustado).
Por ejemplo, en X = 30 weeks, la mejor predicción de la cantidad media chlorine disponible es

0.404, aunque esto podría ser fácilmente cualquiera entre 0.396 y 0.412. Adicionalmente, uno
podría predecir con un 95% de confianza que cualquier muestra después de 30 de producida
caería entre 0.362 y 0.446.
Observado contra Predicho (izquierda inferior)

La parte inferior izquierda muestra una grafica de los valores observados de Y contra los valores
predichos por el modelo ajustado. Si el modelo ajusta bien, los puntos deberían estar
aleatoriamente esparcidos alrededor de la línea diagonal. Algunas veces es posible ver curvatura
en esta gráfica, lo cual indicaría la necesidad de un modelo curvilíneo en lugar de uno lineal.
Cualquier cambio en la variabilidad de valores pequeños de X a valores grandes de X puede
también indicar la necesidad de transformar la variable dependiente antes de ajustar el modelo.
En la grafica anterior, la variabilidad parece ser bastante constante. Aunque, alguna evidencia de
curvatura es presente.
Residuos Contra Número de Renglón (derecha inferior)

La parte derecha inferior muestra una grafica de observaciones contra numero de renglón el la
hoja de datos. Cualquier patrón no aleatorio indicaría un factor inexplicable en los datos. Esto
podría ser debido a tendencias en el tiempo (si los datos están en orden secuencial) o la
necesidad de un modelo curvilíneo (si la hoja de datos esta ordenada por X.
Cálculos
Para detalles en los cálculos realizados, ver la documentación de Regresión Simple.

Ajuste de Curva SnapStat

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Ajuste de Curva SnapStat

Uploaded by

Copyright:

Available Formats

STATGRAPHICS – Rev.

Ajustando Curva SnapStat

Ejemplo StatFolio: curvefitsnapstat.sgp

Datos del Ejemplo:

© 2005 por StatPoint, Inc. Ajustando Curva SnapStat - 1

• Y: columna numérica que contiene las n observaciones para la variable dependiente Y.

• X: columna numérica que contiene los n valores para la variable independiente X.

• Selección: Selección de un subconjunto de los datos.

© 2005 por StatPoint, Inc. Ajustando Curva SnapStat - 2

SnapStat: Ajuste de Curva

Predicho Límite de Pred. Límite de Pred.

30 0.404007 0.361723 0.44629

Gráfico de chlorine Gráfico de Residuos

© 2005 por StatPoint, Inc. Ajustando Curva SnapStat - 3

• Coeficientes: Los coeficientes estimados y P-valores que resultan de la pruebas t de las

• Estadísticas: Resumen de las estadísticas para el modelo ajustado, incluyendo:

R-cuadrada – Representa el porcentaje de variabilidad en Y el cual ha sido explicado por el

R-cuadrada Ajustada – El estadístico R-cuadrada, ajustado por el número de coeficientes en

Media del Error Absoluto – El valor absoluto promedio de los residuos.

Estadístico Durbin-Watson – Una medida de la correlación serial en los residuos. Si los

© 2005 por StatPoint, Inc. Ajustando Curva SnapStat - 4

Opciones del Análisis

• Ajuste Alternativo: Un procedimiento de estimación alternativo. Si se selecciona, un

Minimizar desviaciones absolutas – Minimiza la suma de los valores absolutos de las

Los modelos disponibles son mostrados en la siguiente tabla:

© 2005 por StatPoint, Inc. Ajustando Curva SnapStat - 5

Modelo Ecuación Transformación en Y Transformación en X

Cuadrada-Y y = β 0 + β1 x cuadrada ninguna

Raíz cuadrada-X y = β0 + β1 x ninguna raíz cuadrada

Log-Y raíz cuadrada-X

Reciproco-Y raíz cuadrada-X

Cuadrada-Y raíz cuadrada-X cuadrada raíz cuadrada

Multiplicativa y = β0 x β1 Logaritmo Logaritmo

Reciproco-X y = β 0 + β1 / x ninguna reciproco

Cuadrada-Y reciproco-X y = β 0 + β1 / x cuadrada reciproco

Cuadrada-X y = β 0 + β1 x 2 ninguna cuadrada

Doble cuadrada cuadrada cuadrada

© 2005 por StatPoint, Inc. Ajustando Curva SnapStat - 6

• La línea del mejor ajuste o la ecuación de predicción:

• Intervalos de Confianza para la respuesta media en X. Estos son limites internos en la

• Limites de Predicción para nuevas observaciones. Estos son limites externos en la

La inclusión de limites de confianza y predicción y su defecto nivel de confianza es determinado

Grafica de Residuos (izquierda central)

1. Residuos Ordinarios – Los residuos del ajuste de mínimos cuadrados.

Pronósticos (derecha central)

• X – El valor de la variable independiente en el cual la predicción será hecha.

• Y Predicha- El valor predicho de la variable dependiente usando el modelo ajustado.

• Limites de Predicción- Limites de predicción para nuevas observaciones en el nivel de

• Limites de Confianza- Limites de confianza para el valor medio de Y en el nivel de

Por ejemplo, en X = 30 weeks, la mejor predicción de la cantidad media chlorine disponible es

Observado contra Predicho (izquierda inferior)

Residuos Contra Número de Renglón (derecha inferior)

Para detalles en los cálculos realizados, ver la documentación de Regresión Simple.

© 2005 por StatPoint, Inc. Ajustando Curva SnapStat - 8

You might also like