You are on page 1of 5

I.

Lectura de datos

# importar los ratios en la base de datos empresas


empresas <- read.delim('clipboard')
attach(empresas)
# Mostrar slo algunas de las primeras filas
head(empresas)
# Nombres de las empresas
names(empresas)

II.

Datos discrepantes

# Diagrama de Cajas (Boxplots) para analizar distribucin y datos atpicos


boxplot(Y)
# Mltiples Diagrama de Cajas (Boxplots)
boxplot(R1,R2,R3,R4)
# Todos los Diagrama de Cajas (Boxplots) para cada columna de una matriz
boxplot(empresas, use.cols=TRUE)
# Los estadsticos correspondientes al grfico del boxplot
boxplot.stats(Y)
boxplot(Y, notch=TRUE) # TRUE para mostrar la muesca
boxplot(R1)
boxplot.stats(R1)
boxplot(R2)
boxplot.stats(R2)
# Extremo de la barba inferior, la bisagra inferior, la mediana, la bisagra superior y el
extremo de la barba superior.
$stats

# Extremo de la barba inferior, la bisagra inferior, la mediana, la bisagra superior y el extremo de la barba superior #

$n # n el nmero de observaciones no-NA en la muestra#


$conf # los extremos inferior y superior de la muesca, del grfico seran 2.9 y 3.1 #

$out

#valores de los puntos de datos que se encuentran ms all de los extremos de los bigotes #

# Datos faltantes muestra para toda la base de datos/muestra el resumen de faltantes


is.na(empresas)
sum(is.na(empresas)) # suma de datos faltantes #
# Mostrar el orden de la variable Y ascendentemente de empresas
sort.list(Y)

order(Y)
# Mostrar toda la base de datos empresas ordenadas por la variable Y
empresas[order(Y),]
#Registrando por ejemplo los tres datos atpicos ms altos de empresas$Y o Y
Nro de observacin
31
5
25

Valor
3.85000000
2.85783366
1.92084006

#Similarmente para R1, R2, etc.


order(R1)
empresas[order(R1),]
order(R2)
empresas[order(R2),]
order(R3)
empresas[order(R3),]
# etc.
# Anlisis con todas las variables, para determinar atipicos en todas las variables.
boxplot(empresas, use.cols=TRUE)

Por ejemplo, cada variable R8, R9 y R10 muestra un valor muy extremo.
# Generar una nueva base de datos empresas2 con esos los valores extremos eliminados
empresas2 <# Continuar analizando con la nueva base de datos
boxplot(empresas2, use.cols=TRUE)

# Continuar identificando los datos extremos con y su posible eliminacin


empresas[order(Ri),]

III.

Normalidad en la endgena R

# Normalidad: histograma-qqplot-lnea sobre el qqplot


hist(Y)
qqnorm(Y)
qqline(Y)
# histograma-qqplot-lnea sobre el qqplot
hist(Y,breaks=50,freq=F,main=)
curve(dnorm,add=T)
# Instalar paquete fBasics, luego el library()
library(fBasics)
skewness(Y)
kurtosis(Y)
# Instalar paquete tseries, luego el library()
library(tseries)
jarque.bera.test(Y)
# Instalar paquete normtest para shapiro.test()
install.packages("normtest")
shapiro.test(Y)

IV.

Relacin lineal entre endgena y exgenas

#Para la matriz de dispersin


pairs(empresas)
## matriz de correlaciones
cor(empresas)
# Mltiples diagramas de dispersin entre todas las variables (no se visualiza bien)
> pairs(empresas)
# De otro modo, grfico x grfico
plot(R1,Y)
plot(R2,Y)
plot(R3,Y)
plot(R4,Y)
plot(R5,Y)
plot(R6~Y)
plot(R7~Y)
plot(R8~Y)
plot(R9~Y)
plot(R10~Y)
plot(R19~Y)
# Mostrar los coeficientes del modelo lineal de Y con todas las exgenas
modelo1<- lm(Y~R1+R2+R3+R4+R5+R6+R7+R8+R9+R10+R11+R12+R13+R14
+R15+R16+R17+R18+R19,empresas)
# Con el anlisis anterior, especificar el modelo ms adecuado
#Relacin con variable endgena
anova(modelo1)
summary(modelo1)
aov(modelo1)
#Valores ajustados
modelo1$fitted
modelo1$resid
#Residuales estandarizados histograma de los ri boxplot de los ri
ri<-rstandard(modelo1)
hist(ri)
boxplot(ri)
#Normalidad de los residuales estandarizados histograma de los ri boxplot de los ri
library(fBasics)
library(tseries)
jarque.bera.test(Y)
qqnorm(ri)
qqline(ri)
#Matriz de correlaciones entre todas las variables de la base de datos empresas
cor(empresas)

V.

SIGUE .

You might also like