You are on page 1of 4

ANALISIS DE DATOS

En el proceso de análisis de datos, nos hemos dado a la tarea se seguir al pie de la


letra la metodología empleada en clase. Así, partimos de buscar en el sitio web
Yahoo finance la información histórica numérica del precio de las acciones de
AT&T, partiendo del año 2013 para tener una muestra considerablemente grande y
poder hacer más visible la comparación con una muestra pequeña, donde
abstrajimos los datos de mayo de 2018. Una vez recopilados los datos en Excel
analizamos qué tipo de precio de acción era el más conveniente para probar nuestra
hipótesis. Ante esto, elegimos la acción "Adj" que nos esboza un promedio de la
actividad durante el día; sin embargo, también creímos útil el uso de los precios de
la acción High y Low, para comprender qué tanto fluctúan las operaciones en un
día.

El siguiente paso fue el de recopilar las medias muéstrales de cada uno de los tipos
de acciones, enfocándonos más en las medias muéstrales de todos los días (datos
poblacionales) y de los últimos días de mayo de 2018. De este modo tuvimos la
comparación de dos muestras con tamaños muy distintos que nos ayudaron a la
comprensión de la teoría llevada a la práctica.

Una vez obtenidas nuestras medias muéstrales obtuvimos la información de


estadística descriptiva de cada grupo. Dentro de estos datos podemos encontrar la
media, varianza y desviación estándar; máximo y mínimo; así como el número de
datos empleados.

Paso siguiente, se obtuvieron los intervalos del precio de las acciones. Esto se llevó
a cabo en hoja de cálculo con la fórmula de Distribución normal inversa para nuestra
muestra de todos los datos (ya que se conoce el valor de nuestra varianza
poblacional y contiene información histórica que hace más preciso nuestro análisis),
esto, aunado al valor de confianza que hemos fijado en 1% para todo el análisis de
nuestro trabajo. Para el caso del análisis de intervalos de nuestras medias en mayo
de 2018, hemos utilizado la función de distribución t inversa, ya que el valor de
nuestra varianza no es el mismo de la poblacional y este análisis está enfocado a
predicciones de corto plazo sin información histórica previa.
Una vez utilizado este método, tanto en el precio adj como en el precio high y low,
hemos acumulado los resultados numéricos que, con base en la teoría, nos servirán
para hacer nuestro análisis para probar nuestra hipótesis

Análisis por intervalos.

De la muestra poblacional realizamos los cálculos de estadística descriptiva.


Determinamos en valor de α en 1%. 3% y 5%, que es el nivel de significancia, nos
muestra la posibilidad de que los que buscamos se encuentre fuera del intervalo.
Se buscó en valor de z para cada valor de α con una y dos colas, y como sabemos
siempre se comportara como una distribución normal.

Se tomó una muestra para mayo del 2018, ya que una muestra más cercana nos
proporciona datos más realistas. En este caso utilizamos el método de la varianza
desconocida, porque nuestra muestra es pequeña y estamos en un ambiente de
incertidumbre.

Igualmente determinamos el valor de α en 1%. 3% y 5%, y calculamos el valor de t


para una y dos colas.

El análisis de α para nuestros datos no es necesario, como son muy pequeños,


hacen menos volátiles el valor de nuestros intervalos y no tendría caso comparar
intervalos con cambios muy pequeños. Por lo tanto nuestro trabajo va a estar única
y exclusivamente enfocado al valor de α en 1% para una cola y 0.5% para las dos
colas. Se cumple perfectamente con la propiedad de suficiencia, como ya tenemos
un estimador que nos provee información suficiente no tendría sentido utilizar otros
que no nos aporten información significativa.
Diferencia de dos medias poblacionales: varianza conocida.

Para los precios altos y bajos poblacionales, igualmente, calculamos el valor de z y


se analizaron los intervalos superiores e inferiores, con varianza conocida.

DIFERENCIA DE DOS MEDIAS POBLACIONALES (HIGH AND LOW)

INFERIOR SUPERIOR α= 1%
0.1887 0.7748

Podemos afirmar con un 99% de seguridad que la ganancia mínima que se puede
ganar en un día es de 0.1887 y la ganancia máxima que se puede ganar en un día
es de 0.7748.

Diferencia de dos medias poblacionales normales: varianza poblacional


desconocida.

Para la muestra de los precios de cierre y apertura del 2018 analizamos los
intervalos de confianza para los límites superior e inferior con varianza desconocida.

INFERIOR SUPERIOR GRADOS DE LIBERTAD α= 1%


-51.06188305 51.3440381 19

Podemos afirmar con un 99% de seguridad que la ganancia mínima (o pérdida) que
podemos tener es de -51.06188305 y la ganancia máxima que podemos tener es
de 51.3440381.

Como vimos, el análisis de α en nuestro análisis no es necesario, como nuestros


datos son muy pequeños, hacen menos volátiles el valor de nuestros intervalos y
no tendría caso comparar intervalos con cambios muy pequeños. Por lo tanto
nuestro trabajo va a estar única y exclusivamente enfocado al valor de α en 1%
para una cola y 0.5% para las dos colas. Se cumple perfectamente con la propiedad
de suficiencia, como ya tenemos un estimador que nos provee información
suficiente no tendría sentido utilizar otros que no nos aporten información
significativa.

You might also like