You are on page 1of 54

Estadistica y probabilidad

Por: Ing. Daniel Alejandro Lino Lpez

Introduccin

El fin de la estadstica es sobre extraer un patrn y llegar a conclusiones


tiles a partir de l.
Esto se logra obteniendo informacin til, pero esta informacin puede tomar
demasiadas formas.
Los ingenieros en particular, estn inmersos en el manejo de informacin
durante casi toda su vida laboral.
El termino dato es usado para referirse a la informacin nmerica en todas
sus formas, pero nosotros nos enfocaremos en datos que fueron obtenidos a
travs de experimentos.

Introduccin

Normalmente la informacin obtenida es muy ambigua por lo que las


conclusiones no son tan obvias y la informacin debe ser analizada de una
forma mas profunda.
En estos casos las decisiones no se pueden generar con un 100% de
confianza, en estos casos se recurre a la teora de la probabilidad.

Softwares a usar

MATLAB
MINITAB
MAPLE
EXCEL

Muestreo y experimentos

La forma mas tpica de un


experimento estadstico se trata de
tomar una muestra dentro de una
poblacin y generar las
conclusiones de toda la poblacin a
partir de los resultados.
En general la poblacin es
demasiado grande y constante. La
muestra generada para la
investigacin es mucho mas
pequea.
El tamao de la muestra rige el
grado de confianza con lo cual se
generan nuestros argumentos

POBLACIN
MUESTRA

Experimento

Qu es un experimento?

Definicin General

Elegir o realizar una accin y despus


observar las consecuencias.

Ejemplo: Aventar una piedra a alguien.

Definicin particular

Un estudio en el que se manipulan


intencionalmente una o mas variables
independientes (supuestas causasantecedentes), para analizar las
consecuencias que la manipulacin
tiene sobre una o mas variables
dependientes (supuestos efectosconsecuentes), dentro de una situacin
de control para el investigador.
Ejemplo: Aventar una piedra desde un
puente y cronometar su tiempo hasta que
cae al suelo.

Qu podemos manipular con un experimento?

Es posible experimentar con seres humanos, seres vivos y ciertos


objetos.
Los experimentos manipulan tratamientos, estmulos, influencias o
intervenciones (denominadas variables independientes).

Cul es el requisito de un experimento?

El requisito es la manipulacin intencional de una o mas variables


independientes.
La variable independiente es la que se considera como supuesta causa en
una relacin entre variables, es la condicin antecedente, y al efecto
provocado por dicha causa se le denomina variable dependiente
(consecuente).

Proceso experimental

Proceso experimental (continuacin)

Seleccin de la muestra

La muestra

Se utiliza por economa de tiempo y recursos


Implica definir la unidad de anlisis
Requiere delimitar la poblacin para generalizar resultados y establecer
parmetros

Tipos de muestra

Sobre qu o quines se recolectarn datos?

Aqu el inters se centra en que o quienes, es decir, en los participantes,


objetos, sucesos o comunidades de estudio (las unidades de anlisis).
Depende del planteamiento de la investigacin y alcances del estudio.
EJEMPLO:

Descripcin de datos

Variable estadstica

Variables estadsticas (continuacin)

Distribucin de frecuencias
El primer paso para el estudio estadstico de una muestra es su ordenacin y presentacin en una tabla
de frecuencias.

Descripcin de una variable discreta

En los estudios se tiene una muestra de tamao N (cualquier tamao


posible) donde cada variable estadstica toma valores finitos.
Para un buen estudio cada uno de estos valores debe ser catalogado,
generalmente ordenndolos de mayor a menor (para esto deben ser
variables cuantitativas)
La diferencia entre el dato mayor y el dato menor recibe el nombre de
recorrido.
Para variables discretas es normal que se repita un mismo valor por lo que la
mejor forma de expresar esta clase de variables es en una tabla/grfica de
frecuencias.

Tabla de frecuencias de una variable discreta

Frecuencia absoluta

Es el numero de veces que se repite el valor de una variable

estadstica.

La frecuencia absoluta sin embargo no nos puede decir de la


importancia del dato respecto a la muestra.

Histograma de datos

Despus de reunir los datos el siguiente paso es mostrarlos de una forma


organizada, usualmente en forma de grficas.
Una grfica es una representacin visual de los datos, de esta forma es mas
fcil ver tendencias y patrones
El tipo de grfica a usar depende de la informacin que se dese mostrar.

Grfica de barras

Tabla de dos motores de combustin interna.


Cada una muestra la temperatura mostrada en cierto tiempo.

Grfica de barras de los tiempos de prueba.

Grfica de barras para mostrar la frecuencia de los tiempo de prueba.


Se crearon clases para agrupar los valores de los tiempos.
Un histograma (grfica) con pocas clases es no puede mostrar la tendencia de
una forma correcta.
Un histograma con muchas clases pierde estructura.
Lo tpico es dividir las clases entre 8 y 10.

Frecuencia relativa

Es la relacin que existe entre la frecuencia absoluta y el tamao de la


muestra.

Otra forma de expresar la frecuencia relativa es mediante porcentaje.

Frecuencia absoluta acumulada

Es la suma de las frecuencias absolutas de los valores inferiores o igual a xi.

Frecuencia relativa acumulada

Suma de las frecuencias relativas de los valores inferiores o iguales a xi.

Ejemplo

Supongamos que el nmero de hijos de una muestra de 20 familias es el


siguiente:
2 1 1 3 1 2 5 1 2 3 4 2 3 2 1 4 2 3 2 1.
Calcular:
a) El tamao de la muestra.
b) Recorrido de la muestra.
c) Frecuencia absoluta
d) Frecuencia relativa
e) Frecuencia absoluta acumulada
f)

Frecuencia relativa acumulada.

Preguntas de repaso.

Al realizar varias veces un experimento para conseguir informacin acerca


de un problema se obtiene un grupo de resultados: a cada resultado se le
denomina dato u observacin. Si se repite tres veces un experimento
consistente en lanzar una moneda, y anotar el lado que queda hacia arriba,
se obtendr un grupo de tres _____
Supongamos que un fabricante de focos realiza una prueba con una serie de
focos nuevos. El experimento consiste en seleccionar un foco, conectarlo y
encenderlo. Si el foco prende se anota una S; en caso contrario se anota una
N. Si el experimento se repite cinco veces, se obtendr un grupo de 5 dato u
observaciones. Cmo sern las anotaciones del experimento?

Agrupamiento en intervalos de clase.

Se usa cuando hay una gran variedad de datos dentro del rango
(generalmente cantidades cuantitativas).
Los intervalos se representan por una variable central llamada marca de
clase.
La diferencia entre el extremo superior y el inferior de cada intervalo recibe el
nombre de amplitud de intervalo.

Regla para la seleccin de intervalos

Generalmente una muestra de datos se divide en intervalos de 8 a 10. Sin


embargo esto depende esencialmente del tipo de muestra que se tiene.
Otra forma de calcular el nmero de intervalos es con la ecuacin
Una vez hecho los intervalos los datos contaran como repeticiones si estn
dentro de ellos.

Clculo de la marca de clase

Es el valor medio entre los lmites de clase.

De ser posible la marca de clase debera de ser un dato.

Ejemplo

En la tabla siguiente se listan los datos medidos por James Short en 1763 sobre la
paralaje del Sol en segundos de arco.

8.63
8.42
7.83

10.16
9.2
8.62

8.5
8.16
7.54

8.31
8.36
8.28

Obtener:
Recorrido:
Nmero de intervalos: 8 y para raz de N.
Extremos de intervalos.
Amplitud de intervalo.
Marca de clase.
Frecuencia absoluta y frecuencia relativa.

10.8
9.77
9.32

7.5
7.52
7.96

8.12
7.96
7.47

Medidas caractersticas de una distribucin

Realizacin y
toma de medidas
del experimento

Ordenamiento y
clasificacin de
los datos.

Resumir la
informacin

Medidas de centralizacin

Indican el valor promedio de los datos, o en torno a que valor se distribuyen.


Solo pueden ser usadas para datos cuantitativos.

Media aritmtica.

Puede ser llamada media o promedio.

Se define como la suma de los distintos valores de los datos dividida entre el
nmero de datos tomados.
Para distribuciones en clases se utiliza de la siguiente manera.

Donde ni es el la frecuencia absoluta de la clase y xi es el valor de la marca


de clase.

Ejemplo

Calcular la media aritmtica para la siguiente serie de datos.


A) Usando la primera ecuacin.
B) Separando en 5 clases y calcular la marca de clase y utilizando la
segunda ecuacin.
Datos:

1,1,1,1,1,1,2,2,2,2,2,2,2,3,3,3,3,4,4,5.

Error al calcular con marcas de clase.

Se tiene la siguiente tabla de datos:

8.63
8.42
7.83

10.16
9.2
8.62

8.5
8.16
7.54

8.31
8.36
8.28

10.8
9.77
9.32

7.5
7.52
7.96

8.12
7.96
7.47

Distribuyendo los datos en clases queda la siguiente tabla:

Ci

ni

7.755

8.455

9.155

9.855

10.555

Mediana

Es el valor de los datos que ocupan la posicin media.


Para poder calcular la media los datos deben de estar ordenados de acuerdo
a su tamao.
La mediana se simboliza de la forma y se pronuncia equis tilde.

Procedimiento para calcular la mediana.

Clasificar los datos


Calcular la profundidad de la mediana
Calcular la mediana

Ordenar los datos de


acuerdo a un criterio.
Generalmente se utiliza La profundidad es el
nmero de posiciones
el tamao del dato.
de datos desde
cualquier extremo en el
que se encuentra la
mediana.

Ubicar la posicin
indicada por la
profundidad de la
mediana desde
cualquier extremo el
valor del dato de esa
posicin ser la
mediana.

Mediana para una un tamao de datos impar

La siguiente tabla muestra el estudio sobre el nmero de pares de zapatos


que tienen los hombres.
i

xi

Clasificar los datos de menor a mayor.


Calcular la profundidad de la mediana .
Encontrar el valor de la mediana.

Mediana para un tamao de muestra par.

La siguiente tabla muestra el nmero de libros que leyeron 6 personas en un


ao.
Persona

Nmero de libros

10

Calcular la media
Ordenar los datos de mayor a menor.
Calcular
Dado que ser un nmero racional se buscarn las dos posiciones entre las
que se encuentra.
Obtener el promedio de esas dos posiciones. Este promedio ser la
mediana.

Moda

Es el valor que ocurre con mayor frecuencia en los datos tomados.


De los siguientes datos a={3,3,5,6,8} la moda es 3.
Si dos o mas valores de una muestra estn empatados por la mayor
frecuencia se dice que no hay moda.
De los siguientes datos a={3,3,4,5,5,7} tanto el 3 como el 7 se repiten
dos veces. No hay un valor que aparezca con mas frecuencia; por tanto,
esta muestra no tiene moda.
Estos principios aplican para clases tambin.

Medio rango

Es el nmero que representa la parte media de los datos tomados desde el


punto de vista del valor mayor y el valor menor.
Se encuentra al promediar el valor mas alto y el valor mas bajo.

Ejemplo medio rango

Para el conjunto de datos {3,3,5,6,8}


El valor mnimo L=3
El valor mximo H=8

Ejercicio

Para el conjunto {6,7,8,9,9,10} calcular:


a) Media
b) Mediana
c) Moda
d) Medio rango
e) Representar cada valor en una recta.

Cuartiles, deciles y percentiles.

Los cuartiles son los 3 valores que dividen el conjunto de datos ordenado
en 4 partes iguales.
El primer cuartil se representar por la variable y ser la medida tal que el
25% de los datos sern inferiores a su valor y el 75% superiores.
El segundo cuartil coincidir con la mediana y se representara por la variable
.
El tercer cuartil () ser la medida a la que el 25% de los datos ser
superiores y el 75% inferiores.

Como calcular los valores de los cuartiles?

Los pasos para calcular los valores de los cuartiles son los mismos
que para calcular la mediana exceptuando la forma de calcular la
profundidad que se sustituye por las siguientes ecuaciones.

Aplicaciones de las grficas

El objetivo de cualquier grfica es mostrar datos de forma ordenada para la


comunicacin de un mensaje.
Tipos de objetivos
1. Comparar un dato con otros: Comparar las venas de un mes respecto a los
otros dentro de un ao.
2. Comparar los datos respecto del tiempo: Comparar la velocidad de un
proyectil desde que es lanzado hasta su cada.
3. Comparar datos relativos: Comparar la cantidad de votos de un candidato
respecto al total de votos.
4. Comparar la frecuencia de un dato.
5. Identificar datos que pueden ser desechados.

Tipos de grficas

Grficas de columna

Muestran los datos en forma de altura.


Pueden mostrar un valor de una variable cuantitativa o la frecuencia.
Son generalmente usadas para muestras discretas.

Comparar una o mas muestras.

You might also like