Professional Documents
Culture Documents
Un poco de Historia
En pocas muy remotas. No surgi de improviso, sino mediante un proceso largo de desarrollo y evolucin (desde hechos de simple recoleccin de datos hasta la diversidad y rigurosa interpretacin de los datos que se dan hoy en da).
El origen de la Estadstica se remonta a los comienzos de la historia y esto se sabe tanto a travs de Crnicas Datos escritos Restos arqueolgicos...
Se utilizaban representaciones grficas y otros smbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el nmero de personas, animales o ciertas cosas.
La razn de esto, es que se estaba formado recin la sociedad y es algo inherente la necesidad de saber cosas elementales como: cuntos habitantes tiene cada tribu? con cuntos bienes cuenta?, etc.
En la isla de Cerdea, donde existen monumentos prehistricos pertenecientes a los Nuragas (primeros habitantes de la isla); que constan de bloques de basalto superpuestos sin mortero y en cuyas paredes de encontraban grabados toscos signos que han sido interpretados con mucha verosimilidad como muescas que servan para llevar la cuenta del ganado y la caza.
BABILONICOS
Hacia el ao 3000 A.C. los babilonios usaban ya pequeas tablillas de arcilla para recopilar datos en tablas sobre la produccin agrcola y de los gneros vendidos o cambiados mediante trueque
EGIPCIOS
Los egipcios analizaban los datos de la poblacin y la renta del pas mucho antes de construir las pirmides en el siglo XXXI a.C.
CENSOS EGIPCIOS
En los antiguos monumentos egipcios se encontraron interesantes documentos en que demuestran la sabia organizacin y administracin de este pueblo; ellos llevaban cuenta de los movimientos poblacionales y continuamente hacan censos.
ASIRIOS
Fue Sargn II, rey de Asiria, quien fund una biblioteca en Nvine. En esta biblioteca no se guardaban poemas u obras literarias; sino simplemente era una recopilacin de hechos histricos, religiosos, importantes datos estadsticos sobre produccin, cuentas; as como tambin datos de medicina, astronoma, etc.
BIBLIA
En la Biblia observamos en uno de los libros del Pentateuco, bajo el nombre de Nmeros, el censo que realiz Moiss despus de la salida de Egipto. "Haz un censo general de toda la asamblea de los hijos de Israel, por familias y por linajes, describiendo por cabezas los nombres de todos los varones aptos para el servicio de armas en Israel..". Igual tipos de datos en varios libros que conforman la Biblia.
CHINOS
Tambin los chinos efectuaron censos hace ms de cuarenta siglos. En China Confucio, en uno de sus clsicos "ShuKing" escrito hacia el ao 550 a.C., nos narra cmo el Rey Yao en el ao 2238 mand hacer una estadstica agrcola, industrial y comercial.
GRIEGOS
Grecia tambin tuvo importantes observaciones estadsticas en lo que refiere a distribucin de terreno, servicio militar, etc. Tambin cabe citar entre los griegos principalmente a Scrates, Herodoto y Aristteles, quienes a travs de sus escritos incentivaron la estadstica por su importancia para el Estado.
CENSOS GRIEGOS
Los griegos efectuaron censos peridicamente con fines tributarios, sociales (divisin de tierras) y militares (clculo de recursos y hombres disponibles). La investigacin histrica revela que se realizaron 69 censos para calcular los impuestos, determinar los derechos de voto y ponderar la potencia guerrera.
LOS ROMANOS
El Imperio romano fue el primer gobierno que recopil una gran cantidad de datos sobre la poblacin, superficie y renta de todos los territorios bajo su control.
LOS ROMANOS
Cada cinco aos realizaban un censo de la poblacin y sus funcionarios pblicos tenan la obligacin de anotar: nacimientos, defunciones y matrimonios recuentos peridicos del ganado riquezas contenidas en las tierras conquistadas.
EDAD MEDIA
Aunque Carlomagno, en Francia; y Guillermo el Conquistador, en Inglaterra, trataron de revivir la tcnica romana, los mtodos estadsticos permanecieron casi olvidados durante la Edad Media.
LOS INCAS
Los Incas del Per (1,200 a 1,527, D.C.) establecieron un procedimiento peculiar para registrar los nacimientos, las defunciones y otros sucesos cuya responsabilidad incumba a las autoridades pblicas. Esta cultura de las Amricas tiene el mrito de haber sido la primera que registr sucesos vitales. saban por ejemplo exactamente la cantidad, la edad y el sexo de los habitantes en las diferentes provincias.
LA IGLESIA
La Iglesia, viendo la importancia de la estadstica es que despus del Concilio de Trento estableci la obligacin de la inscripcin de nacimientos, matrimonio y defunciones.
El registro de nacimientos y defunciones comenz en Inglaterra a principios del siglo XVI, y en 1662 apareci el primer estudio estadstico notable de poblacin, titulado Observations on the London Bills of Mortality (Comentarios sobre las partidas de defuncin en Londres).
Los procedimientos de Neumann fueron conocidos por el astrnomo ingls Halley, descubridor del cometa que lleva su nombre, quien los aplic al estudio de la vida humana. Sus clculos sirvieron de base para las tablas de mortalidad que hoy utilizan todas las compaas de seguros.
PREDICCIONES
En 1662, el capitn John Graunt us documentos que abarcaban treinta aos y efectu predicciones sobre el nmero de personas que moriran de varias enfermedades y sobre las proporciones de nacimientos de varones y mujeres que caba esperar.
Estadstica Demogrfica
Los eruditos del siglo XVII demostraron especial inters por la Estadstica Demogrfica como resultado de la especulacin sobre si la poblacin aumentaba, decreca o permaneca esttica.
PROBABILIDADES
Durante el siglo XVII y principios del XVIII, matemticos como Bernoulli, Francis Maseres, Lagrange y Laplace desarrollaron la teora de probabilidades. No obstante durante cierto tiempo, la teora de las probabilidades limit su aplicacin a los juegos de azar y hasta el siglo XVIII no comenz a aplicarse a los grandes problemas cientficos.
CONCEPTOS FUNDAMENTALES
Entretanto, en el perodo del 1800 al 1820 se desarrollaron dos conceptos matemticos fundamentales para la teora Estadstica; la teora de los errores de observacin, aportada por Laplace y Gauss; y la teora de los mnimos cuadrados desarrollada por Laplace, Gauss y Legendre.
ESTADISTICA HOY
En nuestros das, la estadstica se ha convertido en un mtodo efectivo para describir con exactitud los valores de datos econmicos, polticos, sociales, psicolgicos, biolgicos y fsicos, y sirve como herramienta para relacionar y analizar dichos datos.
TRABAJO ESTADISTICO
El trabajo del experto estadstico no consiste ya slo en reunir y tabular los datos, sino sobre todo en el proceso de interpretacin de esa informacin.
Quiere decir.
La Ciencia se ocupa en general de fenmenos observables La Ciencia se desarrolla observando hechos, formulando leyes que los explican y realizando experimentos para validar o rechazar dichas leyes Los modelos que crea la ciencia son de tipo determinista o aleatorio (estocstico) La Estadstica se utiliza como tecnologa al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte de su naturaleza La Bioestadstica [...] ensea y ayuda a investigar en todas las reas de las Ciencias de la Vida donde la variablidad no es la excepcin sino la regla Carrasco de la Pea (1982)
29
Definicin
La Estadstica es la Ciencia de la
Sistematizacin, recogida, ordenacin y presentacin de a iv datos referentes a un fenmeno que presenta variabilidad o t
los
rip c es D
incertidumbre para su estudio metdico, con objeto de deducir las leyes que rigen esos fenmenos,
o Pr
ad d ili ab y b
poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones.
a ci n re e nf I
30
Los fumadores tienen ms bajas laborales que los no fumadores En qu sentido? Mayor nmero? Tiempo medio?
Qu individuos pertenecern al estudio (muestras) Fumadores y no fumadores en edad laboral. Criterios de exclusin Cmo se eligen? Descartamos los que padecen enfermedades crnicas? Qu datos recoger de los mismos (variables) Nmero de bajas Tiempo de duracin de cada baja Sexo? Sector laboral? Otros factores?
31
continuacin
Estratificado? Sistemticamente?
tiempo medio de baja en fumadores y no (estadsticos) % de bajas por fumadores y sexo (frecuencias), grficos,...
Los fumadores se incapacitan en el trabajo al menos 10 das/ao ms en promedio que los no fumadores.
32
Obtener conclusiones
33
Poblacin y muestra
Poblacin Es el conjunto sobre el que estamos interesados en obtener conclusiones (hacer inferencia. Normalmente es demasiado grande para poder abarcarlo. Muestra Es un subconjunto suyo al que tenemos acceso y sobre el que realmente hacemos las observaciones (mediciones) Debera ser representativo Esta formado por miembros seleccionados de la poblacin (individuos, unidades experimentales).
34
Variables
Una variable es una caracterstica observable que vara entre los diferentes individuos de una poblacin. La informacin que disponemos de cada individuo es resumida en variables.
El grupo sanguneo
{A, B, AB, O} Var. Cualitativa {Deprimido, Ni fu ni fa, Muy Feliz} Var. Ordinal {0,1,2,3,...} Var. Numrica discreta {162 ; 174; ...} Var. Numrica continua
35
El nmero de hijos
La altura
Tipos de variables
Cualitativas Si sus valores (modalidades) no se pueden asociar naturalmente a un nmero (no se pueden hacer operaciones algebraicas con ellos)
Cuantitativas o Numricas Si sus valores son numricos (tiene sentido hacer operaciones algebraicas con ellos)
Es buena idea codificar las variables como nmeros para poder procesarlas con facilidad en un ordenador. Es conveniente asignar etiquetas a los valores de las variables para recordar qu significan los cdigos numricos.
0 = No sabe 99 = No contesta...
Estas situaciones debern ser tenidas en cuentas en el anlisis. Datos perdidos (missing data)
37
Aunque se codifiquen como nmeros, debemos recordar siempre el verdadero tipo de las variables y su significado cuando vayamos a usar programas de clculo estadstico. No todo est permitido con cualquier tipo de variable.
38
Los posibles valores de una variable suelen denominarse modalidades. Las modalidades pueden agruparse en clases (intervalos) Edades:
Hijos:
Las modalidades/clases deben forman un sistema exhaustivo y excluyente Exhaustivo: No podemos olvidar ningn posible valor de la variable
Mal: Cul es su color del pelo: (Rubio, Moreno)? Bien: Cul es su grupo sanguneo?
Estudio sobre el ocio Mal: De los siguientes, qu le gusta: (deporte, cine) Bien: Le gusta el deporte: (S, No) Bien: Le gusta el cine: (S, No) Mal: Cuntos hijos tiene: (Ninguno, Menos de 5, Ms de 2)
39
Las tablas de frecuencias y las representaciones grficas son dos maneras equivalentes de presentar la informacin. Las dos exponen ordenadamente la informacin recogida en una muestra.
40
Tablas de frecuencia
Exponen la informacin recogida en la muestra, de forma que no se pierda nada de informacin (o poca).
Frecuencias absolutas: Contabilizan el nmero de individuos de cada modalidad Frecuencias relativas/ (porcentajes): Cada valor dividido entre el total y multiplicado por la constante 100 Frecuencias acumuladas: Slo tienen sentido para variables ordinales y numricas.
Nivel d e felicid ad
Porcentaje (%)
Frecuencia Vlidos Hombre 636 Mujer Mujer 881 Total Total 1517
Hombre
F recuencia Porcentaje 487 31.69 467 30,8 Bastante Feliz 872 56.73 Bastante feliz 872 57,5 No dem asiado feliz 165 10,9 No 165 10.74 T otal demasiado 1504 99,1 Feliz Perdidos No contesta 13 ,9 T otal 1517 100,0
No contesto 13 0.84 100 Total 1537
Porcentaje (%)
Porcentaje Porcen acumulado vlido acum ul 30.8 31,1 3 88.3 58,0 8 11,0 10 99.2 100,0
Porcentaje
100
41
Variable: Gnero
Modalidades:
H = Hombre M = Mujer
Muestra:
MHHMMHMMMH
Ejemplo
Cuntos individuos tienen menos de 2 hijos? frec. indiv. sin hijos + frec. indiv. con 1 hijo = 419 + 255 = 674 individuos Qu porcentaje de individuos tiene 6 hijos o menos? 97,3% Qu cantidad de hijos es tal que al menos el 50% de la poblacin tiene una cantidad inferior o igual? 2 hijos
Nmero de hijos Frec. 419 255 375 215 127 54 24 23 17 1509 Porcent. (vlido) 27,8 16,9 24,9 14,2 8,4 3,6 1,6 1,5 1,1 100,0 Porcent. acum. 27,8 44,7 69,5 83,8 92,2 95,8 97,3 98,9 100,0
0 1 2 3 4 5 6 7 Ocho+ Total
50%
43
Diagramas de barras
No usarlo con variables ordinales. El rea de cada sector es proporcional a su frecuencia (abs. o rel.)
Pictogramas
44
375
Recuento
Son diferentes en funcin de que las variables sean discretas o continuas. Valen con frec. absolutas o relativas.
300
255 215
200
127
100
54 24
0 1 2 3 4 5 6
23
17
7 Ocho o ms
Se deja un hueco entre barras para indicar los valores que no son posibles
250 200
Nmero de hijos
El rea que hay bajo el histograma entre dos puntos cualesquiera indica la cantidad (porcentaje o frecuencia) de individuos en el intervalo.
Recuento
150
100
50
20
40
60
80
45
Polgono de Frecuencias
(Grficos integrales)
Cada uno de los anteriores diagramas tiene su correspondiente Polgono de frecuencias. Se realizan a partir de las frecuencias acumuladas. Indican, para cada valor de la variable, la cantidad (frecuencia) de individuos que poseen un valor inferior o igual al mismo.
46
Qu hemos visto?
Representaciones grficas
47