You are on page 1of 17

asimetría

es una propiedad de determinados cuerpos, dibujos, funciones matemáticas y otros tipos de


elementos en los que, al aplicarles una regla de transformación efectiva, se observan cambios
respecto al elemento original. En estadística, el concepto de asimetría de una distribución indica la
deformación horizontal de las distribuciones de frecuencia. Surge una discordia cuando no somos
capaces de reconocer qué parte es la original de la asimetría. Que son iguales de los dos lados.
En matemática se dice que una función no es par, cuando esta es asimétrica con respecto al eje y.

Cuartiles

son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro
partes iguales.

Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos.

Q2 coincide con la mediana.

Curtosis

La curtosis (también conocida como medida de apuntamiento) es una medida estadística,


que determina el grado de concentración que presentan los valores de una variable
alrededor de la zona central de la distribución de frecuencias.

Ejemplo de cálculo de curtosis para datos sin agrupar


Supongamos que queremos calcular la curtosis de la siguiente distribución:

8,5,9,10,12,7,2,6,8,9,10,7,7.

Primero calculamos la media aritmética, que sería 7,69.

A continuación, calculamos la desviación típica, que sería 2,43.

Tras tener estos datos y para comodidad en el cálculo, se puede realizar una tabla para calcular la
parte del numerador (cuarto momento de la distribución).

Datos (Xi-µ)^4
8 0,0090
5 52,5411
9 2,9243
10 28,3604
12 344,3330
7 0,2297
2 1049,9134
6 8,2020
8 0,0090
9 2,9243
10 28,3604
7 0,2297
7 0,2297
N = 13 ∑ = 1.518,27

Una vez tenemos esta tabla hecha, simplemente tendríamos que aplicar la formula expuesta con
anterioridad para tener la curtosis.

g2 = 1.518,27/13*(2,43)^4 = 3,34

En este caso dado que g2 es mayor que 3, la distribución sería leptocurtica, presetando un mayor
apuntamiento que la distribución normal.

desviación estándar

La desviación estándar es la medida de dispersión más común,


que indica qué tan dispersos están los datos con respecto a la
media. Mientras mayor sea la desviación estándar, mayor será la
dispersión de los datos.
Decil
se refiere a cada uno de los 9 valores que dividen
un grupo de datos (clasificados con una relación
de orden) en diez partes iguales, y de manera que
cada parte representa un décimo de la población.
En resumen, los deciles son cada uno de los
nueve valores que dividen un conjunto de datos en
diez grupos con iguales efectivos. Son los nueve
valores que dividen la serie de datos en diez
partes

probabilístico o estadístico

es la forma que pueden tomar un conjunto de datos


obtenidos de muestreos de datos con comportamiento que
se supone aleatorio.

Un modelo estadístico es un tipo de modelo matemático


que usa la probabilidad, y que incluye un conjunto de
asunciones sobre la generación de algunos datos
muestrales, de tal manera que asemejen a los datos de una población mayor.

no probabilístico

El muestreo no probabilístico es una técnica de

muestreo donde las muestras se recogen en un

proceso que no brinda a todos los individuos

de la población iguales oportunidades de ser

seleccionados.

dato
es una representación simbólica (numérica, alfabética, algorítmica,
espacial, etc.) de un atributo o variable cuantitativa o cualitativa. Los
datos describen hechos empíricos, sucesos y entidades. Es un valor o
referente que recibe el computador por diferentes medios, los datos
representan la información que el programador manipula en la
construcción de una solución o en el desarrollo de un algoritmo.
DATOS
AGRUPADOS

1.- su fin es resumir la información.

2.- generalmente, los elementos son de


mayor tamaño, por lo cual requieren ser
agrupados, esto implica: ordenar,
clasificar y expresar los en una tabla de
frecuencias.

3.- se agrupa a los datos, si se cuenta


con 20 o más elementos. Aunque
contemos con más de 20 elementos,
debe de verificarse que los datos n sean
significativos, Esto es: que la información
sea “repetitiva”, también debemos de verificar que los datos puedan clasificarse. Y que dicha
clasificación tiene coherencia y lógica (de acuerdo a lo que se nos está pidiendo) .
Una vez que ya hemos ordenado y clasificado, presentaremos la información obtenida mediante
una ”tabla de frecuencias ”

4.- la agrupación de los datos puede ser simple o mediante intervalos de clase.

DATOS NO AGRUPADOS

1.- los datos son brutos( es decir, no se presentan clasificados)

2.- no es necesario clasificar ni generar una tabla de frecuentas, ya que no tiene “mucho sentido”.

3.- elementos que menor tamaño (generalmente menor a 20 elementos).Esto no sucede así
siempre.
Aunnque contemos con menos de 20 elementos, debe de verificarse que los datos no sean
significativos, Esto es: que la información no sea “repetitiva”, de esta forma, sabremos que no se
podrá clasificar y por lo tanto ser resumida en una “tabla de frecuencias”.
En caso de que una vez que hayamos ordenado los elementos, se cuente con datos significativos.
Procedemos a clasificarlos (si es posible, ya que
también debemos de buscar la lógica al clasificar los
elementos) para convertirlos en “datos agrupados”.

Por ejemplo:

*si nos pidieran obtener la información del territorio de


cada uno de los estados de México. No tiene mucho
sentido que “que tratemos de agrupar”, ya que solo nos
pide el nombre del estado de la republica mexicana y la
extensión territorial. ¿Para que necesitaríamos una
tabla de frecuencia de 32 elementos, cuando estos se
repiten solo 1 vez ?

estadística

La estadística podría definirse como la ciencia que se


encarga de recopilar, organizar, procesar, analizar e
interpretar datos con el fin de deducir las
características de una población objetivo, pero esta
sería solo una visión estrecha de lo que comprende
esta rama del saber. A continuación se hace una muy
breve introducción teórica al amplio concepto de la
estadística.
estadística descriptiva
es la técnica matemática que obtiene, organiza, presenta
y describe un conjunto de datos con el propósito de
facilitar su uso generalmente con el apoyo de tablas,
medidas numéricas o gráficas. Además, calcula
parámetros estadísticos como las medidas de
centralización y de
dispersión que describen
el conjunto estudiado.
estadística inferencial
es una parte de la Estadística que comprende los métodos y
procedimientos para deducir propiedades (hacer inferencias) de
una población, a partir de una pequeña parte de la misma
(muestra).

ESTADISTICA GENERAL
ESTADISTICO O ESTADIGRAFO

espacio muestral o espacio de muestreo

consiste en el conjunto de todos los posibles resultados


de un experimento aleatorio, junto con una estructura
sobre el mismo (ver más adelante).

Por ejemplo, si el experimento consiste en lanzar dos


monedas, el espacio muestral es el conjunto {(cara,
cara), (cara, cruz), (cruz, cara) y (cruz, cruz)}. Un evento
o suceso es cualquier subconjunto del espacio muestral
con estructura de σ-álgebra,1 llamándose a los sucesos que contengan un único elemento
sucesos elementales. En el ejemplo, el suceso "sacar cara en el primer lanzamiento", o {(cara,
cara), (cara, cruz)}, estaría formado por los sucesos elementales {(cara, cara)} y {(cara, cruz)}.

Frecuencia

es una repetición de un hecho o un suceso. Es


también el número de veces que se repite un proceso
periódico en un intervalo de tiempo determinado.
Número de oscilaciones, vibraciones u ondas por
unidad de tiempo en cualquier fenómeno periódico.
frecuencia absoluta
es una medida estadística que nos da información acerca de la
cantidad de veces que se repite un suceso al realizar un
número determinado de experimentos aleatorios. Esta se
representa mediante las letras fi. La letra f se refiere a la
palabra frecuencia y la letra i se refiere a la realización i-ésima
del experimento aleatorio.

Frecuencia
relativa.
Se dice que la frecuencia relativa es el
cociente entre la frecuencia absoluta de un
determinado valor y el número total de datos.
Se puede expresar en tantos por ciento y se
representa por hi. La suma de las frecuencias
relativas es igual a 1.
HISTOGRAMA DE PEARSON
GRAFICA DE EDADES
histograma es una representación gráfica de una variable en
forma de barras, donde la superficie de cada barra es
proporcional a la frecuencia de los valores representados, ya
sea en forma diferencial o acumulada. Sirven para obtener
una "primera vista" general, o panorama, de la distribución
de la población, o la muestra, respecto a una característica,
cuantitativa y continua, de la misma y que es de interés para
el observador (como la longitud o la masa).

Diagrama de barras
Un diagrama de barras, también conocido
como gráfico de barras o diagrama de
columnas, es una forma de representar
gráficamente un conjunto de datos o valores, y
está conformado por barras rectangulares de
longitudes proporcionales a los valores
representados. Los gráficos de barras son usados
para comparar dos o más valores. Las barras
pueden orientarse verticalmente u
horizontalmente.
diagrama de sectores
se puede utilizar para todo tipo de variables, pero se usa
frecuentemente para las variables cualitativas.
Los datos se representan en un círculo, de modo que el
ángulo de cada sector es proporcional a la frecuencia
absoluta correspondiente.

Diagrama de frecuencia
o polígono de frecuencia es lo mismo, y es una
grafica de las frecuencias relativas en el lado de las
"y" y la marca de clase en el eje de las "x", pero en
este tipo de diagramas no es necesario especificar los
ejes y se unen los puntos que te salgan por medio de
una línea.

Narcoanálisis:
Método de análisis psiquiátrico o psicológico
que se realiza tras la inyección de un
barbitúrico con el objetivo de adormecer
ligeramente al individuo.
La entrevista con amobarbital sódico
(amital sódico) fue introducida por Bleckwenn
en 1930, como una técnica específica
para el tratamiento de los pacientes psicóticos
(Bleckwenn W. 1930). En 1932, Lindemann
demostró posibles beneficios de dosis
subnarcóticas de la droga, para la entrevista
con población no psicótica (Lindemann
E. 1932). Términos como narcoanálisis, narcosíntesis, narcosugestión, narcocatarsis,
narcoterapia, hablan de técnicas psicoterapéuticas asistidas por drogas.

La inferencia estadística o estadística inferencial


es una parte de la Estadística que comprende los
métodos y procedimientos para deducir propiedades
(hacer inferencias) de una población, a partir de una
pequeña parte de la misma (muestra). También
permite comparar muestras de diferentes
poblaciones.

INTERVALO
Intervalo es la diferencia de altura —
frecuencia— entre dos notas musicales,
medida cuantitativamente en grados o notas
naturales y cualitativamente en tonos y
semitonos. Su expresión aritmética suele ser
una proporción simple.

Individuo
Individuo se refiere a una unidad frente a otras unidades en
un sistema de referencia. A veces se confunde
erróneamente con clase lógica o un Todo-lógico, distribuido
o no-distribuido, como si fuera un conjunto de individuos
existentes

Límite o frontera de clase


Las clases de una distribución de frecuencia
indican las cotas o fronteras de cada clase en la
distribución, las clases están formadas por dos
números denominados límites aparentes (LA),
ejemplo 32 – 37, el primero de estos dos (32) se
llama límite inferior aparente (LIA) y el segundo
(37) se le denomina límite superior aparente
(LSA).
Límites reales
Los límites reales o verdaderos de una clase
son aquéllos que se obtienen restándole media
unidad de medida al límite aparente inferior de una clase y sumándole media unidad de medida al
límite superior aparente de las diferentes clases, es decir, son valores no observables de la
variable en estudio, puesto que no lo registra la unidad utilizada. Y se denominarán límite inferior
real (LIR) y límite superior real (LSR).
En el ejemplo anterior, los límites reales aparentes quedarían:

CLASE LIA LSA LIR LSR

32-37 32 37 31.5 37.5

M = Dato mayor m = Dato menor


Muestra
es un subconjunto de casos o individuos de una población. En
diversas aplicaciones interesa que una muestra sea una
muestra representativa y para ello debe escogerse una
técnica de muestra adecuada que produzca una muestra
aleatoria adecuada ( se obtiene una muestra sesgada cuyo
interés y utilidad es más limitado de pendiendo del grado de
sesgo que presente).
MEDIA
s una medida de tendencia central. resulta al efectuar una
serie determinada de operaciones con un conjunto de
números y que, en determinadas condiciones, puede
representar por sí solo a todo el conjunto». Existen
distintos tipos de medias, tales como la media geométrica,
la media ponderada y la media armónica aunque en el
lenguaje común, el término se refiere generalmente a la
media aritmética.

Mediana
En el ámbito de la estadística, la mediana representa el valor de la variable
de posición central en un conjunto de datos ordenados.

Moda

la moda es el valor con


mayor frecuencia en una distribución de datos.

Se hablará de una distribución bimodal de los


datos adquiridos en una columna cuando
encontremos dos modas, es decir, dos datos que
tengan la misma frecuencia absoluta máxima. Una
distribución trimodal de los datos es en la que
encontramos tres modas. En el caso de la
distribución uniforme discreta, cuando todos los
datos tienen la misma frecuencia, se puede definir las modas como indicado, pero estos valores
no tienen utilidad. Por eso algunos matemáticos califican esta distribución como «sin moda».

El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con datos agrupados
antes de definir la moda, se ha de definir el intervalo modal.

La moda, cuando los datos están agrupados, es un punto que divide al intervalo modal en dos
partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que:

Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de los intervalos
anterior y posterior, respectivamente, al intervalo modal.

MARCA DE CLASE

Marca de clase: Es el punto medio de una clase y se


obtiene sumando los límites inferiores (LIA) y
superiores de una clase (LSA) y dividiendo el
resultado entre dos. La marca de clase la
denotaremos como MC. =2 LSA+ LIA/2
Donde:
M C = Marca de clase
LIA = Límite inferior aparente
LSA = Límite superior aparente
Ejemplo: De la siguiente tabla obtenga la marca de
clase.
2 LSA LIA MC
Ejemplo: fi (LIA + MC
De la LSA )/2
siguiente
tabla
obtenga la
marca de
clase
CLASE

5–7 5 (5 + 7 )/2 6

8 – 10 10 (8 + 10 )/2 9

11 – 13 15 (11 + 12
13 )/2

14 – 16 18 (14 + 13
16 )/2

17 – 19 11 (17 + 18
19 )/2

20 – 22 5 (20 + 21
22 )/2 MUESTREO

Totales 64 técnica para la selección de una muestra a


partir de una población estadística.Al elegir
una muestra aleatoria se espera conseguir que sus propiedades
sean extrapolables a la población. Este proceso permite ahorrar
recursos, y a la vez obtener resultados parecidos a los que se
alcanzarían si se realizase un estudio de toda la población.

Parámetro
es un número que resume la gran
cantidad de datos que pueden derivarse
del estudio de una variable estadística.
El cálculo de este número está bien
definido, usualmente mediante una
fórmula aritmética obtenida a partir de
datos de la población..

población
es un conjunto de sujetos, individuos, elementos o
eventos con determinadas características. A
menudo se obtiene una muestra de dicha
población, es decir un subconjunto representativo.
Luego de realizar un análisis estadístico a la
muestra, los resultados se extrapolan al resto de la
población (inferencia estadíst ica).

El
percentil
es una medida de posición usada en estadística que
indica, una vez ordenados los datos de menor a mayor,
el valor de la variable por debajo del cual se encuentra
un porcentaje dado de observaciones en un grupo de
observaciones.

Probabilidad
propone modelos para los fenómenos aleatorios, es
decir, lo s que se pueden predecir con certeza, y estudia
sus consecuencias lógicas.

Rango

es el punto en la grafica mas alto; por ello, comparte


unidades con los datos. Permite obtener una idea de la
dispersión de los datos, cuanto mayor es el rango, más
dispersos están los datos (sin considerar la afectación de
los valores extremos).
Tabla de distribución de frecuencias

La distribución de frecuencias o tabla de


frecuencias es una ordenación en forma de
tabla de los datos estadísticos, asignando
a cada dato su frecuencia correspondiente.

varianza

es la raíz cuadrada de la desviación estándar, siendo una media de las frecuencias con la media
elevadas al cuadrado. Para calcular la varianza seguiremos los pasos enumerados a continuación:

 Calcular la media realizando el promedio de los números

 Restar la media a cada número anterior y elevarlo al cuadrado

 Calcular la media de las diferencias al cuadrado obtenidas en el punto anterior

valor

es cada uno de los distintos resultados que


se pueden obtener en un estudio
estadístico. Si lanzamos una moneda al aire
5 veces obtenemos dos valores: cara y cruz.
Un dato es cada uno de los valores que se
ha obtenido al realizar un estudio
estadístico.

VARIABLE
es una característica que puede fluctuar y cuya
variación es susceptible de adoptar diferentes valores,
los cuales pueden medirse u observarse. Las
variables adquieren valor cuando se relacionan con
otras variables, es decir, si forman parte de una
hipótesis o de una teoría.

VARIABLE

CUANTITATIVA

Son las variables que toman como argumento


cantidades numéricas, son variables matemáticas. Las
variables cuantitativas además pueden ser: Variable
discreta: Es la variable que presenta separaciones o
inter rupciones en la escala de valores que puede
tomar.

variables cualitativas

se refieren a características o cualidades


que no pueden ser medidas con números.
Podemos distinguir dos tipos:

Variable cualitativa nominal

Una variable cualitativa nominal presenta


modalidades no numéricas que no admiten
un criterio de orden. Por ejemplo:

El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.

variable discreta
es una variable que no puede tomar algunos
valores dentro de un mínimo conjunto numerable,
quiere decir, no acepta cualquier valor, únicamente
aquellos que pertenecen al conjunto. Estas
variables se dan de modo coherente separaciones
entre valores observables sucesivos.
variable continua
es aquella que puede tomar un número infinito de
valores entre dos valores cualesquiera de una
caraterística. La altura de los 5 amigos: 1.73, 1.82,
1.77, 1.69, 1.75.

variable cualitativa nominal


presenta modalidades no numéricas que no
admiten un criterio de orden. Ejemplo: El estado
civil, con las siguientes modalidades: soltero,
casado, separado, divorciado y viudo.

Variable cualitativa ordinal o variable


cuasicuantitativa

Una variable cualitativa ordinal presenta


modalidades no númericas, en las que existe un
orden. Por ejemplo:

La nota en un examen: suspenso, aprobado,


notable, sobresaliente.
Puesto conseguido en una prueba deportiva: 1º, 2º,
3º, ...
Medallas de una prueba deportiva: oro, plata,
bronce.
variable dependiente
es aquella cuyos valores dependen de los que tomen otra
variable. La variable dependiente en una función que
suele representar por y. ... La variable dependiente es el
factor que es observado y medido para determinar el
efecto de la variable independiente.

variable dependiente
es aquella cuyos valores dependen de los que
tomen otra variable.

You might also like