Professional Documents
Culture Documents
la Geoestadística
Contenido
Nociones básicas de estadísticas......................................................................................................... 5
Que es la estadística........................................................................................................................ 5
Estadística Descriptiva..................................................................................................................... 5
Estadística inferencial...................................................................................................................... 5
Población y muestra ........................................................................................................................ 5
Tipos de variables ............................................................................................................................ 6
Recopilación de los datos ................................................................................................................ 6
Fuentes de datos ......................................................................................................................... 6
Técnicas para obtener datos ....................................................................................................... 6
Presentación de los datos ............................................................................................................... 7
Distribución de frecuencias ............................................................................................................. 7
Presentación grafica de datos ......................................................................................................... 7
Cualitativa.................................................................................................................................... 7
Cuantitativa ................................................................................................................................. 7
Análisis descriptivo de los datos ..................................................................................................... 7
Medidas de Posición ....................................................................................................................... 7
Tendencia central ........................................................................................................................ 7
Tendencia no centrales ................................................................................................................... 7
Medidas de dispersión .................................................................................................................... 8
Medidas de forma ........................................................................................................................... 8
Distribuciones de Probabilidad ....................................................................................................... 8
Discretas .......................................................................................................................................... 8
Bernoulli ...................................................................................................................................... 8
Binomial....................................................................................................................................... 8
Poisson ........................................................................................................................................ 8
Continuas ........................................................................................................................................ 8
Uniforme ..................................................................................................................................... 8
Normal/Lognormal ...................................................................................................................... 8
Exponencial ................................................................................................................................. 8
Gamma ........................................................................................................................................ 8
Introducción al ramo de geoestadística .............................................................................................. 8
Geoestadística ................................................................................................................................. 9
Análisis exploratorio de los datos (AED) ..................................................................................... 9
Análisis estructural ...................................................................................................................... 9
Predicciones ................................................................................................................................ 9
Concepto de variable regionalizada .................................................................................................... 9
Función aleatoria y Variable Regionalizada .................................................................................... 9
Modelar ......................................................................................................................................... 10
Principios a respetar.................................................................................................................. 10
Modelación en minería ................................................................................................................. 10
Ejemplos de modelación en minería ......................................................................................... 10
Pasos de la estructura propuesta para la modelación .............................................................. 10
Caracterización de una Variable Aleatoria .................................................................................... 10
Hipótesis simplificadoras .............................................................................................................. 10
Momentos de una función aleatoria............................................................................................. 11
Esperanza ...................................................................................................................................... 11
Varianza ......................................................................................................................................... 11
Covarianza ..................................................................................................................................... 12
Variograma .................................................................................................................................... 12
Otras mediciones .......................................................................................................................... 12
Desviación Estándar .................................................................................................................. 12
coeficiente de variación ............................................................................................................ 12
Relación entre los momentos ....................................................................................................... 12
Resumen del capitulo .................................................................................................................... 13
Muestreo ....................................................................................................................................... 13
Protocolo de muestreo ................................................................................................................. 14
Errores de Muestreo ..................................................................................................................... 14
Estudio Exploratorio de datos ........................................................................................................... 14
Presentación de los datos ............................................................................................................. 14
Tabla de frecuencia e histograma ................................................................................................. 14
Estadísticas básicas ....................................................................................................................... 15
Medidas de posición ..................................................................................................................... 15
media......................................................................................................................................... 15
cuantiles .................................................................................................................................... 15
mínimo, máximo ....................................................................................................................... 15
moda ......................................................................................................................................... 15
Medidas de dispersión .................................................................................................................. 15
varianza, desviación estándar ................................................................................................... 15
coeficiente de variación ............................................................................................................ 15
rango ......................................................................................................................................... 15
rango intercuartil....................................................................................................................... 15
Medidas de formas ....................................................................................................................... 15
coeficiente de asimetría (skewness) ......................................................................................... 15
coeficiente de aplanamiento (kurtosis) .................................................................................... 15
Valores atípicos ............................................................................................................................. 15
Desagrupamiento .......................................................................................................................... 16
Método de los polígonos de influencia ......................................................................................... 16
Método de las celdas .................................................................................................................... 16
Scatterplot y coeficiente de correlación ....................................................................................... 17
Scatterplot ..................................................................................................................................... 17
Coeficiente de correlación ............................................................................................................ 17
Q-q plot ......................................................................................................................................... 17
Como se construye .................................................................................................................... 18
Q-q plot de una distribución normal y lognormal ......................................................................... 18
Variograma Experimental ................................................................................................................. 19
Variograma teórico ....................................................................................................................... 19
Variograma experimental ............................................................................................................. 19
Calculo y tolerancias...................................................................................................................... 20
Tolerancias .................................................................................................................................... 20
Calculo de V.E. ............................................................................................................................... 20
Influencias ..................................................................................................................................... 22
Del paso ..................................................................................................................................... 22
De la tolerancia en la distancia ................................................................................................. 22
De la tolerancia angular ............................................................................................................ 22
Interpretación ............................................................................................................................... 23
Ausencia de meseta ...................................................................................................................... 23
Fluctuaciones ................................................................................................................................ 24
Ciclicidad ....................................................................................................................................... 24
Problemas en los V.E. .................................................................................................................... 24
Datos atípicos (outliers) ................................................................................................................ 24
Saltos pseudo- periódicos ............................................................................................................. 25
Artefactos (Errores de precisión) .................................................................................................. 25
Propiedades de los V.E .................................................................................................................. 25
Anisotropías .................................................................................................................................. 26
Anisotropía .................................................................................................................................... 26
Definición .................................................................................................................................. 26
Identificación ............................................................................................................................. 26
Mapa Variográfico ......................................................................................................................... 26
Anisotropía Geométrica ................................................................................................................ 26
Anisotropía Zonal .......................................................................................................................... 27
Anisotropías complejas ................................................................................................................. 28
Estadística Descriptiva
Se encarga de la recolección, agrupación y presentación de los datos.
Estadística inferencial
Utiliza una muestra para sacar alguna inferencia sobre la población. Su objetivo es obtener
información acerca de la población, partiendo de la información que contiene la muestra.
Población y muestra
La población es el conjunto de todos los individuos, un individuo es cualquier elemento que porte
información sobre el fenómeno que se estudia.
Una muestra es un subconjunto seleccionado a partir de una población, se intenta que sea lo más
representativa. Al proceso de obtener muestras se le llama muestreo.
Además, de lo anterior un muestreo puede ser con o sin reemplazo, para el primer caso un
elemento puede ser seleccionado más de una vez y en el segundo caso, cada miembro solo puede
seleccionado una vez. Notar que el tamaño de la población no varía en el primer caso y en el
segundo sí.
Tipos de variables
Una variable es una característica de interés acerca de cada elemento de una población o muestra.
Un dato es el valor de la variable asociada a un elemento. Un experimento es una actividad
planeada para producir un conjunto de datos.
Circular
Cuantitativa
Histogramas
Mediana
Moda
Tendencia no centrales
Cuantiles
Medidas de dispersión
De distancia
Rango
Varianza
Medidas de forma
Distribuciones de Probabilidad
Discretas
Bernoulli
Binomial
Poisson
Continuas
Uniforme
Normal/Lognormal
Exponencial
Gamma
Estas competencias serán utilidad para tomar decisiones respecto de forma y límites de
recursos mineros de interés económico y frente al ordenamiento territorial y distribución
optima de residuos mineros, evaluando sus externalidades socio-territoriales y socio-
ambientales.
Geoestadística
Estructura espacial
Análisis estructural
Se estudia la continuidad espacial de la variable; se calcula el variograma experimental, u otra
función que explique la variabilidad espacial; se ajusta al mismo un variograma teórico, y se estudia
en detalle las características de éste último.
Predicciones
Se estima la variable en los puntos no muestréales, considerando la estructura de correlación
espacial seleccionada e integrando toda la información conocida.
Las variables {Z(x), x Rd} constituyen una función aleatoria, la variable regionalizada es
una realización de una función aleatoria.
La variable regionalizada es una variable numérica que se distribuye en el espacio. En general,
presenta cierta “continuidad” espacial, pero varía irregularmente y escapa a toda representación
simple.
Localmente a menudo es muy irregular y no puede ser representada por una función matemática
determinista y globalmente presenta cierta organización o estructura en el espacio.
Modelar
Principios a respetar
El modelo debe ser consistente con los datos.
Principio de realismo: encontrar un modelo que entrega una descripción adecuada de la
variable, ni demasiado simplificada, ni demasiado formada.
Principio de economía: encontrar el modelo menos exigente que permite resolver el problema
planteado.
Reconstrucción operatoria: plantear el resultado en términos objetivos, susceptibles de ser
refutados si se tuviera un conocimiento exhaustivo de la variable regionalizada.
Modelación en minería
Ejemplos de modelación en minería
Ley de Mineral
Hipótesis simplificadoras
Es necesario poder inferir todo o parte de la distribución espacial a partir del conjunto de
datos disponibles.
Esperanza
Es un promedio ponderado por las probabilidades, si existe da una idea del centro de la
distribución.
𝑛
𝐸{𝑍} = 𝑚 = ∑ 𝑤𝑖 𝑧𝑖
𝑖=1
n = Número de datos
Varianza
Nos da una idea de la dispersión de la distribución de la variable aleatoria Z. Se define como la
esperanza de la desviación de Z respecto de su media al cuadrado:
𝑖=1
Covarianza
Variograma
Los parámetros más importantes son los dos últimos, pues modelan la interacción entre dos valores,
luego dan una imagen sintética de la continuidad de la variable regionalizada en el espacio. La
covarianza indica qué tan semejantes son los valores entre dos sitios, mientras que el variograma
qué tan desemejantes son.
Otras mediciones
Desviación Estándar
Es la raíz cuadrada de la varianza, también es una medida de la variabilidad de los datos respecto a
la media. Se escribe en las mismas unidades de la variable.
coeficiente de variación
Es adimensional, es la razón entre la desviación estándar y la media.
Muestreo
Para mayor información ir a al capítulo nociones de estadísticas.
Hipótesis de trabajo:
La ley de la muestra es correcta
Puede utilizarse como un valor sin incertidumbre
Práctica:
Muestra que se toma es pequeña
Existe un error respecto a ley del conjunto a representar
Protocolo de muestreo
Errores de Muestreo
Utilidad
ver la distribución de valores (rango, forma, asimetría)
*Recordar que los histogramas y las curvas de tonelaje – ley dependen del soporte (es, decir, el
volumen) de la medición.
Estadísticas básicas
Medidas de posición
media
cuantiles
mínimo, máximo
moda
Medidas de dispersión
varianza, desviación estándar
coeficiente de variación
rango
rango intercuartil
Medidas de formas
coeficiente de asimetría (skewness)
coeficiente de aplanamiento (kurtosis)
Valores atípicos
Nunca se debe eliminar un valor “atípico” sin razón (falla en el protocolo de medición, en la
transcripción del dato, valor ausente codificado como -99, etc.).
A menudo, los valores atípicos son aquellos de mayor interés (evaluación de recurso,
concentración de contaminantes)
Desagrupamiento
Consiste en ponderar los datos al momento de calcular su histograma, tomando en cuenta el
grado de aislamiento de cada dato.
Estos algoritmos de desagrupamiento son útiles cuando la malla de muestreo no es regular (en
especial, cuando se tiene un muestreo preferencial).
Pro: consideran criterios geométricos al ponderar los datos en función de su grado de aislamiento:
mientras más aislado, mayor ponderación.
Contra: no toman en cuenta la continuidad espacial de los valores, aunque idealmente este factor
también debería ser tomado en consideración.
Scatterplot y coeficiente de correlación
Scatterplot
Visualiza los valores de una variable en función de otra
Coeficiente de correlación
El coeficiente de correlación lineal es un índice entre –1 y 1 de la “similitud” entre dos variables. Es
sensible a la presencia de valores aberrantes y no detecta relaciones no lineales.
Cuando existen más de dos variables, se puede construir una matriz de Correlación.
Q-q plot
Gráfico Q-Q: para comparar dos distribuciones F1 y F2 cuantil a cuantil.
Si todos los puntos caen en una línea de 45 distribuciones son exactamente iguales
Si la línea está desplazada de los 45°, las dos distribuciones tienen la misma forma, pero
diferentes medias
Si la inclinación de la línea no es 45°, las dos distribuciones tienen diferentes varianzas
Si hay un carácter no lineal en el grafico Q-Q, las distribuciones tienen diferentes formas en el
histograma.
*No se utiliza para comparar la relación par a par que hay entre las variables.
Como se construye
Escoger una serie de valores de probabilidad
Pk, k = 1, 2, …, K
Graficar q1(pk) versus q2(pk), k = 1, 2, …, K
Variograma Experimental
Variograma teórico
El variograma teórico para una distancia vectorial h se define como:
Variograma experimental
Se obtiene, reemplazando la esperanza matemática por la media experimental correspondiente:
Calculo de V.E.
De la tolerancia en la distancia
De la tolerancia angular
Interpretación
Ausencia de meseta
• Regla empírica:
Ciclicidad
• Variograma con valores atípicos de alto valor de azufre, difiere notoriamente con los
variogramas sin estos valores
• Solución: se eliminaron los valores atípicos
• OJO: Los valores atípicos se encontraban en zona geográfica distinta que iba a ser
tratada separada de las demás
• Carbón con alto contenido de azufre es menos valioso que el con bajo contenido de
azufre.
• Lo anterior no siempre ocurre como por ejemplo en zonas de alta ley de cobre u oro
• es imperfecto (los valores obtenidos pueden ser imprecisos y cambiar según las tolerancias
usadas)
• es incompleto (se calculó de manera discreta a lo largo de algunas direcciones del espacio)
Anisotropías
Anisotropía
Definición
Un variograma es isótropo si es idéntico en todas las direcciones del espacio. En caso contrario,
existe anisotropía, la cual indica que la variable regionalizada posee direcciones preferenciales en
cuanto a su continuidad espacial.
Identificación
Una herramienta para detectar las anisotropías es el mapa variográfico, o sea el mapa de
isovalores del variograma experimental en función de la separación (distancia y orientación).
Mapa Variográfico
Esta herramienta consiste en calcular y visualizar el variograma experimental en todas las
direcciones del espacio, bajo la forma de un mapa de color. De este modo, se puede distinguir si
existe anisotropía y calcular el variograma a lo largo de las direcciones principales de anisotropía.
Anisotropía Geométrica
El mapa variográfico dibuja elipses (2D) o elipsoides (3D). El modelamiento sólo requiere
especificar las direcciones principales (ortogonales entre sí) y los alcances correspondientes.
Alcances diferentes en direcciones diferentes, explicado por:
Anisotropía Zonal
El mapa variográfico dibuja bandas; se trata de un caso límite de anisotropía geométrica, donde el
alcance en una dirección se vuelve muy grande. A la escala de trabajo, la meseta cambia según la
dirección.
Cambio de meseta según la dirección
Anisotropías complejas
Variograma modelado
Modelo de variograma
Se ajusta un modelo de variograma, definido en todas las direcciones del espacio y para todas las
distancias, en torno al variograma experimental obtenido.
Se usará este modelo como si fuera el “verdadero” variograma de la función aleatoria que
representa la variable en estudio.
Restricciones Matemáticas
Un modelo de variograma debe satisfacer varias restricciones matemáticas:
para distancias muy grandes, crece menos rápidamente que una parábola
Características esenciales
Comportamiento en el origen
Mientras más regular es el variograma en el origen (distancias cercanas a 0), más regular es la
variable regionalizada en el espacio. Se distingue tres tipos de comportamiento para el
variograma:
Comportamiento direccional
El estudio de los variogramas direccionales o del mapa variográfico permite identificar las
anisotropías de la variable regionalizada.
Otras Características
Periodicidades: frecuente con fenómenos temporales, menos con fenómenos espaciales
Efecto de hoyo: el variograma no es monótono
Modelos elementales
Se analizarán modelos teóricos isótropos, en decir, que no dependan más que de r = |h|. Se
pueden clasificar en tres categorías:
• Seno cardinal
• J de Bessel
• Coseno y coseno amortiguado
• Estable
• Potencia
• Lineal
• Logarítmico
Efecto Pepita
Modelo Esférico
Modelo Exponencial
Modelo Gaussiano
Modelo potencia
Luego se agrega una estructura (exponencial) que llega a la primera meseta, con alcances propios
a cada dirección
Luego se agrega una segunda estructura para llegar a la segunda meseta, dejando infinito el
alcance en la dirección 1
Finalmente se agrega una tercera estructura para llegar a la meseta total, dejando infinitos los
alcances en las direcciones 1 y 2
Consideraciones Practicas
• Generalmente, se busca modelar anisotropías sencillas, con 2 ó 3 direcciones principales
ortogonales entre sí
buscar la elipse o el elipsoide que mejor se acerca al mapa variográfico
• El variograma experimental es poco confiable para las distancias grandes (superiores a la
mitad del diámetro del campo).
• La meseta del variograma (varianza teórica) puede diferir de la varianza del histograma
(varianza empírica).
• Se debe prestar atención a la representatividad de los puntos experimentales, a la
información disponible sobre la variable regionalizada y a la escala de trabajo.
• Las distancias pequeñas son las más importantes.
describen la continuidad a pequeña escala.
son cruciales para la interpolación a partir de los datos cercanos.
• Desconfiar de los procedimientos de ajuste automáticos
el análisis variográfico debe ser un trabajo interactivo, donde el usuario tiene la
palabra final.
• No existe un modelo único.
Validación Cruzada
Objetivos
• validar el modelo teórico de variograma
El kriging es un método que permite estimar el valor de una variable con un promedio ponderado
de los valores de los datos vecinos. La ponderación óptima depende del modelo de variograma.
Como resultado, el kriging también entrega la desviación estándar del error, que mide la amplitud
potencial de éste.
Procedimiento
• estimar sucesivamente por kriging cada dato, considerando solamente los datos restantes
• calcular el error de estimación (valor estimado menos valor real) cometido en cada sitio
con dato
• estudiar la calidad de los errores de estimación por medio de herramientas estadísticas y
gráficas. Se puede complementar con el estudio de errores estandarizados (es decir, los
errores divididos por su desviación estándar calculada por el kriging).
Kriging
Estimadores Lineales
La idea básica es estimar el valor de una variable regionalizada (por ejemplo, la ley de cobre total)
en una posición u donde no conocemos el valor verdadero, planteando:
donde Z*(u) es el valor estimado para la posición u, {Z(ui )=1...n} son los valores de los datos en las
posiciones {ui, i=1...n}, a es un coeficiente aditivo y {, i=1...n} son ponderadores.
Inverso de la distancia
Atribuye a cada data una ponderación proporcional al inverso de su distancia al sitio a estimar
Kriging
Los estimadores anteriores son sencillos de aplicar, pero la asignación de la ponderación sólo
depende del criterio de cercanía.
La idea del método de kriging es incorporar los otros criterios (redundancias entre datos,
continuidad espacial, anisotropía) mediante el uso del variograma.
De este modo, se logra obtener estimaciones más precisas
→ mejor planificación, mejor selección estéril / mineral, +$$$
El Kriging es el mejor estimador lineal insesgado (Best Linear Unbiased Estimator, BLUE)
– “lineal” porque es una combinación lineal ponderada de los datos
– “mejor” en el sentido del error de varianza mínima para un modelo dado de covarianza /
variograma
Kriging Simple
Hipótesis
1) Se conoce el valor promedio m de la variable regionalizada
2) También se conoce el variograma (h), el cual presenta una meseta:
Queremos construir el “mejor estimador lineal insesgado” para estimar el valor en un sitio u:
Varianza mínima
La varianza del error de estimación se expresa en función de la covarianza
Este sistema de n ecuaciones con n ponderadores desconocidos es el sistema de kriging simple
(KS)
El estimador se escribe:
Puede calcularse sin conocer los valores de los datos. Se demuestra que esta varianza siempre es
menor o igual a 2.
Kriging Ordinario
Hipótesis
1) No se conoce el valor promedio m de la variable regionalizada. Esto permite generalizar el
kriging a situaciones donde esta media no es constante en el espacio: la media puede variar de
una región a otra, siempre que sea aproximadamente constante en cada vecindad de kriging.
2) Sólo se conoce el variograma (h) o la función de covarianza C(h)
Condición de insesgo
El valor esperado del error de estimación es:
Siendo m desconocida, para que este valor esperado sea nulo se debe plantear
Varianza mínima
La varianza del error de estimación se expresa en función de
la covarianza
Los ponderadores óptimos (que minimizan la varianza del error sujeto a que la suma de los
ponderadores sea igual a 1) puedendeterminarse introduciendo un multiplicador de Lagrange
y anulando las derivadas parciales con respecto a los ponderadores y con respecto al
multiplicador de Lagrange
Las derivadas parciales son:
Simulación
Motivación: límites del Kriging
Principios de la simulación
Estimación y simulación
Modelo Multi-Gaussiano
Definición
Simulación multigaussiana
Transformación
Validación modelo multigaussiana
Test de la distribución bigaussina
Resumen simulación condicional
Categorización de recursos y reservas