You are on page 1of 44

Notas introductorias a

la Geoestadística

Contenido
Nociones básicas de estadísticas......................................................................................................... 5
Que es la estadística........................................................................................................................ 5
Estadística Descriptiva..................................................................................................................... 5
Estadística inferencial...................................................................................................................... 5
Población y muestra ........................................................................................................................ 5
Tipos de variables ............................................................................................................................ 6
Recopilación de los datos ................................................................................................................ 6
Fuentes de datos ......................................................................................................................... 6
Técnicas para obtener datos ....................................................................................................... 6
Presentación de los datos ............................................................................................................... 7
Distribución de frecuencias ............................................................................................................. 7
Presentación grafica de datos ......................................................................................................... 7
Cualitativa.................................................................................................................................... 7
Cuantitativa ................................................................................................................................. 7
Análisis descriptivo de los datos ..................................................................................................... 7
Medidas de Posición ....................................................................................................................... 7
Tendencia central ........................................................................................................................ 7
Tendencia no centrales ................................................................................................................... 7
Medidas de dispersión .................................................................................................................... 8
Medidas de forma ........................................................................................................................... 8
Distribuciones de Probabilidad ....................................................................................................... 8
Discretas .......................................................................................................................................... 8
Bernoulli ...................................................................................................................................... 8
Binomial....................................................................................................................................... 8
Poisson ........................................................................................................................................ 8
Continuas ........................................................................................................................................ 8
Uniforme ..................................................................................................................................... 8
Normal/Lognormal ...................................................................................................................... 8
Exponencial ................................................................................................................................. 8
Gamma ........................................................................................................................................ 8
Introducción al ramo de geoestadística .............................................................................................. 8
Geoestadística ................................................................................................................................. 9
Análisis exploratorio de los datos (AED) ..................................................................................... 9
Análisis estructural ...................................................................................................................... 9
Predicciones ................................................................................................................................ 9
Concepto de variable regionalizada .................................................................................................... 9
Función aleatoria y Variable Regionalizada .................................................................................... 9
Modelar ......................................................................................................................................... 10
Principios a respetar.................................................................................................................. 10
Modelación en minería ................................................................................................................. 10
Ejemplos de modelación en minería ......................................................................................... 10
Pasos de la estructura propuesta para la modelación .............................................................. 10
Caracterización de una Variable Aleatoria .................................................................................... 10
Hipótesis simplificadoras .............................................................................................................. 10
Momentos de una función aleatoria............................................................................................. 11
Esperanza ...................................................................................................................................... 11
Varianza ......................................................................................................................................... 11
Covarianza ..................................................................................................................................... 12
Variograma .................................................................................................................................... 12
Otras mediciones .......................................................................................................................... 12
Desviación Estándar .................................................................................................................. 12
coeficiente de variación ............................................................................................................ 12
Relación entre los momentos ....................................................................................................... 12
Resumen del capitulo .................................................................................................................... 13
Muestreo ....................................................................................................................................... 13
Protocolo de muestreo ................................................................................................................. 14
Errores de Muestreo ..................................................................................................................... 14
Estudio Exploratorio de datos ........................................................................................................... 14
Presentación de los datos ............................................................................................................. 14
Tabla de frecuencia e histograma ................................................................................................. 14
Estadísticas básicas ....................................................................................................................... 15
Medidas de posición ..................................................................................................................... 15
media......................................................................................................................................... 15
cuantiles .................................................................................................................................... 15
mínimo, máximo ....................................................................................................................... 15
moda ......................................................................................................................................... 15
Medidas de dispersión .................................................................................................................. 15
varianza, desviación estándar ................................................................................................... 15
coeficiente de variación ............................................................................................................ 15
rango ......................................................................................................................................... 15
rango intercuartil....................................................................................................................... 15
Medidas de formas ....................................................................................................................... 15
coeficiente de asimetría (skewness) ......................................................................................... 15
coeficiente de aplanamiento (kurtosis) .................................................................................... 15
Valores atípicos ............................................................................................................................. 15
Desagrupamiento .......................................................................................................................... 16
Método de los polígonos de influencia ......................................................................................... 16
Método de las celdas .................................................................................................................... 16
Scatterplot y coeficiente de correlación ....................................................................................... 17
Scatterplot ..................................................................................................................................... 17
Coeficiente de correlación ............................................................................................................ 17
Q-q plot ......................................................................................................................................... 17
Como se construye .................................................................................................................... 18
Q-q plot de una distribución normal y lognormal ......................................................................... 18
Variograma Experimental ................................................................................................................. 19
Variograma teórico ....................................................................................................................... 19
Variograma experimental ............................................................................................................. 19
Calculo y tolerancias...................................................................................................................... 20
Tolerancias .................................................................................................................................... 20
Calculo de V.E. ............................................................................................................................... 20
Influencias ..................................................................................................................................... 22
Del paso ..................................................................................................................................... 22
De la tolerancia en la distancia ................................................................................................. 22
De la tolerancia angular ............................................................................................................ 22
Interpretación ............................................................................................................................... 23
Ausencia de meseta ...................................................................................................................... 23
Fluctuaciones ................................................................................................................................ 24
Ciclicidad ....................................................................................................................................... 24
Problemas en los V.E. .................................................................................................................... 24
Datos atípicos (outliers) ................................................................................................................ 24
Saltos pseudo- periódicos ............................................................................................................. 25
Artefactos (Errores de precisión) .................................................................................................. 25
Propiedades de los V.E .................................................................................................................. 25
Anisotropías .................................................................................................................................. 26
Anisotropía .................................................................................................................................... 26
Definición .................................................................................................................................. 26
Identificación ............................................................................................................................. 26
Mapa Variográfico ......................................................................................................................... 26
Anisotropía Geométrica ................................................................................................................ 26
Anisotropía Zonal .......................................................................................................................... 27
Anisotropías complejas ................................................................................................................. 28

Nociones básicas de estadísticas


Que es la estadística
Rama de las matemáticas que se ocupa de reunir, organizar, presentar, analizar e
interpretar datos numéricos y ayuda a resolver problemas como el diseño de experimentos y toma
de decisiones.

Estadística Descriptiva
Se encarga de la recolección, agrupación y presentación de los datos.

Estadística inferencial
Utiliza una muestra para sacar alguna inferencia sobre la población. Su objetivo es obtener
información acerca de la población, partiendo de la información que contiene la muestra.

Población y muestra
La población es el conjunto de todos los individuos, un individuo es cualquier elemento que porte
información sobre el fenómeno que se estudia.

Una muestra es un subconjunto seleccionado a partir de una población, se intenta que sea lo más
representativa. Al proceso de obtener muestras se le llama muestreo.

Destacando dos tipos

Aleatorio: Se obtiene dándole la misma oportunidad a cada elemento de la población de


pertenecer a la muestra.
No aleatorio: No se le da la misma oportunidad a cada elemento de la población de pertenecer a la
muestra.

Además, de lo anterior un muestreo puede ser con o sin reemplazo, para el primer caso un
elemento puede ser seleccionado más de una vez y en el segundo caso, cada miembro solo puede
seleccionado una vez. Notar que el tamaño de la población no varía en el primer caso y en el
segundo sí.

Tipos de variables
Una variable es una característica de interés acerca de cada elemento de una población o muestra.
Un dato es el valor de la variable asociada a un elemento. Un experimento es una actividad
planeada para producir un conjunto de datos.

Dependiendo del número de características que se analicen de la población, las variables se


pueden clasificar como: Unidimensionales, Bidimensionales y multidimensionales.

Dependiendo del tipo de datos de las variables se pueden clasificar en:

Variables cualitativas: no se pueden medir numéricamente.

Cuantitativas: Tienen un valor numérico. Donde estas se pueden subdividir en discretas y


continuas.

Recopilación de los datos


Fuentes de datos
Las fuentes de los datos pueden ser internas como externas.

Técnicas para obtener datos


Para obtener la información existen varias formas, tales como, encuestas, entrevistas, cuestionario
y observación.
Presentación de los datos
Distribución de frecuencias
La información estadística puede constar de un gran numero de observaciones y es por esto que
es necesario presentarla en forma resumida. Un resumen útil de la información es una distribución
de frecuencias, donde esta muestra la frecuencia de cada valor de la variable.

Presentación grafica de datos


Cualitativa
Gráficos de barras

Circular

Cuantitativa
Histogramas

Análisis descriptivo de los datos


Medidas de Posición
Tendencia central
Media

Mediana

Moda

Tendencia no centrales
Cuantiles
Medidas de dispersión
De distancia

Rango

Varianza

Medidas de forma

Distribuciones de Probabilidad
Discretas
Bernoulli
Binomial
Poisson

Continuas
Uniforme
Normal/Lognormal
Exponencial
Gamma

Introducción al ramo de geoestadística

Se estudian los métodos estadísticos aplicables a situaciones generales de ingeniería y en


particular al tratamiento de datos con distribución espacial, para desarrollar la capacidad de
procesar y construir modelos a partir de datos puntuales obtenidos del muestreo, para
representar, interpretar o simular cualquier fenómeno que tenga relación espacial en un
territorio dado.

Estas competencias serán utilidad para tomar decisiones respecto de forma y límites de
recursos mineros de interés económico y frente al ordenamiento territorial y distribución
optima de residuos mineros, evaluando sus externalidades socio-territoriales y socio-
ambientales.
Geoestadística

La geoestadística se utiliza para el modelado de datos espaciales, proporciona estimaciones


precisas y fiables de los fenómenos en los lugares donde no se dispone de mediciones.

“La aplicación de métodos probabilísticos para variables regionalizadas”

“A la diferencia de las estadísticas convencionales, sea cual sea la complejidad y la


irregularidad del fenómeno real, la geoestadística busca exhibir una estructura de correlación
espacial. Esto explica la idea intuitiva de que los puntos cercanos en el espacio deben ser
probablemente cercanos en los valores. En otras palabras, aleatoriedad no significa
independencia.”

Estructura espacial

Esta estructura espacial se caracteriza por el “variograma”

Todo trabajo Geoestadistico tiene que llevarse a cabo en tres etapas:

Análisis exploratorio de los datos (AED)


Se estudian los datos muéstrales; se obtienen las estadísticas básicas; se comprueba la consistencia
de los datos, eliminándose los erróneos e identificándose las distribuciones de las que provienen.

Análisis estructural
Se estudia la continuidad espacial de la variable; se calcula el variograma experimental, u otra
función que explique la variabilidad espacial; se ajusta al mismo un variograma teórico, y se estudia
en detalle las características de éste último.

Predicciones
Se estima la variable en los puntos no muestréales, considerando la estructura de correlación
espacial seleccionada e integrando toda la información conocida.

Concepto de variable regionalizada


Función aleatoria y Variable Regionalizada

Las variables {Z(x), x  Rd} constituyen una función aleatoria, la variable regionalizada es
una realización de una función aleatoria.
La variable regionalizada es una variable numérica que se distribuye en el espacio. En general,
presenta cierta “continuidad” espacial, pero varía irregularmente y escapa a toda representación
simple.
Localmente a menudo es muy irregular y no puede ser representada por una función matemática
determinista y globalmente presenta cierta organización o estructura en el espacio.

Modelar
Principios a respetar
 El modelo debe ser consistente con los datos.
 Principio de realismo: encontrar un modelo que entrega una descripción adecuada de la
variable, ni demasiado simplificada, ni demasiado formada.
 Principio de economía: encontrar el modelo menos exigente que permite resolver el problema
planteado.
 Reconstrucción operatoria: plantear el resultado en términos objetivos, susceptibles de ser
refutados si se tuviera un conocimiento exhaustivo de la variable regionalizada.

Modelación en minería
Ejemplos de modelación en minería
Ley de Mineral

Filtración de aguas acidas

Pasos de la estructura propuesta para la modelación

Caracterización de una Variable Aleatoria


Una variable aleatoria Z se caracteriza por una distribución de probabilidad, la cual se
representa por medio de:
 función de distribución:
 z  R, F(z) = Prob(z)
• una densidad de probabilidad (variable continua) o una masa de probabilidad (variable
discreta).

Hipótesis simplificadoras
Es necesario poder inferir todo o parte de la distribución espacial a partir del conjunto de
datos disponibles.

Estacionaridad estricta: la distribución espacial es invariante por traslación en el espacio


 n  N,  x1, ... xn  Rd,  h  Rd,  z  R,
F(z1,... zn; x1, ... xn) = F(z1,... zn; x1, ... z + h, ... xn n+ h)

Estacionariedad de orden 2: sus dos primeros momentos (esperanza y función de covarianza)


existen y son invariantes por traslación.
E{Z(x)} = m independiente de x
cov{Z(x+h), Z(x)} = C(h) solo depende de h
Ergodicidad: se puede aproximar las esperanzas matemáticas (promedio sobre las realizaciones)
por un promedio en el espacio

Momentos de una función aleatoria


Es ilusorio querer caracterizar enteramente la distribución espacial a partir de un número
restringido de datos. Por consiguiente, a menudo sólo se considera los parámetros más relevantes
o “primeros momentos”.

Esperanza
Es un promedio ponderado por las probabilidades, si existe da una idea del centro de la
distribución.
𝑛

𝐸{𝑍} = 𝑚 = ∑ 𝑤𝑖 𝑧𝑖
𝑖=1

E{Z} = valor esperado o “media” de Z

w = probabilidad de ocurrencia del i-ésimo valor.

n = Número de datos

Varianza
Nos da una idea de la dispersión de la distribución de la variable aleatoria Z. Se define como la
esperanza de la desviación de Z respecto de su media al cuadrado:

𝑉𝑎𝑟{𝑍} = 𝜎 2 = 𝐸{[𝑍 − 𝑚]2 } = 𝐸{𝑍 2 } − 𝑚2


𝑛

𝑉𝑎𝑟{𝑍} = 𝜎 = ∑ 𝑤𝑖 (𝑧𝑖 − 𝑚)2


2

𝑖=1
Covarianza

Variograma

Los parámetros más importantes son los dos últimos, pues modelan la interacción entre dos valores,
luego dan una imagen sintética de la continuidad de la variable regionalizada en el espacio. La
covarianza indica qué tan semejantes son los valores entre dos sitios, mientras que el variograma
qué tan desemejantes son.

Otras mediciones
Desviación Estándar
Es la raíz cuadrada de la varianza, también es una medida de la variabilidad de los datos respecto a
la media. Se escribe en las mismas unidades de la variable.

coeficiente de variación
Es adimensional, es la razón entre la desviación estándar y la media.

Relación entre los momentos


Resumen del capitulo

Muestreo
Para mayor información ir a al capítulo nociones de estadísticas.

Hipótesis de trabajo:
La ley de la muestra es correcta
Puede utilizarse como un valor sin incertidumbre
Práctica:
Muestra que se toma es pequeña
Existe un error respecto a ley del conjunto a representar
Protocolo de muestreo

Errores de Muestreo

Estudio Exploratorio de datos


Presentación de los datos
Estudiar mediante herramientas estadísticas simples la cantidad, calidad y ubicación de los datos
disponibles para analizar una variable regionalizada.

Definir la(s) zona(s) de estudio.

Anticipar dificultades o problemas que puedan surgir en la fase de estimación local o de


simulación.

Tabla de frecuencia e histograma


Dan una representación de la distribución experimental de los datos.

tabla de frecuencia – histograma

frecuencia acumulada – histograma acumulado o función de distribución


curvas de tonelaje – ley, ley promedio – ley...

Utilidad
ver la distribución de valores (rango, forma, asimetría)

detectar valores atípicos (outliers)

detectar bi o multi-modalidades (¿mezcla de varias poblaciones)

*Recordar que los histogramas y las curvas de tonelaje – ley dependen del soporte (es, decir, el
volumen) de la medición.

Estadísticas básicas
Medidas de posición
media
cuantiles
mínimo, máximo
moda

Medidas de dispersión
varianza, desviación estándar
coeficiente de variación
rango
rango intercuartil

Medidas de formas
coeficiente de asimetría (skewness)
coeficiente de aplanamiento (kurtosis)

Valores atípicos

Suelen plantear problemas en el estudio.


Introducen variabilidad y complican el estudio variográfico

Conducen a zonas amplias con valores estimados muy altos

Nunca se debe eliminar un valor “atípico” sin razón (falla en el protocolo de medición, en la
transcripción del dato, valor ausente codificado como -99, etc.).

A menudo, los valores atípicos son aquellos de mayor interés (evaluación de recurso,
concentración de contaminantes)

Desagrupamiento
Consiste en ponderar los datos al momento de calcular su histograma, tomando en cuenta el
grado de aislamiento de cada dato.

Método de los polígonos de influencia


Se pondera cada dato proporcionalmente a su volumen de influencia en el campo.

Método de las celdas


Se divide la zona muestreada en celdas de mismo volumen. Cada celda tiene el mismo
ponderador, el cual se reparte entre las muestras contenidas en esta celda.

Estos algoritmos de desagrupamiento son útiles cuando la malla de muestreo no es regular (en
especial, cuando se tiene un muestreo preferencial).

Pro: consideran criterios geométricos al ponderar los datos en función de su grado de aislamiento:
mientras más aislado, mayor ponderación.

Contra: no toman en cuenta la continuidad espacial de los valores, aunque idealmente este factor
también debería ser tomado en consideración.
Scatterplot y coeficiente de correlación
Scatterplot
Visualiza los valores de una variable en función de otra

 ve la relación par a par de ambas variables o “correlación”


 detectar valores aberrantes

Coeficiente de correlación
El coeficiente de correlación lineal es un índice entre –1 y 1 de la “similitud” entre dos variables. Es
sensible a la presencia de valores aberrantes y no detecta relaciones no lineales.

Muy sensible a valores aberrantes

El coeficiente de correlación cambia incluso de signo

Cuando existen más de dos variables, se puede construir una matriz de Correlación.

Q-q plot
Gráfico Q-Q: para comparar dos distribuciones F1 y F2 cuantil a cuantil.
 Si todos los puntos caen en una línea de 45 distribuciones son exactamente iguales
 Si la línea está desplazada de los 45°, las dos distribuciones tienen la misma forma, pero
diferentes medias
 Si la inclinación de la línea no es 45°, las dos distribuciones tienen diferentes varianzas
 Si hay un carácter no lineal en el grafico Q-Q, las distribuciones tienen diferentes formas en el
histograma.

*No se utiliza para comparar la relación par a par que hay entre las variables.

Como se construye
 Escoger una serie de valores de probabilidad
Pk, k = 1, 2, …, K
 Graficar q1(pk) versus q2(pk), k = 1, 2, …, K

Q-q plot de una distribución normal y lognormal


Q-q plot de una distribución normal y lognormal con la distribución de las muestras
Son útiles para chequear la presencia de dos poblaciones que debe confirmarse con información
geológica.

Variograma Experimental
Variograma teórico
El variograma teórico para una distancia vectorial h se define como:

Variograma experimental
Se obtiene, reemplazando la esperanza matemática por la media experimental correspondiente:

Denotemos como {x, 1... n} los sitios con datos.


con N(h) {() tal que xxh}
| N(h) | = cardinal de N(h)
Calculo y tolerancias
Tolerancias
Cuando la malla de muestreo es irregular, se suele definir parámetros de tolerancia, tanto en la
longitud del vector h como en su orientación:

Parámetros a especificar para calcular un variograma experimental

• dirección de interés: acimut, inclinación

• distancias de interés: paso, número de pasos

• tolerancia en la dirección: tolerancia angular, anchos de banda

• tolerancia en las distancias

Calculo de V.E.

1.-Especificación de dirección (irregular):


2.-Comienzo con una separación
Influencias
Del paso

De la tolerancia en la distancia

De la tolerancia angular
Interpretación

Ausencia de meseta

• Puede deberse a la escala de trabajo (distancias de cálculo < alcance).

• Puede deberse a la presencia de tendencias

• Puede interpretarse como función aleatoria de varianza infinita


Fluctuaciones

• Aumentan cuando aumenta la distancia de separación

• El variograma experimental no es confiable / interpretable para distancias muy grandes con


respecto al diámetro del dominio muestreado

• Regla empírica:

Calcular el variograma experimental para distancias menores a la mitad de este diámetro

Ciclicidad

• Puede estar vinculada a la periodicidad geológica

• Puede deberse a información limitada / mala elección de parámetros de cálculo

• Preocuparse del efecto pepita y una estimación razonable del alcance

Problemas en los V.E.


Datos atípicos (outliers)

• Variograma con valores atípicos de alto valor de azufre, difiere notoriamente con los
variogramas sin estos valores
• Solución: se eliminaron los valores atípicos

• OJO: Los valores atípicos se encontraban en zona geográfica distinta que iba a ser
tratada separada de las demás

• Carbón con alto contenido de azufre es menos valioso que el con bajo contenido de
azufre.

• Lo anterior no siempre ocurre como por ejemplo en zonas de alta ley de cobre u oro

Saltos pseudo- periódicos

• Variograma calculado con un paso de 40 m para contenido de ceniza en depósito de carbón

• En h = 150 m y h = 280 pareciese aparecer cierta periodicidad en el varigorama

• No era físicamente posible

• Se observa histograma de distancias entre pares de datos

• Se soluciona cambiando el paso a 100 m, suavizando el variograma.

Artefactos (Errores de precisión)


Errores del “operador” al considerar valores ceros o “mal etiquetar” datos inexistentes

• Distribución lognormal “antojadiza”

• Construcción de variograma con datos que no lo son realmente

Propiedades de los V.E

El variograma experimental es un estimador insesgado del variograma teórico, pero es poco


robusto, en especial cuando:

• la distancia h considerada es grande


• la malla de muestreo es muy irregular o preferencial

• la distribución de los valores es muy asimétrica o presenta valores extremos

• es imperfecto (los valores obtenidos pueden ser imprecisos y cambiar según las tolerancias
usadas)

• es incompleto (se calculó de manera discreta a lo largo de algunas direcciones del espacio)

Anisotropías
Anisotropía
Definición
Un variograma es isótropo si es idéntico en todas las direcciones del espacio. En caso contrario,
existe anisotropía, la cual indica que la variable regionalizada posee direcciones preferenciales en
cuanto a su continuidad espacial.

Identificación
Una herramienta para detectar las anisotropías es el mapa variográfico, o sea el mapa de
isovalores del variograma experimental en función de la separación (distancia y orientación).

Mapa Variográfico
Esta herramienta consiste en calcular y visualizar el variograma experimental en todas las
direcciones del espacio, bajo la forma de un mapa de color. De este modo, se puede distinguir si
existe anisotropía y calcular el variograma a lo largo de las direcciones principales de anisotropía.

Anisotropía Geométrica
El mapa variográfico dibuja elipses (2D) o elipsoides (3D). El modelamiento sólo requiere
especificar las direcciones principales (ortogonales entre sí) y los alcances correspondientes.
Alcances diferentes en direcciones diferentes, explicado por:

• Dirección de flujo preferencial de los fluidos mineralizantes

• Depositación en direcciones preferenciales (gradiente en temperatura, pH,…)

¿Muy común en la vertical y común en la horizontal?

Anisotropía Zonal
El mapa variográfico dibuja bandas; se trata de un caso límite de anisotropía geométrica, donde el
alcance en una dirección se vuelve muy grande. A la escala de trabajo, la meseta cambia según la
dirección.
Cambio de meseta según la dirección

• Cuando el variograma vertical alcanza una meseta más alta:

– Presumiblemente por varianza adicional de la estratificación

• Cuando el variograma vertical alcanza una meseta más baja:

–Presumiblemente por una diferencia significativa en el valor promedio en cada zona

el variograma horizontal tiene varianza adicional entre zonas

• Hay otras explicaciones

Anisotropías complejas

Se obtiene formas más complejas de anisotropía al superponer anisotropías geométricas y/o


zonales de orientación y razón diferentes.

Variograma modelado
Modelo de variograma
Se ajusta un modelo de variograma, definido en todas las direcciones del espacio y para todas las
distancias, en torno al variograma experimental obtenido.

Se usará este modelo como si fuera el “verdadero” variograma de la función aleatoria que
representa la variable en estudio.

Restricciones Matemáticas
Un modelo de variograma debe satisfacer varias restricciones matemáticas:

función positiva: (h)  0


función par: (h) (h)
nulidad en el origen: (0) 0
función de tipo negativo condicional

para distancias muy grandes, crece menos rápidamente que una parábola

Características esenciales
Comportamiento en el origen
Mientras más regular es el variograma en el origen (distancias cercanas a 0), más regular es la
variable regionalizada en el espacio. Se distingue tres tipos de comportamiento para el
variograma:

 derivable: variable regionalizada muy suave


 lineal: variable regionalizada continua
 discontinuo (“efecto pepita”): variable regionalizada errática

Comportamiento para distancias muy grandes


Frecuentemente, el variograma se estabiliza en torno a una meseta cuando la distancia crece
infinitamente.
A veces, el variograma sigue creciendo infinitamente (*ver interpretaciones de este).

Comportamiento direccional
El estudio de los variogramas direccionales o del mapa variográfico permite identificar las
anisotropías de la variable regionalizada.

Otras Características
Periodicidades: frecuente con fenómenos temporales, menos con fenómenos espaciales
Efecto de hoyo: el variograma no es monótono

Modelos elementales
Se analizarán modelos teóricos isótropos, en decir, que no dependan más que de r = |h|. Se
pueden clasificar en tres categorías:

Modelos con meseta y con un comportamiento en el origen

• Discontinuo (efecto pepita puro)


• Lineal (modelo esférico, exponencial)
• Parabólico (gaussiano, cúbico)
• Otros (triangular, cuadrático, circular, pentaesférico)

Modelo con meseta y efecto hoyo

• Seno cardinal
• J de Bessel
• Coseno y coseno amortiguado
• Estable

Modelo sin meseta

• Potencia
• Lineal
• Logarítmico

Efecto Pepita
Modelo Esférico

Modelo Exponencial
Modelo Gaussiano

Modelo potencia

Modelo seno cardinal


Modelos anidados
Para obtener modelos más complejos, se puede sumar varios variogramas elementales. En este
caso, se habla de “variogramas anidados” o “estructuras anidadas”.

El uso de variogramas anidados permite modelar cambios de pendientes en los variogramas


direccionales.

Relaciones entre varianza, variograma y covarianza


C(h) = E[Z(x)Z(x+h)] – m2
C(0) = 2
C(h) = C(-h)
|C(h)| = C(0)
(h) = C(0) – C(h)
Recordar que el variograma se puede escribir en términos de la varianza y la esperanza

(h) = 0,5Var{Z(x+h) – Z(x)} =0,5E{[Z(x+h) – Z(x)]2}


Y la varianza se puede escribir como

Var{Z(x)} = E{Z(x)2} – E{Z(x)}2


Identidad Importante
Sabemos que, para una combinación lineal de datos, la varianza podemos escribirla en función de
la covarianza como:
Reglas de ajuste
1) Determinar el efecto pepita

2) Determinar los alcances y mesetas en cada dirección

3) Determinar la cantidad y los tipos de modelos que se anidarán para el ajuste

Empezamos con un efecto pepita de amplitud (meseta) 0.1

Luego se agrega una estructura (exponencial) que llega a la primera meseta, con alcances propios
a cada dirección

Luego se agrega una segunda estructura para llegar a la segunda meseta, dejando infinito el
alcance en la dirección 1

Finalmente se agrega una tercera estructura para llegar a la meseta total, dejando infinitos los
alcances en las direcciones 1 y 2

La suma de las mesetas de los modelos anidados vale:

0.1 + 0.9 + 0.3 + 0.2 = 1.5 = meseta total

Consideraciones Practicas
• Generalmente, se busca modelar anisotropías sencillas, con 2 ó 3 direcciones principales
ortogonales entre sí
 buscar la elipse o el elipsoide que mejor se acerca al mapa variográfico
• El variograma experimental es poco confiable para las distancias grandes (superiores a la
mitad del diámetro del campo).
• La meseta del variograma (varianza teórica) puede diferir de la varianza del histograma
(varianza empírica).
• Se debe prestar atención a la representatividad de los puntos experimentales, a la
información disponible sobre la variable regionalizada y a la escala de trabajo.
• Las distancias pequeñas son las más importantes.
 describen la continuidad a pequeña escala.
 son cruciales para la interpolación a partir de los datos cercanos.
• Desconfiar de los procedimientos de ajuste automáticos
 el análisis variográfico debe ser un trabajo interactivo, donde el usuario tiene la
palabra final.
• No existe un modelo único.

Validación Cruzada
Objetivos
• validar el modelo teórico de variograma

• comparar la calidad de varios modelos posibles

• validar los parámetros del kriging (“plan” o vecindad de kriging)

El kriging es un método que permite estimar el valor de una variable con un promedio ponderado
de los valores de los datos vecinos. La ponderación óptima depende del modelo de variograma.
Como resultado, el kriging también entrega la desviación estándar del error, que mide la amplitud
potencial de éste.

Procedimiento
• estimar sucesivamente por kriging cada dato, considerando solamente los datos restantes
• calcular el error de estimación (valor estimado menos valor real) cometido en cada sitio
con dato
• estudiar la calidad de los errores de estimación por medio de herramientas estadísticas y
gráficas. Se puede complementar con el estudio de errores estandarizados (es decir, los
errores divididos por su desviación estándar calculada por el kriging).

Factores a considerar para la validación del modelo


• medias de los errores y de los errores estandarizados
deben ser cercanas a cero  estimador insesgado
• varianza de los errores
debe ser la más pequeña posible  estimador preciso
• varianza de los errores estandarizados
debe ser cercana a 1
 el variograma cuantifica adecuadamente la incertidumbre
• nube de dispersión entre valores reales y estimados
la regresión debe acercarse a la diagonal  insesgo condicional
Que implica tener sesgo condicional
Supongamos que se produce sesgo condicional al momento del control de leyes (selección entre
mineral y estéril)

Estudio del insesgo condicional


Comparar las leyes promedio reales y estimadas al seleccionar los datos cuyos valores estimados
superan una ley de corte:
Jack –nife
Una técnica similar a la validación cruzada es el llamado “jack-knife”, el cual no considera una
reposición de los datos: se divide los datos en dos sub-conjuntos y se estima los datos del primer
sub-conjunto a partir de los datos del segundo sub-conjunto.

Kriging
Estimadores Lineales
La idea básica es estimar el valor de una variable regionalizada (por ejemplo, la ley de cobre total)
en una posición u donde no conocemos el valor verdadero, planteando:

donde Z*(u) es el valor estimado para la posición u, {Z(ui )=1...n} son los valores de los datos en las
posiciones {ui, i=1...n}, a es un coeficiente aditivo y {, i=1...n} son ponderadores.

¿Qué factores podrían considerarse en la asignación de los ponderadores?


– cercanía a la posición que está siendo estimada

– redundancia entre los valores de datos

– continuidad o variabilidad espacial

– anisotropía (dirección preferencial)


Más cercano vecino
Atribuye toda la ponderación al dato más cercano al sitio a estimar (i = 1 para el dato más
cercano, i = 0 para los otros datos, a = 0)
También llamado “estimador por polígonos de influencia”, puesto que el sitio a estimar se
encuentra en el polígono de influencia del dato que se lleva toda la ponderación

Inverso de la distancia
Atribuye a cada data una ponderación proporcional al inverso de su distancia al sitio a estimar

Existen variantes, donde se eleva la distancia a una cierta potencia:


donde di es la distancia entre el dato nºi y la posición que se está estimando, c es una constante
pequeña, y w es un valor usualmente comprendido entre 1 y 3

Kriging
Los estimadores anteriores son sencillos de aplicar, pero la asignación de la ponderación sólo
depende del criterio de cercanía.

La idea del método de kriging es incorporar los otros criterios (redundancias entre datos,
continuidad espacial, anisotropía) mediante el uso del variograma.
De este modo, se logra obtener estimaciones más precisas
→ mejor planificación, mejor selección estéril / mineral, +$$$

El Kriging es el mejor estimador lineal insesgado (Best Linear Unbiased Estimator, BLUE)
– “lineal” porque es una combinación lineal ponderada de los datos

– “insesgado” porque el error de estimación tendrá una media igual a 0

– “mejor” en el sentido del error de varianza mínima para un modelo dado de covarianza /
variograma

Existen varios tipos de kriging:

– Kriging simple: media m conocida


– Kriging ordinario: media m desconocida
ETC

Kriging Simple
Hipótesis
1) Se conoce el valor promedio m de la variable regionalizada
2) También se conoce el variograma (h), el cual presenta una meseta:
Queremos construir el “mejor estimador lineal insesgado” para estimar el valor en un sitio u:

Para determinar el coeficiente a y los ponderadores {i=1...n}, se examina las condiciones de


insesgo y de varianza mínima.
Condición de insesgo
El valor esperado del error de estimación es:

Para que este valor esperado sea nulo, se debe plantear

Varianza mínima
La varianza del error de estimación se expresa en función de la covarianza
Este sistema de n ecuaciones con n ponderadores desconocidos es el sistema de kriging simple
(KS)

El estimador se escribe:

La media aparece con un ponderador que es el complemento de la ponderación acumulada de los


datos. Mientras más lejos el sitio u de los datos, menores serán sus ponderadores y mayor será la
ponderación de la media. De cierto modo, la media “compensa” la falta de información aportada
por los datos

Varianza del error


Asimismo, es posible determinar el valor de la varianza del error (que se minimizó). Esta varianza
lleva el nombre de “varianza de kriging”, aunque se refiere a la varianza del error de kriging:

Puede calcularse sin conocer los valores de los datos. Se demuestra que esta varianza siempre es
menor o igual a 2.

Kriging Ordinario
Hipótesis
1) No se conoce el valor promedio m de la variable regionalizada. Esto permite generalizar el
kriging a situaciones donde esta media no es constante en el espacio: la media puede variar de
una región a otra, siempre que sea aproximadamente constante en cada vecindad de kriging.
2) Sólo se conoce el variograma (h) o la función de covarianza C(h)

Condición de insesgo
El valor esperado del error de estimación es:

Siendo m desconocida, para que este valor esperado sea nulo se debe plantear
Varianza mínima
La varianza del error de estimación se expresa en función de
la covarianza

Los ponderadores óptimos (que minimizan la varianza del error sujeto a que la suma de los
ponderadores sea igual a 1) puedendeterminarse introduciendo un multiplicador de Lagrange 

y anulando las derivadas parciales con respecto a los ponderadores y con respecto al
multiplicador de Lagrange
Las derivadas parciales son:

Se desemboca en el sistema de kriging ordinario (KO)

Varianza del error


La varianza del error (“varianza de kriging”) vale:
Puede calcularse sin conocer los valores de los datos. En ocasiones, esta varianza puede ser mayor
que 2.
Kriging de bloques
Observaciones del Kriging

Simulación
Motivación: límites del Kriging
Principios de la simulación
Estimación y simulación
Modelo Multi-Gaussiano
Definición
Simulación multigaussiana
Transformación
Validación modelo multigaussiana
Test de la distribución bigaussina
Resumen simulación condicional
Categorización de recursos y reservas

You might also like