You are on page 1of 9

FUNDAMENTOS DE GEOESTADSTICA

Fernando Garca Bastante- Universidad de Vigo

El trmino geoestadstica fue acuado por G. Matheron (1962), definindolo como la aplicacin del formalismo de las funciones aleatorias al reconocimiento y estimacin de los fenmenos naturales. Dichos fenmenos los caracterizamos por la distribucin espacial de una o ms variables (v.g. las leyes de un depsito o las cotas de una superficie topogrfica), que denominamos como variables regionalizadas. Si z(xi) es el valor de una variable z en un punto xi, intentamos representar la variabilidad de z en el espacio de inters o dominio D, partiendo del hecho de que la realidad nos muestra que existe una similitud estadstica, una correlacin, entre pares de valores (z(xi), z(xj+h)), al menos cuando la distancia entre ellos (h) no supera un cierto valor. El inters en representar dicha variabilidad, surge porque nos permite hacer estimaciones del valor de la variable en los puntos que nos interesen dentro del dominio. La geoestadstica interpreta cada valor z(xi) como una realizacin particular de una variable aleatoria Z(xi), y el conjunto de stas dentro del dominio D, constituye una funcin aleatoria (Z(x)={Z(xi), xiD}). El problema de caracterizar la variabilidad espacial de z(x) se reduce entonces, a caracterizar la correlacin entre las variables aleatorias que integran la funcin aleatoria. Esta funcin incorpora tanto el carcter aleatorio que percibimos en la variable, como la estructura espacial de la variabilidad de los valores que observamos en la realidad. Esta interpretacin fundamental se justifica a posteriori, si produce soluciones coherentes y aceptables a los problemas variados que aparecen en la prctica, (Journel y Huijbregts, 1978). Al igual que ocurre en el resto de los modelos matemticos que intentan reflejar algn aspecto de la realidad, la geoestadstica establece un conjunto de hiptesis, y las desarrolla hasta obtener unas conclusiones. Si stas se ajustan a lo que observa en la realidad estipulamos que el modelo es vlido. Cualquier conjunto de n variables de la funcin aleatoria, localizados en n puntos diferentes, se caracteriza por su funcin de distribucin de probabilidad mltiple (nvariable), esto es: Fx1,x2...xn (z1, z2,...zn) = Prob[Z(x1) z1, Z(x2) z2,...Z(xn) zn], con zi

= z(xi), y siendo n cualquier nmero entero positivo. Nuestro problema en general es calcular el valor esperado (E{Z(xk)}) de una variable (Z) en un punto de inters (xk), conocida una realizacin de la funcin aleatoria en una serie de puntos (x1,x2...xl con Z(xi) = zi, i= 1,...l). El problema tiene solucin inmediata si conocemos Fx1,x2...xl,xk, mas como no es el caso (slo disponemos de una realizacin de la funcin aleatoria), necesitamos establecer una serie de hiptesis que nos permitan cierta inferencia estadstica, y debemos proponer, adems, algn criterio de seleccin del estimador a utilizar (las hiptesis no permiten el clculo directo del valor buscado). Para medir el grado de similitud entre dos variables aleatorias se emplean los momentos de segundo orden, en particular la funcin covarianza definida como: C{Z(xi),Z(xj)} = E{[Z(xi)-m(xi)][Z(xj)-m(xj)]}, representando E{.} la esperanza matemtica o valor esperado como vimos anteriormente, y siendo m(xk)= E{Z(xk)}. Como quiera que la estimacin y utilizacin de la funcin covarianza presenta algunos incovenientes, en geoestadstica, se sustituye aquella por la funcin variograma definida como: 2 (xi,xj) = Var{Z(xi)-Z(xj)}, representando Var la varianza definida como: Var{Z(xi)} = E{[Z(xi)-m(xi)]2}. Estos momentos son importantes ya que nos servirn para llevar a cabo la estimacin, y de hecho las hiptesis que vamos a establecer respecto a la funcin aleatoria son de estacionariedad de 2 orden (de los dos primeros momentos). En general una funcin aleatoria es estrictamente estacionaria, si para cualquier conjunto de n puntos y para cualquier vector h cumple: Fx1,x2...xn (z1, z2,...zn) = Fx1+h,x2+h...xn+h (z1, z2,...zn), lo que significa que la funcin de distribucin mltiple es invariante a la translacin. La geoestadstica parte bien de la hiptesis de invariabilidad a la translacin de los dos primeros momentos (media y covarianza) de la funcin aleatoria: E{Z(x)} = E{Z(x+h)} = m, xD C{Z(x),Z(x+h)} = C(h), x, x+hD

bien de la hiptesis de estacionariedad intrnseca de la funcin aleatoria (invariabilidad a la translacin de la funcin variograma): E{Z(x+h) - Z(x)} = 0, xD

Var{Z(x+h) - Z(x)} = 2 (h), x, x+hD

(Ntese que bajo la primera hiptesis se cumple la relacin: 2 (h) = 2 [C(0)-C(h)], al ser: 2 (h) = E{[Z(x+h)-Z(x)]2}, y tambin: C{0,0} = C(0) = () = Var{Z(x)}. Bajo cualquiera de las hiptesis se cumple: 2 (0) = 0). La segunda hiptesis es ms general que la primera, y es suficiente para resolver nuestro problema, utilizando para ello el siguiente estimador, e(h), de la funcin variograma (Matheron, 1962):
2 e (h) 1 2 )[z ( x + h) z ( x)] N (h) N ( h

en donde N(h) es el nmero de pares de valores que tenemos separados por el vector h. Este estimador, al no precisar del conocimiento de la media m, presenta la ventaja de no ser sesgado a diferencia del estimador de la funcin covarianza, que s lo es. Tambin ocurre que cuando existe en la realidad una pequea tendencia lineal (E{Z(x)} = m(x)), el estimador de la covarianza de la funcin resulta mucho ms afectado (con el cuadrado de la dimensin del dominio), que el del variograma (con el cuadrado de h) (Cressie, 1993). Consideremos algunos conceptos importantes relacionados con el variograma. Sean V y v dos soportes (puntos, reas o volmenes). El valor esperado del error cuadrtico cometido al estimar el valor medio de la variable regionalizada (ZV) sobre V, con el valor medio (Zv) sobre v (por ejemplo cuando extendemos o extrapolamos el valor de la ley obtenido a partir de una pequea muestra en el frente de una galera, al resto de la seccin de la galera), es lo que se llama varianza de extensin, y su valor es igual a:

2E(v,V) = E{[ZV-Zv]2}= 2 (v,V) - (V,V) - (v,v) ( es el valor medio de la funcin


variograma entre los soportes v y V). Segn esto, bajo nuestras hiptesis podemos considerar el variograma como la varianza del error cuando estimamos e igualamos el valor de una variable (v.g. la ley) en un punto x+h, con el valor de la variable en otro punto x. Otro concepto interesante es el de la varianza de dispersin. Si tenemos N soportes vi, iguales, que conforman un soporte V = ivi, se define aquella (D2(v,V)) como el valor medio sobre V de la varianza de extensin de v sobre V. Dicho de otro modo, es la

fluctuacin esperada de los valores Zvi respecto al valor ZV en V, elevada al cuadrado y promediada. Se cumple: D2(v,V) = (V,V) - (v,v). Asumiendo una de las hiptesis de estacionariedad podemos abordar la tarea de estimacin conforme al modelo planteado. Sea ZV(xk) la variable a estimar sobre un soporte V centrado en xk (ZV(xk) = (1/V) V(xk)Z(x) dx), a partir de un conjunto de n variables Zv(xi) cuyas realizaciones zv(xi) sobre otro soporte v conocemos; entonces, en general, Z*k (el estimador de ZV(xk)) ser una funcin de dichas variables. De todas las funciones existentes nos interesan aquellas que no introduzcan sesgo (E{ZV(xk) Z*k} = 0), y tambin aquellas que nos permitan calcular la varianza de la estimacin (2k = E{[ZV(xk) Z*k]2}, e imponerla la restriccin de que su valor sea mnimo. Esto nos limita la posibilidad de bsqueda a la clase de estimadores lineales. Podemos escribir Z*k = ii Zi, llamando Zi = Zv(xi), y siendo i cada uno de los n pesos que vamos a calcular con las dos restricciones mencionadas. De la primera restriccin es inmediato que se debe cumplir que: ii = 1. La segunda impone que: E{[ZV(xk) Z*k]2} sea mnimo. Con cualquiera de la hiptesis de estacionariedad esto implica que la derivada de 2k respecto a cada i debe ser igual a 0. Esto da lugar a un sistema lineal de ecuaciones de manera que si se introduce la ecuacin de ligadura (ii = 1) obtenemos: Para la hiptesis de estacionariedad de 2 orden:

C(v,v) = C(v,V), , = 1 a n 1 = 0, con = 1 a n


Con C(a,b) igual al valor medio de la covarianza cuando un extremo del vector h recorre el soporte a y el otro el b. El parmetro de Lagrange de la ecuacin de ligadura es y el valor de la varianza es: 2ko = C(V,V) + - C(v,V). Para la hiptesis de estacionariedad intrnseca:

(v,v) + = (v,V), , = 1 a n 1 = 0, con = 1 a n

Con (a,b) igual al valor medio del variograma cuando un extremo del vector h recorre el soporte a y el otro el b. En este caso obtenemos que el valor de la varianza es: 2ko = (v,V) + - (V,V). Estas ecuaciones representan lo que Matheron (1963) denomin Krigeage o Kriging, en honor de D.G. Krige, un ingeniero de minas que preconiz este procedimiento en los aos 50, trabajando en las minas de oro de frica del Sur. Comparando la informacin real sobre leyes medias de paneles de explotacin, con las estimadas ponderando muestras prximas a cada panel, con objeto de lograr un estimador ptimo, deduca el valor de las ponderaciones obligando a que la varianza de la estimacin fuese mnima (Azcrate, 1982). El krigeage obtiene como resultados los mejores estimadores lineales no sesgados y hoy en da, el trmino est referido a toda una familia de tcnicas de estimacin e incluso de simulacin. As por ejemplo, en caso de conocer E{Z(x)} = m, se emplea el krigeage simple; a veces se hacen transformaciones no lineales de las variables objeto de estudio: krigeage lognormal, disyuntivo, indicador, probabilstico, y otras veces se incorpora la tendencia en caso de existir: krigeage universal. Aqu hemos desarrollado las ecuaciones del krigeage ordinario. Si nos centramos en la hiptesis de estacionariedad intrnseca, para que el sistema de ecuaciones tenga solucin y sea nica, el variograma ha de ser una funcin condicionalmente definida negativa. Esta condicin proviene del hecho de que la varianza del krigeage no puede ser negativa, y de la necesidad de existencia de un nico mnimo global. Ya vimos que la funcin variograma poda ser estimada con el variograma experimental e(h), pero en la realidad sta se ajusta a una combinacin lineal de modelos tericos que garanticen la existencia de solucin y su unicidad. Algunos de estos, estandarizados, se muestran en la fig. n 1.

VARIOGRAMAS TERICOS
Esfrico 1.2 1 0.8 0.6 0.4 0.2 0 0 50 100 150 200 250 h (m) 300 Gaussiano Exponencial Potencial (a<1)

fig. n 1. Semivariogramas tericos

Los tres primeros corresponden a modelos con capacidad de dispersin espacial limitada, presentando un valor mximo o meseta de valor igual a C(0). Sus ecuaciones estandarizadas (divididas por la constante C(0)), son las siguientes: Modelo esfrico:

t(h) = 1.5 (h/a) - 0.5 (h/a)3, h [0,a] t(h) = 1 (= meseta), h > a


Modelo exponencial:

t(h) = 1 - exp (-3h/a), h [0,]


Modelo gaussiano:

t(h) = 1 - exp (-3h2/a2), h [0,]


El parmetro a se denomina rango o alcance, y representa la distancia a partir de la cual no existe similitud estadstica entre las variables (t(a) C(0)). El cuarto modelo tiene una capacidad de dispersin ilimitada (no presenta meseta), y corresponde a un modelo monmico de la forma t(h) = hb con b (0,2). Este aparece,

por ejemplo, en el caso de fenmenos no estacionarios, cuando existe una tendencia lineal (b es cercano a 2). Si b es igual a cero t(h) = 1, con h > 0. Este modelo representa el efecto pepita puro, indicativo de fenmenos sin ninguna autocorrelacin espacial. En la prctica, el efecto pepita aparece combinado con algunos de los modelos anteriores, originando una discontinuidad en el origen. Este efecto caracteriza, la influencia de la variabilidad a pequea escala (entre puntos muy cercanos), y es debido a que las distancias entre las observaciones son demasiado grandes como para percibir la estructuracin espacial a esta escala. Vistos los fundamentos sobre los que descansa la geoestadstica, podemos asegurar que el coste del esfuerzo en trabajo que se necesita para realizar una estimacin mediante krigeage (determinacin del variograma experimental, su ajuste a una combinacin de los modelos tericos y resolucin de las ecuaciones), es mucho mayor que el empleado utilizando otras tcnicas (v.g. inverso de la distancia, triangulacin o polgonos de influencia). Entonces cabe preguntarse: Hasta qu punto interesa utilizar el krigeage en la evaluacin de los recursos? Si tenemos en cuenta que el principal activo de la empresa minera son precisamente dichos recursos, la respuesta es sencilla: siempre; siempre que al utilizar estas tcnicas, aprovechemos la informacin disponible de una manera ms eficiente que con el uso de las tcnicas tradicionales; lo que viene a decir, siempre que exista una ordenacin espacial de los datos. Y en qu consiste esa eficiencia?: en aprovechar precisamente, la informacin sobre dicha estructuracin espacial, a la hora de establecer las funciones de extensin (ii Zi), en vez de crearlas de manera arbitraria, tal como lo hacen los mtodos clsicos de estimacin. Si escribimos en forma matricial las ecuaciones del krigeage en trminos de covarianzas, tenemos: [C] [] = [D], siendo [C] la matriz de covarianzas entre los n soportes que utilizaremos en la estimacin, ms una fila y una columna de n unos y un cero para introducir la ecuacin de ligadura. [] es la matriz de los n pesos buscados y el multiplicador de Lagrange. [D] es la matriz de covarianzas entre el soporte a estimar y cada uno de los n soportes, y un uno. Reordenando trminos obtenemos:

[] = [C]-1 [D] Esta sencilla ecuacin muestra que los pesos vienen afectados por la distancia estadstica [D] en vez de por la distancia geomtrica h. Los pesos se definen por la estructuracin espacial del fenmeno que a su vez depende de la distancia geomtrica. En general, cuanto ms alejado est un dato conocido del soporte a estimar, menor ser la covarianza entre ellos dos, y menor peso se le aplicar a ese dato. El efecto de la matriz [C]-1 es siquiera ms notable: ajusta los pesos que se obtienen con [D], la distancia estadstica, para tener en cuenta la posible redundancia entre las muestras (Srivastava, 1989). De nuevo se trabaja en trminos estadsticos, ya que la redundancia entre datos depende de no slo de su distancia geomtrica y disposicin espacial, sino tambin de la continuidad del fenmeno estudiado. Todo ello queda reflejado en esta matriz. Si observamos las ecuaciones de la varianza de la estimacin, la varianza del error de nuestro modelo, podemos deducir que es un buen indicador de la incertidumbre del error real, al incluir todos los elementos que intuitivamente le relacionamos: nmero y disposicin espacial de las muestras, y variabilidad del fenmeno. El modelo planteado por la geoestadstica muestra mayor coherencia que los modelos clsicos. Es fcilmente perceptible que cuando variamos el tamao del soporte de la muestra (v.g. de un trozo de testigo a un banco de explotacin), la funcin de distribucin de la variable (v.g. leyes), cambia. Este hecho lo introduce de forma natural la geoestadstica mediante la varianza de dispersin, presentada anteriormente. La variacin de la varianza de la funcin de distribucin de la variable Z sobre el dominio V, al variar el soporte de v a v, se refleja con el cambio del valor (v,v) a (v,v). Si ves mayor que v entonces (v,v) ser mayor que (v,v), disminuyendo la varianza de la distribucin. El modelo incorpora tambin, la posible anisotropa que pudiera manifestar el fenmeno estudiado. Cuando establecimos las hiptesis de estacionariedad, escribimos que la covarianza o el variograma slo dependa del valor de h, distancia entre los soportes considerados. En realidad h representa un vector, y como tal debe ser interpretado en las ecuaciones.

De todas estas anotaciones y del hecho cierto del gran desarrollo y utilizacin prctica de la geoestadstica, se concluye que, en general, los estimadores utilizados por sta, dan mejores resultados que los estimadores clsicos.

Referencias
CRESSIE, N.A. (1985) Fitting variogram models by weighted least squares. Journal of the International Asosciation for Matematical Geology, 17, pp. 563-586. CRESSIE, N.A. (1993) Statistics for spacial data. USA. Jonh Wiley & Sons, INC. JOURNEL, A.G. y HUIJBREGTS, Ch. J. (1978) Mining geostatistics. London, Academic Press. MATHERON, G. (1962) Trait de Gostatistique Applique. Tome 1. Pars, Edit. Technip. MATHERON, G. (1963) Trait de Gostatistique Applique. Tome 2. Pars, Editions Technip.

You might also like