El semivariograma experimental tiene múltiples utilidades pero generalmente su uso se limita a ser el paso previo para realizar una interpolación espacial de las muestras mediante krigeado y poder así predecir los valores de la variable en los lugares no muestreados. Este krigeado es una de las técnicas clásicas geoestadísticas más conocidas dentro de los sistemas de información geográfica (SIG). Dentro de las distintas técnicas de muestreo en el que la elección de la muestra puede verse condicionada por un componente espacial definido (como las variables ambientales) se obvia el uso del semivariograma como el mejor estimador de la mínima distancia de muestreo.

En este post vamos a describir, sin entrar en formulismos teóricos y de la forma más sencilla posible, en que consiste el semivariograma, como se construye y, sobre todo, como puede ser un aliado para plantear un adecuado muestreo sobre variables geolocalizadas. En un proximo post, veremos como se puede calcular con R y así aprovecharlo para definir nuestras intensidades de muestreo espacial si no somos usuarios de un SIG.

Cálculo del semivariograma experimental

En la estadística tradicional, se usa la varianza como el parámetro que define la variación de las muestras con respecto a su media. Dentro del mundo de la estadística espacial, la semivarianza mide la variación de las muestras pero en componentes de distancia y orientación. Si asumimos que la varianza de los incrementos correspondientes a dos localizaciones distintas depende solo del vector $latex h$ que los separa, la semivarianza definirá la autocorrelación que poseen los pares de puntos y a partir de que distancia el par de puntos no es similar.

Semivariograma experimental

Ejemplo de semivariograma experimental (precipitación total anual en la provincia de Huelva)

 

Cuando el semivariograma se calcula para todos los pares de datos de la muestra se obtiene la denominada nube de semivarianza, solo práctica desde un punto de vista teórico, ya que, al existir tal cantidad de pares de datos, se convierte en una herramienta inmanejable. Por ello, las muestras se agrupan en conjuntos o bins separados por una distancia $latex h$ o lag distance, de forma que se calculen los puntos del variograma a partir de los valores medios de los puntos incluidos en estos conjuntos, asumiéndose cierto margen de error debido a la variación inherente entre las muestras que se agrupen en un mismo bin.

De forma paramétrica, la semivarianza se expresa entonces con la ecuación $latex \gamma(h) = \frac{1}{2n(h)}\sum_{\alpha=1}^{n(h)}[z(u_{\alpha})-z(u_{\alpha}+h)]$ donde $latex n(h)$ es el número de pares de localizaciones, $latex z(u_{\alpha})$ el valor del punto con información y $latex z(u_{\alpha}+h)$ el punto parejo separado una distancia $latex h$ del primero.

Al graficar dicha función (y salvo que la variable no sea estacionaria, es decir que su distribución de probabilidad es la misma en cualquier lugar), se tiene una función monótona creciente, debido a que al aumentar la distancia $h$ también lo hace la diferencia entre $latex z(u_{\alpha})$ y $latex z(u_{\alpha}+h)$. Además, como se indicó anteriormente, cuando la distancia entre dos puntos excede una cierta distancia, la varianza de los incrementos se mantiene constante (alcanza una continuidad asintótica). Esta distancia, denominada de autocorrelación, indica la distancia máxima en la que existe cierto grado de similitud explicable por el espacio.

 

Semivariograma teorico

Cálculo del semivariograma teórico (precipitación total anual en la provincia de Huelva)

 

El cálculo del semivariograma experimental o variografía conlleva una serie de decisiones a tomar para que el ajuste sea el correcto y se tengan en cuenta todos los pares símiles:

  1. Para limitar el tamaño de bin, se debe especificar el lag space (o lag distance). Esta, se aproxima generalmente a la distancia media entre muestras. Su conocimiento es fundamental debido a que si es muy pequeña habrá lugares en los que no existan pares de puntos, mientras que si es muy grande se cogerán puntos sin ningún “parecido” espacial.
  2. Asimismo, se definirá el número de lags o el lag tolerance (entendido este último, como la distancia al centro de gravedad del bin), dependiendo de la metodología que se use (mallas cuadradas o circulares).

 

¿Cómo nos puede ayudar el semivariograma?

Anteriormente se ha dicho que, si existe un razonable parecido entre las muestras cuanto más cercanas son, la representación gráfica del semivariograma es una función monótona creciente y que, por otro lado, a medida que aumenta la separación entre las muestras el semivariograma se vuelve asintótico. Esta asíntota será la que nos marque la distancia óptima de separación de nuestras muestras: muestras más cercanas no serán necesarias porque supondrían sobremuestrear, pero en cambio, muestras muy alejadas de esta distancia supondría lo contrario.

Por tanto, si realizamos un adecuado muestreo piloto y, a la muestra recogida, aplicamos el cálculo de su semivarianza, podremos optimizar el muestreo definitivo, estando seguros que recogeremos toda la variabilidad existente en componentes de separación y dirección espacial.


Si quieres saber más, te recomendamos las referencias, ya clásicas, siguientes:

  • Cressie, N., 1993. Statistics for spatial data. Wiley Interscience

  • Chiles, J. P., P. Delfiner, 1999. Geostatististics, Modelling Spatial Uncertainty. Wiley-Interscience

 

 

Uso de cookies

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.

ACEPTAR
Aviso de cookies