To install click the Add extension button. That's it.

The source code for the WIKI 2 extension is being checked by specialists of the Mozilla Foundation, Google, and Apple. You could also do it yourself at any point in time.

4,5
Kelly Slayton
Congratulations on this excellent venture… what a great idea!
Alexander Grigorievskiy
I use WIKI 2 every day and almost forgot how the original Wikipedia looks like.
What we do. Every page goes through several hundred of perfecting techniques; in live mode. Quite the same Wikipedia. Just better.
.
Leo
Newton
Brights
Milds

Distancia de Mahalanobis

De Wikipedia, la enciclopedia libre

En estadística, la distancia de Mahalanobis es una medida de distancia introducida por Mahalanobis en 1936. Su utilidad radica en que es una forma de determinar la similitud entre dos variables aleatorias multidimensionales. Se diferencia de la distancia euclídea en que tiene en cuenta la correlación entre las variables aleatorias.

Formalmente, la distancia de Mahalanobis entre dos variables aleatorias con la misma distribución de probabilidad y con matriz de covarianza se define como:

YouTube Encyclopedic

  • 1/3
    Views:
    58 966
    8 763
    5 988
  • Identifying Multivariate Outliers with Mahalanobis Distance in SPSS
  • Mahalanobis Distance - intuitive understanding through graphs and tables
  • Calculating Mahalanobis Distance Critical Values in Excel

Transcription

Propiedades como distancia

La distancia de Mahalanobis cumple las siguientes propiedades, necesarias para ser una distancia:

  • Semipositividad: y además

Es decir, la distancia entre dos puntos de las mismas coordenadas es cero, y si tienen coordenadas distintas la distancia es positiva, pero nunca negativa.

  • Simetría:

Intuitivamente, la distancia entre y es la misma que entre y .

  • Desigualdad triangular:

Ejemplo práctico

Para entender la utilidad de la distancia de Mahalanobis se puede considerar el siguiente ejemplo práctico: Un pescador quiere poder medir la similitud entre dos salmones, por ejemplo porque quiere clasificarlos en dos tipos para su venta y poder así vender los grandes más caros. Para cada salmón mide su anchura y su longitud. Con estos datos construye un vector para cada salmón .

La longitud de los salmones pescados es una variable aleatoria que toma valores entre 50 y 100cm, mientras que su anchura está entre 10 y 20cm. Si el pescador usase la distancia euclídea:

O en notación vectorial:

al ser las diferencias de anchura menos cuantiosas que las de longitud, les estará dando menos importancia. Por esta razón, el pescador decide incorporar la estadística de los datos a la medida de distancia, ponderando según su varianza: las variables con menos varianza tendrán más importancia que las de mayor varianza. De esta forma pretende igualar la importancia de la anchura y la longitud en el resultado final. La expresión quedaría:

Donde es la desviación estándar de la componente de los vectores de medidas.

O en notación vectorial:

Donde es una matriz diagonal cuyos elementos en la diagonal

Pero la expresión anterior tiene un problema, y es que la longitud y anchura de los salmones no son independientes; es decir, la anchura depende en cierta forma de la longitud, pues es más probable que un salmón largo sea también más ancho. Para incorporar la dependencia entre las dos variables. el pescador puede sustituir la matriz diagonal por la matriz de covarianza :

Que es la distancia de Mahalanobis.

Bibliografía

  • P.C. Mahalanobis, On the generalised distance in statistics, Proceedings of the National Institute of Science of India 12 (1936) 49-55.
Esta página se editó por última vez el 14 ene 2024 a las 23:26.
Basis of this page is in Wikipedia. Text is available under the CC BY-SA 3.0 Unported License. Non-text media are available under their specified licenses. Wikipedia® is a registered trademark of the Wikimedia Foundation, Inc. WIKI 2 is an independent company and has no affiliation with Wikimedia Foundation.