Coincidencia de vecinos más cercanos: definición

Actualizado por ultima vez el 17 de marzo de 2022, por Luis Benites.

La coincidencia del vecino más cercano es una solución a un problema de coincidencia que implica emparejar un punto dado con otro punto ‘más cercano’. Es importante en muchos campos muy diferentes, desde la compresión de datos hasta la secuenciación de ADN.

Buscando un vecino más cercano

La comparación del vecino más cercano se puede realizar en la mayoría de los programas de estadísticas a través de un comando simple. Puede utilizar un algoritmo «codicioso» , que revisa las posibles coincidencias y selecciona la opción más cercana sin igualar para que coincida cada vez, o una «coincidencia óptima» más complicada y sofisticada que, a través de algunos cálculos complicados, minimiza el equilibrio global en general. partidos.

A veces, la coincidencia de vecinos más cercanos también se ejecuta con replace , donde cada miembro del conjunto objetivo puede coincidir con más de un punto de datos. Con el muestreo sin reemplazo , cada miembro del conjunto objetivo solo se puede usar una vez.

Configurar un análisis de vecino más cercano implica elegir los criterios de ‘cercanía’ (esto podría ser una lista de propiedades, el valor de una propiedad en particular o un puntaje de propensión ), así como una definición de ‘distancia’ en relación con el dado. propiedad.

Después de definir la cercanía y elegir un algoritmo, se ejecuta la coincidencia. Luego hay que evaluar los partidos; dependiendo de sus resultados, es posible que deba cambiar sus criterios de proximidad o elección de algoritmo y ejecutar el procedimiento nuevamente.

Niveles de tolerancia en la coincidencia de vecinos más cercanos

Dado que el algoritmo del vecino más cercano simplemente proporciona el vecino ‘más cercano’, uno puede terminar con una coincidencia muy mala si el vecino más cercano está lejos. Cuando esto importa, establecemos ‘ niveles de tolerancia ‘ (es decir, límites superiores) para determinar hasta dónde debe llegar nuestro algoritmo de coincidencia en la búsqueda del vecino más cercano.

Siguiente : K-nn (k-vecino más cercano).

Referencias

Caliendo & Kopeinig. Algunas orientaciones prácticas para la implementación del pareamiento por puntaje de propensión. Documento de debate de IZA No. 1588. Mayo de 2005. Recuperado de http://ftp.iza.org/dp1588.pdf el 13 de abril de 2018

Estuardo, Isabel. Métodos de emparejamiento para la inferencia causal: diseño de estudios observacionales. Para Mejores Prácticas en Métodos Cuantitativos. Recuperado de http://www.biostat.jhsph.edu/~estuart/StuRub_MatchingChapter_07.pdf el 13 de abril de 2018

Estuardo, Isabel. Métodos de emparejamiento para la inferencia causal: una revisión y una mirada hacia el futuro. Noviembre de 2009. Recuperado de http://www.ics.uci.edu/~sternh/courses/265/stuart_matching.pdf el 13 de abril de 2018

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

¿Cuál es la probabilidad de un evento imposible? La probabilidad de un evento imposible es 0 . Los eventos imposibles…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!