Jenks natural rompe optimización
El Método de optimización Jenks, también llamado el Método de clasificación de saltos naturales Jenks, es un datos de clustering método diseñado para determinar el mejor arreglo de valores en diferentes clases. Esto se hace al intentar minimizar la desviación promedio de cada clase de la media clase, mientras que maximiza la desviación de cada clase de los medios de los otros grupos. En otras palabras, el método busca reducir el varianza dentro de las clases y maximizar la varianza entre clases.[1][2]
Contenido
- 1 Historia
- 1.1 George Jenks
- 1.2 Desarrollo
- 2 Método
- 3 Usos
- 4 Métodos alternativos
- 5 Véase también
- 6 Referencias
- 7 Enlaces externos
Historia
George Jenks
George Frederick Jenks era un americano cartógrafo del siglo XX. Graduarse con su doctorado en Geografía Agraria de Universidad de Syracuse en 1947, Jenks comenzó su carrera bajo la tutela de Richard Harrison, cartógrafo para TIEMPO y la revista Fortune.[3] Se incorporó a la Facultad de la Universidad de Kansas en 1949 y comenzó a construir el programa de cartografía. Durante su permanencia de 37 años en KU, Jenks desarrolló el programa de cartografía en uno de los tres programas reconocidos por su posgrado en el campo; los demás siendo el Universidad de Wisconsin y el Universidad de Washington. Gran parte de su tiempo se dedicó a desarrollar y promover técnicas cartográficas mejoradas y programas. También pasó mucho tiempo investigando mapas tridimensionales, investigación ojo-movimiento, mapa temático comunicación, y geoestadística.[2][3][4]
Desarrollo
Jenks fue un cartógrafo de profesión. Su trabajo con estadísticas surgió de un deseo de hacer choropleth mapas visualmente más precisa para el espectador. En su papel, El concepto de modelo de datos en el Mapeo estadístico, dice que al visualizar los datos en tres dimensiones del modelo cartógrafos podría concebir un "método sistemático y racional para la preparación de mapas de choroplethic".[1] Jenks utiliza la analogía de una "manta de error" para describir la necesidad de utilizar elementos que no sean el medio para generalizar datos. Los tres maquetas tridimensionales fueron creados para ayudar a Jenks visualizar la diferencia entre clases de datos. Su objetivo era generalizar los datos utilizando aviones como pocos como sea posible y mantener una constante "manta de error".
Método
El método requiere un proceso iterativo. Es decir, cálculos deberán repetirse utilizando diversas roturas en el conjunto de datos para determinar el conjunto de saltos tiene el más pequeño de su clase varianza. El proceso se inicia dividiendo los datos ordenados en grupos. Las divisiones del grupo inicial pueden ser arbitrarias. Hay cuatro pasos que deben repetirse:
- Calcular la suma de las desviaciones al cuadrado entre clases (SDBC).
- Calcular la suma de las desviaciones al cuadrado de la media de la matriz (SDAM).
- Reste el SDBC desde el SDAM (SDAM-SDBC). Esto equivale a la suma de las desviaciones al cuadrado de los medios de clase (SDCM).
- Después de inspeccionar cada una de la SDBC, es una decisión para mover una unidad de la clase con el SDBC más grande hacia la clase con el SDBC más bajo.
Nuevas desviaciones clase entonces se calculan y se repite el proceso hasta la suma de la clase dentro de las desviaciones alcanza un valor mínimo.[1][5]
Alternativamente, pueden examinarse todas las combinaciones de rotura, SDCM calculados para cada combinación, y selecciona la combinación con la menor SDCM. Puesto que todas las combinaciones de descanso se examinan, esto garantiza que el uno con el menor SDCM es encontrado.
Por último, se calcula la estadística GVF (bondad de ajuste de la varianza). GVF se define como (SDAM - SDCM) / SDAM. GVF oscila entre 0 (peor ajuste) 1 (perfecto).
Usos
Objetivo Jenks en el desarrollo de este método era crear un mapa que era absolutamente exacto, en cuanto a la representación de atributos espaciales de datos. Siguiendo este proceso, Jenks reclamaciones, la "manta de error" puede ser distribuida uniformemente a través de la superficie asignada. Esto desarrolló con la intención de usar clases de datos relativamente pocos, menos de siete, porque era el límite al usar monocromática sombreado en el mapa choroplethic.[1]
Métodos alternativos
Otros métodos de clasificación de datos incluyen Saltos de cabeza y cola, Pausas naturales (sin Jenks Optimization), igual intervalo cuantil y desviación estándar.
Véase también
- k-means clustering, una generalización de datos multivariantes (Jenks optimización pausas naturales parece ser uno k-significa dimensional[6]).
Referencias
- ^ a b c d Jenks, George F. 1967. "El concepto de modelo de datos en estadística Mapping", Anuario internacional de cartografía 7:186-190.
- ^ a b McMaster, Robert, "In Memoriam: George F. Jenks (1916-1996)". Cartografía y Ciencias de la información geográfica. 1 24 p.56-59.
- ^ a b McMaster, Robert y McMaster, Susanna. 2002. "una historia de la cartografía académico estadounidense del siglo XX", cartografía y Ciencias de la información geográfica. 3 29 p.312-315.
- ^ Grupo de especialidad de cartografía de CSUN, Boletín invierno 1997
- ^ FAQ DE ESRI, ¿Cuál es el método de optimización Jenks
- ^ [1]
Enlaces externos
- FAQ DE ESRI, ¿Cuál es el método de optimización Jenks
- Información geográfica voluntaria, Daniel Lewis, Jenks Natural algoritmo rompe con una implementación en python
- Objeto visión wiki Clasificación rompe Natural de Fisher, un algoritmo de O(k*n*log(n))
- ¿Qué es Jenks Natural se rompe?