Ahora que ha terminado el GP de Abu Dabi y se constata la debacle Ferrari por una mala decisión desde el muro se me ha ocurrido hacer un análisis cluster (aprovechando que es el tema 1 de una de las asignaturas que tengo en el máster) de la última temporada.
He capturado de la página oficial de la Fórmula 1 los resultados de todos los pilotos de la parrilla de este año. Decidí tipificar los datos (¿Qué opináis vosotros?¿era necesario?) y después les he aplicado la distancia euclídea.
En el momento de realizar el análisis he decidido utilizar estos cuatro métodos: el linkaje simple, completo, el de la media y el de ward. Más adelante he calculado los coeficientes cofenéticos para decidir cual de los métodos es mejor. Recuerdo que el coeficiente cofenético es la correlación entre los n(n-1)/2 elementos de la parte superior de la matriz de proximidades o distancias frente a la matriz cofenética C, cuyos cij elementos se definen como aquellos que determinan la proximidad entre los elementos i y j cuando estos se unen en el mismo cluster.
De los cuatro coeficientes vemos que el tercero nos da un resultado mejor. El resultado tercero es el que hemos calculado utilizando el método average (hclust(distancias, method="ave") en R).
Podemos ver como Massa, lejos de estar al nivel de los grande como Button sí ha hecho en Mclaren se ha situado un escalón por debajo de ellos a la altura de Rosberg y Kubica. De los nuevos no sorprende nada. Sí Schumacher que ha quedado lejos del nivel ofrecido por su compañero de equipo.
Qué os parece? Habríais utilizado otra distancia en lugar de la euclídea?


La duda está en qué datos has seleccionado para hacer este clústering. Ya que no lo dices no sé qué distancias serán mejores, pero si has elegido comparar los puntos de cada piloto con las roturas de motor de cada uno medir esto en distancia euclidea no tiene sentido, mejor la Mahalanobis.
ResponderSuprimirHe usado los puntos conseguidos en cada carrera y los puntos totales de la escudería
ResponderSuprimirentonces me parece un método perfecto
ResponderSuprimir