Modelo de predicción de victorias utilizando la continuidad de las plantillas NBA

Estamos ya llegando a julio y como pasa cada verano, empieza el baile de nombres, las filtraciones, los rumores de la agencia libre, las peticiones de traspaso… (algunas más sorprendentes que otras, y sino que le pregunten a los fans de Cavaliers con Irving o a los de Spurs ahora con Leonard). No vamos a hablar aquí de rumores ni de posibles traspasos, no vamos a utilizar la Trade Machine ESPN ni a especular con el posible equipo de Kawhi Leonard, hoy vuelvo a hablaros sobre estadística y vamos a tratar de construir un modelo matemático que nos permita predecir el número de victorias que conseguirá una franquicia en una temporada.

 

La química de equipo

Probablemente seáis incapaces de contar cuantas veces habéis escuchado hablar sobre la química de equipo en el mundo del baloncesto.

¿Y qué es eso de la química? Pues según la Real Academia Española, la ciencia que estudia la estructura, propiedades y transformaciones de los cuerpos a partir de su composición. Pero claro, entendido el concepto, os vuelven a surgir las dudas, ¿y qué diablos tiene que ver esta ciencia con el juego de mi equipo en el partido de esta noche o con el número de victorias que consiga al final de la temporada?

Pues según la estadística, bastante más incluso de lo que la propia lógica nos invita a pensar. Pero claro, no hablamos realmente de esa definición de química que nos ha dado la R.A.E., sino de esa relación especial que se establece entre jugadores de un equipo que se entienden como si llevaran toda la vida jugando juntos.

 

Los datos

Durante la última semana he estado pensando como podría utilizar una estadística super interesante que encontré navegando por Basketball-Reference, en ella calculaban la continuidad de la plantilla temporada a temporada para cada una de las franquicias de la NBA, pero no de cualquier forma, lo hacían bien. No me quiero parar demasiado en este punto, pero trataré de explicar brevemente con un ejemplo el motivo por el que esta información es tan útil y está tan bien calculada.

Por ejemplo, en una plantilla que haya disputado los 82 partidos de la temporada regular, sus jugadores habrán jugado un total de 82 partidos por 48 minutos por 5 jugadores, es decir, un total de 19.680 minutos a repartir entre toda la plantilla. Si un jugador A que ya estaba en la plantilla ha jugado un total de 1.500 minutos esta temporada, su peso en la “continuidad” de la plantilla es de 1.500/19.680 = 7.6, es decir, ha disputado algo más del 7.6% de minutos disponibles. Sin embargo, un jugador B que ha llegado este año a la plantilla ha disputado 3.000 minutos, lo que supone un peso negativo (resta) sobre el porcentaje de continuidad del 15.2%.

Para obtener la continuidad del equipo del ejemplo anterior, necesitaríamos analizar la situación de todos los jugadores de la plantilla (si son nuevos o continúan de la pasada temporada y los minutos que han disputado), pero ahora mismo ya sabríamos que (como mucho) la continuidad del equipo, suponiendo que todos los demás jugadores hubieran continuado en la plantilla, sería del 84.8% (100 – 15.2).

Tras darle algunas vueltas, no se me ocurrió una forma mejor de utilizar un dato tan bien calculado como este, que intentando predecir la influencia de la continuidad de la plantilla en la cantidad de victorias que logra una franquicia cada temporada.

 

El modelo matemático

La verdad es que me podría inventar que he hecho una cantidad de cosas increíbles para poder realizar un modelo matemático que se ajuste a los datos que queremos predecir, pero si os soy sincero, no he tenido que hacer demasiado. Simplemente he construido un modelo de regresión lineal simple, donde vamos a utilizar la variable Y = porcentaje de continuidad de la plantilla para predecir la variable X = número de victorias en la temporada.

Los resultados del modelo han determinado que la variable Y permitía estimar con bastante fiabilidad, dentro de la simplicidad del modelo, la cantidad de victorias que un equipo consigue a lo largo de una temporada, demostrándose una relación bastante alta entre la cantidad de victorias que consigue un equipo (variable X) y el porcentaje de continuidad de los jugadores con respecto a la temporada anterior (variable Y). Dicho de otra forma, el modelo demuestra que mientras menos cambios haga una franquicia en la plantilla, más victorias conseguirá en esa temporada.

X = número de victorias en la temporada ~ Y = porcentaje de continuidad de la plantilla

Resultado de la regresión: X = 16.18 + 38.78 * Y

Teniendo en cuenta que la muestra es relativamente pequeña para un estudio de este clase (hemos utilizado 270 muestras correspondientes a los últimos 10 años) y que pretendemos predecir una variable utilizando solo otra variable (potencialmente realizar esto tiene un porcentaje de eficiencia bastante bajo), el resultado final es sencillamente espectacular.

Bueno vale, tal vez os estoy mareando mucho con números, variables… Vamos a hacer algo más sencillo, ¿qué pasa si ponemos los 270 datos de la muestra en una gráfica? Qué vemos que aunque la muestra de estudio está muy dispersada, por lo tanto, no vamos a poder realizar predicciones ajustadas (esto lo esperábamos, ya os vengo avisando, una única variable para predecir otra variable, una muestra pequeña…), existe una relación lineal clara que marca una tendencia: mientras más continuidad tenga un equipo, más victorias conseguirá.

Modelo de predicción de victorias utilizando la continuidad de las plantillas NBA

 

Las conclusiones del análisis

Según el modelo matemático de regresión simple que hemos construido, mientras que un equipo con una continuidad del 60% tendría una alta probabilidad de lograr en torno a 40 victorias, un equipo con una continuidad del 100% tendría una estimación de 55 victorias, y un equipo con una continuidad baja (del 20% por ejemplo) solo aspiraría a conseguir 24 victorias. En esa misma línea, os dejo a continuación la predicción realizada por el modelo para distintos escenarios de continuidad de la plantilla:

% ContinuidadVictorias estimadas
25%25.87
30%27.81
35%29.75
40%31.69
45%33.63
50%35.57
55%37.50
60%39.44
65%41.38
70%43.32
75%45.26
80%47.20
85%49.14
90%51.08

Aún así, por supuesto, como estamos hablando de una variable sobre la que influyen miles de factores (incluido el tan impredecible azar), debemos tener en cuenta que pueden existir outliers o valores atípicos, lo que en estadística se define como una observación numéricamente distante del resto de los datos, y que por tanto, no sigue el patrón o modelo definido para el resto de observaciones. Un ejemplo clarísimo de estos valores atípicos lo tenemos en los Boston Celtics 2017-18, un equipo con una continuidad del 41% esta temporada pero que ha conseguido la nada despreciable cifra de 55 victorias, quedándose muy lejos de las 32 victorias que le estimaba el modelo de predicción. Solamente necesitáis ver un par de partidos de estos Celtics para entender la razón por la qué los verdes rompen con los estándares del modelo.

Pese a que existan outliers como los Celtics de esta última temporada, la estadística y el modelo construido nos demuestran que no son más que eso, casos atípicos. Nos vamos ahora al caso opuesto, estaba revisando porcentajes extremos de continuidad y no me ha sido complicado observar un patrón común, la mayoría de las mejores temporadas de la historia se consiguieron con porcentajes de continuidad muy altos en los rosters:

  • Golden State Warriors 2015-16: 73 victorias y 95% continuidad
  • Chicago Bulls 1995-96: 72 victorias y 82% continuidad
  • Chicago Bulls 1996-97: 69 victorias y 97% continuidad
  • Los Angeles Lakers 2008-09: 65 victorias y 95% continuidad
  • Boston Celtics 2008-09: 62 victorias y 94% continuidad
  • Utah Jazz 1997-98: 62 victorias y 98% continuidad
  • Phoenix Suns 2006-07: 61 victorias y 95% continuidad

 

Por ir sacando conclusiones más claras, si prestamos atención a los datos de los últimos 10 años, hay otros aspectos que merece la pena destacar:

    1. En los 270 casos de estudio, todos los equipos con más del 90% de continuidad (tenemos 11 muestras) finalizaron la temporada con un récord positivo (al menos 42 victorias).
    2. Revisando todas las franquicias que realizaron una gran temporada y consiguieron 50 victorias (o más), podemos ver como el 87% lo hizo teniendo una continuidad del roster superior al 60% (por cierto, justo aquí en el 13% restante, encontraríamos el valor atípico de los Boston Celtics 2017-18 que hemos comentado antes).
    3. Además, las plantillas con una continuidad superior a ese 60%, lograron terminar la temporada con un récord positivo en el 65% de los casos.
    4. En el extremo opuesto, si filtramos por todos los equipos que realizaron una temporada pésima y no alcanzaron las 30 victorias, podemos observar como 7 de cada 10 de estos equipos, lo hicieron con una continuidad en la plantilla inferior al 60%.

 

Bonus: ¿cómo influye la temporada de un equipo en la continuidad del roster?

Hace unos días puse un Tweet sobre el artículo que estaba preparando en mi cuenta de Twitter, y uno de mis seguidores (@emilioelrata) me planteaba realizar una pequeña modificación en el estudio para prever la influencia de las victorias logradas en la temporada de un equipo sobre la continuidad de la plantilla. Recuerdo que el estudio realizado es “continuidad esta temporada” vs “victorias esta temporada”, Emilio me planteaba estudiar la “continuidad esta temporada” vs “victorias temporada anterior“.

Los resultados han sido acordes a lo esperado, es decir, mientras mejor temporada haga el equipo, más se mantiene el bloque, como siempre, teniendo en cuenta que existen valores atípicos. Sobre este segundo estudio, simplemente destacar tres puntos:

  1. El 72% de los equipos que terminaron la temporada con 42 o más victorias (es decir, récord positivo) tuvieron una continuidad en su plantilla superior al 60%.
  2. 14 de los 15 equipos que han alcanzado las 60 victorias en la última década, tuvieron una continuidad en su plantilla en la siguiente temporada superior al 60%. Además 9 de esos 15 equipos llegaron a superar el 80% de continuidad.
  3. A continuación os dejo un gráfico donde podréis ver la representación gráfica de esta nueva comparativa, además he marcado con una línea roja las 42 victorias (en vertical) y con otra el 60% de continuidad (en horizontal):

Modelo de predicción de victorias utilizando la continuidad de las plantillas NBA

 

Si te ha gustado este artículo creo que también podría gustarte este otro que escribí sobre la edad de decadencia de las estrellas de la NBA. Además como no estoy teniendo mucha regularidad escribiendo, te recomiendo suscribirte a mi lista de correo, no haré spam ni historias raras, solamente te avisaré cuando saque algún contenido nuevo:



Deja un comentario

Tu dirección de correo electrónico no será publicada.