Ir al contenido principal

PREDICCIÓN ELIMINATORIAS CONMEBOL: ¿QUIÉNES IRÍAN AL MUNDIAL DE 2026?

Un ejercicio de ciencia de datos que realmente merece la atención es predecir quiénes serán los vencedores en alguna competencia. En este caso se va a predecir cuáles equipos de la Conmebol irían al mundial de 2026.

Para ello se van a tomar los datos de goles a favor (GF), goles en contra (GC) y partidos jugados (PJ) por cada equipo desde que se instauró la modalidad de todos contra todos en las eliminatorias de Conmebol (a partir de Francia 1998). Cabe recordar que Brasil no disputó 2 eliminatorias: la de Francia 1998 (porque en ese entonces el campeón iba directo al mundial) y la de Brasil 2014 (porque era el país organizador). Los datos se obtuvieron de wikipedia:

Una muestra de los datos obtenidos para cada equipo


Aquí se aclara que Brasil tiene menos datos porque no jugó dos eliminatorias

A continuación se suman los goles a favor de cada equipo y se divide entre el total de partidos jugados para obtener el promedio de goles a favor (Scored_Mean). Luego se suman los goles en contra de cada equipo y se divide entre el total de partidos jugados para obtener el promedio de goles en contra (Conceded_Mean). Aquí se aprecia el consolidado para cada equipo:

Promedio de goles a favor (Scored_Mean) y promedio de goles en contra (Conceded_Mean) para cada equipo 

Con base en esta tabla se van a realizar las predicciones. Se guarda el archivo en formato csv y en el notebook de Jupyter se procede a leerlo a través de Pandas.

Por otro lado, se va a emplear la distribución de Poisson para hacer cálculos de probabilidades donde se necesita contar el número de veces que se produce un suceso aleatorio durante un período determinado. Dicha distribución se utilizó en otro trabajo (canal de youtube de Frank Andrade, Proyecto de Data Science con Python - Proyecto completo desde 0). Aquí está el fragmento del código en lenguaje Python:

Las variables lamb_home y lamb_away indican la fortaleza que tiene un equipo cuando juega como local o visitante. Por ejemplo si se selecciona a Argentina jugando como local y a Ecuador como visitante, el lamb_home de Argentina se obtiene al multiplicar su propio Scored_Mean por el Conceded_Mean del rival visitante. Así mismo el lamb_away de Ecuador se obtiene al multiplicar su propio Scored_Mean por el Conceded_Mean del rival local. Ya con estos valores se realiza la predicción con la distribución Poisson. Los puntos esperados que obtiene cada equipo se calcula multiplicando 3 por la probabilidad de victoria y se le suma la probabilidad de empate (se multiplica por 3 porque de acuerdo con el reglamento del fútbol se dan 3 puntos por victoria).

Se ejecuta la función para cada equipo. Se multiplica por 2 porque los partidos se juegan de ida y vuelta. Aquí se muestran los cálculos para algunas selecciones:

Finalmente se tabulan todos los puntos esperados para cada selección y se organizan en orden decreciente:

Tabla de posiciones de las eliminatorias de la Conmebol con base en los puntos esperados (xPTS)

Con esta predicción, los 6 clasificados directos al Mundial de 2026 serían Brasil, Argentina, Colombia, Uruguay, Ecuador y Chile. Paraguay iría al repechaje. Perú, Bolivia y Venezuela quedarían eliminados.

Cabe aclarar que así no va a quedar la tabla de posiciones al final de las eliminatorias, es un simple ejercicio de predicción que emplea datos históricos de eliminatorias pasadas y un modelo de distribución de probabilidades. Por supuesto, el modelo es susceptible de mejorar, ya sea con otro modelo de distribución, con otro cálculo de las fortalezas de cada equipo, usando los datos de las últimas 5 eliminatorias, etc.

Bibliografía

- Datos de las eliminatorias: www.wikipedia.com

- Modelo de distribución Poisson: Proyecto de Data Science con Python - Proyecto completo desde 0. Disponible en el canal de youtube de Frank Andrade.

Comentarios

Entradas más populares de este blog

PRONÓSTICOS CUADRANGULAR B LIGA BETPLAY II-2023 SEGUNDA FECHA

Para las pronósticos del cuadrangular B de la Liga Betplay II-2023 por la segunda fecha se tomaron como base las reclasificaciones de los años 2021, 2022 y 2023 (esto incluye todos contra todos, playoffs, cuadrangulares y finales). De igual forma se usó como modelo la distribución de Poisson (base empleada por Daniel en el trabajo llamado Predicción en fútbol a partir de los goles marcados: la distribución de Poisson I) Los resultados obtenidos por el modelo pueden variar con los obtenidos por Wplay y Maticsfutbol, ya que ellos podrían haber usado otro marco de referencia (más o menos partidos para trabajar) u otros modelos diferentes al de Poisson. Vale la pena recordar que estos pronósticos se basan en datos históricos y estadísticas de los equipos. Las lesiones, decisiones tácticas, actitudes de los jugadores, clima y otros factores externos pueden afectar estas probabilidades.  Millonarios-América La tendencia indicaría victoria de Millonarios, menos de 2,5 goles y los dos no m...

ANÁLISIS EXPLORATORIO DE LA PREMIER LEAGUE 2023-2024: FECHA 12

Cumplidas 12 jornadas de la Premier League, se van a revisar sus datos para determinar qué tan bien están haciendo las cosas cada uno de los 20 participantes de esta competencia. Los datos se obtuvieron de esta página web:  https://understat.com/league/EPL  Los datos se analizaron con el software Power Bi. Se van a realizar cuatro análisis para ver cómo están los equipos: 1) diferencia de goles, 2) puntos y puntos esperados, 3) goles a favor y goles esperados, 4) goles en contra y goles esperados. 1) Diferencia de goles En la primera gráfica se consideran los goles a favor y los goles en contra de cada equipo: las barras de color azul claro indican los goles anotados por cada equipo y las barras de color azul oscuro indican lo goles que ha recibido cada equipo. Se puede ver que el equipo con mejor ataque es el Manchester City con 32 goles a favor y que el equipo con peor ataque es el Burnley con 9 goles. Por otro lado hay dos equipos que han recibido la menor cantidad de goles...

PRONÓSTICOS CUADRANGULAR B FECHA 3

  Bienvenidos a una nueva fecha del cuadrangular B. Aquí están los pronósticos correspondientes. Vale la pena recordar que para realizarlos se tuvieron en cuenta los desempeños en los últimos 3 años (2021, 2022 y 2023) y se incluyen todos contra todos, cuadrangulares o playoffs y finales. De igual forma los resultados ilustrados se comparan con los obtenidos por WPlay y Maticsfutbol para ver concordancia o discrepancia. Y por último ninguno de los pronósticos asegura que así vayan a quedar los partidos. Son simples probabilidades y que hay factores externos que modifican el rumbo de los compromisos: cambios tácticos, actitud, lesiones, clima, etc. Millonarios-Medellín Nacional-América