Un ejercicio de ciencia de datos que realmente merece la atención es predecir quiénes serán los vencedores en alguna competencia. En este caso se va a predecir cuáles equipos de la Conmebol irían al mundial de 2026.
Para ello se van a tomar los datos de goles a favor (GF), goles en contra (GC) y partidos jugados (PJ) por cada equipo desde que se instauró la modalidad de todos contra todos en las eliminatorias de Conmebol (a partir de Francia 1998). Cabe recordar que Brasil no disputó 2 eliminatorias: la de Francia 1998 (porque en ese entonces el campeón iba directo al mundial) y la de Brasil 2014 (porque era el país organizador). Los datos se obtuvieron de wikipedia:
![]() |
| Una muestra de los datos obtenidos para cada equipo |
![]() |
| Promedio de goles a favor (Scored_Mean) y promedio de goles en contra (Conceded_Mean) para cada equipo |
Con base en esta tabla se van a realizar las predicciones. Se guarda el archivo en formato csv y en el notebook de Jupyter se procede a leerlo a través de Pandas.
Por otro lado, se va a emplear la distribución de Poisson para hacer cálculos de probabilidades donde se necesita contar el número de veces que se produce un suceso aleatorio durante un período determinado. Dicha distribución se utilizó en otro trabajo (canal de youtube de Frank Andrade, Proyecto de Data Science con Python - Proyecto completo desde 0). Aquí está el fragmento del código en lenguaje Python:Las variables lamb_home y lamb_away indican la fortaleza que tiene un equipo cuando juega como local o visitante. Por ejemplo si se selecciona a Argentina jugando como local y a Ecuador como visitante, el lamb_home de Argentina se obtiene al multiplicar su propio Scored_Mean por el Conceded_Mean del rival visitante. Así mismo el lamb_away de Ecuador se obtiene al multiplicar su propio Scored_Mean por el Conceded_Mean del rival local. Ya con estos valores se realiza la predicción con la distribución Poisson. Los puntos esperados que obtiene cada equipo se calcula multiplicando 3 por la probabilidad de victoria y se le suma la probabilidad de empate (se multiplica por 3 porque de acuerdo con el reglamento del fútbol se dan 3 puntos por victoria).
Se ejecuta la función para cada equipo. Se multiplica por 2 porque los partidos se juegan de ida y vuelta. Aquí se muestran los cálculos para algunas selecciones:
Finalmente se tabulan todos los puntos esperados para cada selección y se organizan en orden decreciente:
![]() |
| Tabla de posiciones de las eliminatorias de la Conmebol con base en los puntos esperados (xPTS) |
Con esta predicción, los 6 clasificados directos al Mundial de 2026 serían Brasil, Argentina, Colombia, Uruguay, Ecuador y Chile. Paraguay iría al repechaje. Perú, Bolivia y Venezuela quedarían eliminados.
Cabe aclarar que así no va a quedar la tabla de posiciones al final de las eliminatorias, es un simple ejercicio de predicción que emplea datos históricos de eliminatorias pasadas y un modelo de distribución de probabilidades. Por supuesto, el modelo es susceptible de mejorar, ya sea con otro modelo de distribución, con otro cálculo de las fortalezas de cada equipo, usando los datos de las últimas 5 eliminatorias, etc.
Bibliografía
- Datos de las eliminatorias: www.wikipedia.com
- Modelo de distribución Poisson: Proyecto de Data Science con Python - Proyecto completo desde 0. Disponible en el canal de youtube de Frank Andrade.







Comentarios
Publicar un comentario