Como es habitual cuando se acerca el fin de la temporada de la liga española de fútbol, se empiezan a manejar las supuestas probabilidades de descenso de todos los equipos involucrados en la lucha por permanecer en primera división, es decir, aquellos que matemáticamente (aún) ni han descendido ni están salvados. Porcentajes, al ser posible con decimales, gozan de gran popularidad en los medios por la apariencia científica que aportan. El problema es que en este caso se trata solo de eso, de una apariencia. El fútbol nos proporciona un buen ejemplo de que el concepto de la probabilidad es mucho más complejo de lo que pueda parecer a primera vista.
Supongamos que hasta el fin de la temporada quedan N partidos con participación de los equipos inmersos en la lucha por la permanencia, que consiste en tratar de no acabar la temporada en uno de los últimos tres puestos de la clasificación que implican el descenso a la segunda división. Si distinguimos los desenlaces victoria del equipo local (1), empate (X) y victoria del equipo visitante (2), hay 3N escenarios con diferentes repartos de puntos, teniendo en cuenta que una victoria suma tres puntos, un empate un punto y una derrota ninguno. Para cada uno de los 3N escenarios estaría definido quién se salva y quién desciende (a no ser que un empate a puntos nos obligue a considerar también los goles marcados y encajados en los partidos, una complicación que aquí vamos a pasar por alto para simplificar). Si por ejemplo quedan 6 partidos relevantes para el descenso, habiendo por tanto 36 = 729 escenarios de reparto de puntos posibles, y un determinado equipo descendería en 73 de ellos, podemos afirmar que descendería en el 10 % de los escenarios posibles.
El problema empieza cuando este porcentaje se interpreta como la probabilidad de descender de dicho equipo, ya que supone considerar igual de probables todos los escenarios, como si cada partido fuera un simple sorteo donde puede salir con la misma probabilidad, del 33,3%, 1, X o 2. Obviamente no es así, sino necesitaríamos asignar primero a cada uno de los N partidos en cuestión las probabilidades de los tres desenlaces posibles. Multiplicando las probabilidades correspondientes obtendríamos así la probabilidad de cada uno de los 3N escenarios. La probabilidad de descenso de un equipo sería la suma de las probabilidades de aquellos escenarios que le dejarían en los últimos tres puestos.
¿Pero cómo establecemos las probabilidades de los tres posibles desenlaces de cada partido? Podrían utilizarse por ejemplo las proporciones de los desenlaces 1, X y 2 a lo largo de la historia de la liga española, lo cual es sin duda mejor que asumir un 33,3% para cada uno de los tres desenlaces, pero sigue siendo muy simplista, porque asume una misma distribución de las probabilidades para todos los partidos, sin distinguir los rivales que se enfrentan. Para diferenciar según los rivales y su nivel actual habría que tener en cuenta muchos otros factores, como el rendimiento de cada equipo en la temporada (especialmente en los últimos partidos), el historial de enfrentamientos directos entre los dos equipos (especialmente los últimos), si a un equipo le vale un empate o si tiene que salir a ganar como sea con las correspondientes implicaciones sobre la táctica de juego, posibles bajas importantes de cada equipo, lo que se juega cada equipo en la liga a estas alturas, las demás competiciones en los que aún puede estar inmerso un equipo, etc. No hay manera de cuantificar exactamente la influencia de cada uno de estos factores, por lo que la forma de traducirlos en probabilidades de desenlaces de los partidos será siempre subjetiva.
Por tanto, si leemos que un determinado equipo tiene un 37,9 % de probabilidades de descender, estamos ante una importante falta de rigor y una banalización del concepto de la probabilidad, que queda más patente aún si otra fuente eleva esta misma probabilidad al 57 %. Ambos números no pueden ser más que estimaciones de la probabilidad y deben comunicarse con humildad como tales. Cada una se basa en un modelo diferente para asignar probabilidades a los desenlaces de los partidos, que siempre será arbitrario y simplificador y que también debería explicarse para que el lector sepa cuáles son las suposiciones que subyacen a las estimaciones indicadas. Ninguna estimación puede considerarse la verdadera probabilidad. A diferencia del lanzamiento de un dado que podemos repetir una y otra vez para comprobar que a largo plazo uno de cada seis veces nos sale un 1, lo cual nos indica la probabilidad de este desenlace, un partido nunca se repite en las mismas condiciones: cambian los jugadores, su estado de forma, la química entre ellos y con el entrenador, las necesidades del equipo, la motivación, la concentración, etc.
El fútbol ha mostrado ser un deporte menos predecible que otros, debido a la enorme influencia de factores difícilmente cuantificables. A lo mejor en ello radica parte de su capacidad de fascinarnos.
Este artículo se publicó originalmente en el blog del autor.
Supongamos que hasta el fin de la temporada quedan N partidos con participación de los equipos inmersos en la lucha por la permanencia, que consiste en tratar de no acabar la temporada en uno de los últimos tres puestos de la clasificación que implican el descenso a la segunda división. Si distinguimos los desenlaces victoria del equipo local (1), empate (X) y victoria del equipo visitante (2), hay 3N escenarios con diferentes repartos de puntos, teniendo en cuenta que una victoria suma tres puntos, un empate un punto y una derrota ninguno. Para cada uno de los 3N escenarios estaría definido quién se salva y quién desciende (a no ser que un empate a puntos nos obligue a considerar también los goles marcados y encajados en los partidos, una complicación que aquí vamos a pasar por alto para simplificar). Si por ejemplo quedan 6 partidos relevantes para el descenso, habiendo por tanto 36 = 729 escenarios de reparto de puntos posibles, y un determinado equipo descendería en 73 de ellos, podemos afirmar que descendería en el 10 % de los escenarios posibles.
El problema empieza cuando este porcentaje se interpreta como la probabilidad de descender de dicho equipo, ya que supone considerar igual de probables todos los escenarios, como si cada partido fuera un simple sorteo donde puede salir con la misma probabilidad, del 33,3%, 1, X o 2. Obviamente no es así, sino necesitaríamos asignar primero a cada uno de los N partidos en cuestión las probabilidades de los tres desenlaces posibles. Multiplicando las probabilidades correspondientes obtendríamos así la probabilidad de cada uno de los 3N escenarios. La probabilidad de descenso de un equipo sería la suma de las probabilidades de aquellos escenarios que le dejarían en los últimos tres puestos.
¿Pero cómo establecemos las probabilidades de los tres posibles desenlaces de cada partido? Podrían utilizarse por ejemplo las proporciones de los desenlaces 1, X y 2 a lo largo de la historia de la liga española, lo cual es sin duda mejor que asumir un 33,3% para cada uno de los tres desenlaces, pero sigue siendo muy simplista, porque asume una misma distribución de las probabilidades para todos los partidos, sin distinguir los rivales que se enfrentan. Para diferenciar según los rivales y su nivel actual habría que tener en cuenta muchos otros factores, como el rendimiento de cada equipo en la temporada (especialmente en los últimos partidos), el historial de enfrentamientos directos entre los dos equipos (especialmente los últimos), si a un equipo le vale un empate o si tiene que salir a ganar como sea con las correspondientes implicaciones sobre la táctica de juego, posibles bajas importantes de cada equipo, lo que se juega cada equipo en la liga a estas alturas, las demás competiciones en los que aún puede estar inmerso un equipo, etc. No hay manera de cuantificar exactamente la influencia de cada uno de estos factores, por lo que la forma de traducirlos en probabilidades de desenlaces de los partidos será siempre subjetiva.
Por tanto, si leemos que un determinado equipo tiene un 37,9 % de probabilidades de descender, estamos ante una importante falta de rigor y una banalización del concepto de la probabilidad, que queda más patente aún si otra fuente eleva esta misma probabilidad al 57 %. Ambos números no pueden ser más que estimaciones de la probabilidad y deben comunicarse con humildad como tales. Cada una se basa en un modelo diferente para asignar probabilidades a los desenlaces de los partidos, que siempre será arbitrario y simplificador y que también debería explicarse para que el lector sepa cuáles son las suposiciones que subyacen a las estimaciones indicadas. Ninguna estimación puede considerarse la verdadera probabilidad. A diferencia del lanzamiento de un dado que podemos repetir una y otra vez para comprobar que a largo plazo uno de cada seis veces nos sale un 1, lo cual nos indica la probabilidad de este desenlace, un partido nunca se repite en las mismas condiciones: cambian los jugadores, su estado de forma, la química entre ellos y con el entrenador, las necesidades del equipo, la motivación, la concentración, etc.
El fútbol ha mostrado ser un deporte menos predecible que otros, debido a la enorme influencia de factores difícilmente cuantificables. A lo mejor en ello radica parte de su capacidad de fascinarnos.
Este artículo se publicó originalmente en el blog del autor.