¡Qué jonrón! Béisbol y “la falacia del volado”

Imagen de Wikipedia
Imagen de Wikipedia

El martes 11 de agosto de 2015 parecía ser una jornada normal en el béisbol de las Grandes Ligas de los Estados Unidos. El último juego de ese día, en el que los Marineros de Seattle recibían a los Orioles de Baltimore, se fue a extra-innings y finalmente los marineros salieron victoriosos por seis carreras a cinco en diez entradas. Al revisar las estadísticas del día, los compiladores oficiales se dieron cuenta de que la victoria de los marineros locales no había sido única: en los 15 juegos del día el equipo local había ganado. Al otro día, la página oficial de las Grandes Ligas anunciaba “¡Qué jonrón! Todos los equipos locales ganan”. Según el reportaje, esa había sido la primera vez en la historia del béisbol de los Estados Unidos que se presentaba un resultado así.

Los fanáticos de los números calcularon rápidamente que la probabilidad de que los 15 juegos de una jornada terminen con la victoria del equipo local es de una en 32768, esto suponiendo que en un juego dado los dos equipos tienen la misma probabilidad de ganar [1]. En otras palabras, tendríamos que ver, en promedio, 32768 jornadas de 15 juegos de béisbol cada una para para ser testigos de nuevo de lo que sucedió el 11 de agosto. Hoy en día, la temporada de las Grandes Ligas consta de 162 jornadas, de manera que tendríamos que ponernos cómodos en nuestros sillones y prepararnos para ver cerca de 202 años de béisbol si quisiéramos repetir la experiencia.

Ahora bien, el cálculo anterior no toma en cuenta un factor que todo buen aficionado, y en particular todo buen apostador conoce: los equipos locales tienen siempre una ventaja sobre sus adversarios y por tanto la probabilidad de ganar un juego como local no es de una en dos, como si fuera un “volado” (así se llama en México al tiro de una moneda para tomar una decisión). Supongamos que los equipos locales ganan en promedio seis de cada diez encuentros (en lugar de los cinco por cada diez que supone el modelo del volado). En ese caso, la probabilidad de que los 15 equipos locales ganen en una jornada dada es de 1 en 2127 y podríamos esperar observar el fenómeno cada 13 años en promedio [2].  Todavía sería un patrón poco común, pero no tan extremo; un buen aficionado podría tener expectativas razonables de observar el récord varias veces a lo largo de su vida.

El ejemplo nos muestra como un pequeño cambio en nuestra estimación de una probabilidad (la de que un local gane) puede modificar significativamente el resultado de un proceso que se repite muchas veces (el total de juegos ganados por los locales a lo largo de varios años con muchas jornadas de 15 juegos). Nos muestra también la falsedad del “modelo del volado”, es decir, suponer que la probabilidad de eventos con dos posibles resultados (sí o no, falso o verdadero, niña o niño, águila o sol, ganar o perder) es siempre de 1/2.

En algunos casos, la probabilidad en eventos binarios (con dos resultados posibles y excluyentes) es muy cercana a 1:2. Por ejemplo, un estudio reciente mostró que por cada 1000 bebés nacidos en Japón en 2012 hubo 513 varones y 487  niñas [3]. Los números son muy cercanos a 500:500 que esperaríamos si las probabilidades fueran exactamente de 1/2, pero la desviación es suficientemente grande como para requerir una explicación. En este caso la mortalidad diferencial antes del nacimiento parece ser la explicación.

En el caso del béisbol, según datos obtenidos de una página de apuestas, en los últimos cinco años los equipos locales han ganado 537 de cada 1000 juegos, por arriba de los 500 que esperaríamos si la probabilidad fuera exactamente de ½. Si usamos este dato, que considera “la ventaja del local”, podemos ver que la probabilidad de que los 15 equipos locales ganen en una jornada beisbolística es de una en 11 230, correspondiente a unos 69 años de béisbol. Con estas cifras, el episodio del 11 de agosto sí parece ser una experiencia de una vez en la vida, aunque no tan extraordinario como las páginas deportivas quisieron hacernos creer. (Para un episodio deportivo realmente extraordinario, ver Wimbledon y la inteligencia extraterrestre, en este mismo blog).

Es importante recordar aquí que el cálculo de probabilidades por definición se refiere a eventos con incertidumbre. El que un evento suceda en promedio una vez cada 69 años no significa que debamos esperar exactamente ese número de años desde el 11 de agosto para volver a ver a los 15 equipos ganando sus juegos en una jornada. El fenómeno podría suceder el próximo año, o podría no suceder hasta dentro de 100 años. Lo que nos ofrece el cálculo de probabilidades es una expectativa promedio, no una predicción exacta.

Notas
[1] Si la probabilidad de que un equipo local gane su juego es de 1/2 , la probabilidad de que los 15 equipos locales ganen en una jornada dada es de (1/2) elevado a la potencia 15, es decir, de 1 en 32768.
[2] Si la probabilidad de que gane el local es en realidad de 0.6 (6/10), la probabilidad de 15 victorias locales es de (6/10) elevado a la potencia 15, o de 1 en 2127.
[3] Fukuda, Misao, et al. “Climate change is associated with male: female ratios of fetal deaths and newborn infants in Japan.” Fertility and sterility 102.5 (2014): 1364-1370.

Wimbledon y la inteligencia extraterrestre

El 24 de junio de 2010 terminó la partida de tenis más larga de la historia. Después de once horas y cinco minutos de tiempo efectivo, el americano John Isner ganó dos juegos seguidos al francés Nicolas Mahut para llevarse por 70-68 el último set de una partida que había comenzado dos días antes. Lo que parecía un encuentro más de la serie eliminatoria del torneo de Wimbledon se convirtió en un evento histórico.

Según las reglas tradicionales del tenis, que se siguen para el set definitorio de las partidas en Wimbledon, un jugador debe ganar al menos seis juegos con al menos una diferencia de dos juegos para llevarse un set. En la tradición de Stephen Jay Gould y E. M Purcell, se puede usar una aproximación de probabilidad binomial a una secuencia de eventos deportivos para estimar en qué medida los logros pueden ser considerados “extraordinarios”. Por ejemplo, los 56 juegos consecutivos en los que Joe DiMaggio conectó al menos un hit en 1941 o los cien puntos anotados en un solo juego de básquetbol profesional por Wilt Chamberlain en 1962 son hazañas que desde el punto de vista probabilístico son a todas luces “extraordinarios”.

Usando un modelo binomial similar, se puede estimar que la probabilidad de un set de 138 juegos es de una en 75 trillones (7.49 x 1019 = 75, 000, 000, 000, 000, 000, 000), si suponemos que cada jugador tiene igual probabilidad de ganar en cada juego del set. Este es un evento tan improbable como por ejemplo encontrar un grano de arena en particular de entre todos los granos que hay en la Tierra (aproximadamente 1020). Ahora bien, el hecho de que la partida de Isner y Mahut sucedió es muestra de que un evento extraordinariamente improbable no es necesariamente imposible si se cuenta con un número suficiente de repeticiones.

La cantidad de granos de arena en la Tierra es un parámetro proverbial para indicar un número extraordinariamente grande. “…Multiplicaré grandemente tu descendencia como las estrellas del cielo y como las arenas de las orillas del mar”, promete el dios de la Biblia a Abraham (Génesis 22:17). Pero, ¿Qué hay entonces con referencia al número de “estrellas del cielo”? Tal cantidad tiene que ver con el cálculo de la probabilidad de la vida inteligente fuera de la Tierra.

Sabemos que la probabilidad de que una civilización inteligente surja en un sistema planetario dado es tremendamente baja. Sin embargo, como también sabemos que el número de estrellas es increíblemente alto (“billions and billions of stars”, como solía decir Carl Sagan), es prácticamente un hecho que en nuestra galaxia exista al menos una civilización inteligente, además de la del planeta Tierra (aunque la actuación de algunos gobernantes nos hace en ocasiones dudar del carácter “inteligente” de nuestra civilización). Hagamos algo de matemáticas.

En 1961, el astrónomo Frank Drake propuso una famosa fórmula, que ahora lleva su nombre, con la que es posible calcular el número estimado de civilizaciones en nuestra galaxia con las que podría ser posible establecer comunicación (N). La ecuación consta de siete factores que van determinando la probabilidad de acuerdo con estimaciones sobre la tasa de formación de nuevas estrellas, la proporción de estas estrellas que tienen planetas, la fracción de estos planetas en los que puede haber vida, el porcentaje de estos planetas con vida en los que hay vida inteligente y la probabilidad de que estos seres inteligentes tengan tecnología para comunicarse fuera de su planeta.

Se calcula que en nuestra galaxia existen entre 200 y 400 mil millones de estrellas. De acuerdo con los parámetros de la ecuación de Drake, es posible que sólo una de cada 140 mil millones de estrellas tenga una civilización con capacidad de comunicación interestelar. El número de estrellas, sin embargo, es tal que todo esto arroja un estimado de N = 2.1 civilizaciones con capacidad de comunicación interestelar. Es decir, en este preciso momento debe haber al menos dos civilizaciones en la Vía Láctica que estén intentando comunicarse con nosotros.

Desde el principio, la ecuación de Drake ha sido criticada por la manifiesta imprecisión de cada uno de sus siete parámetros. Sin embargo, en algunos casos tenemos mucha más información ahora que la que teníamos apenas hace unos cuantos años. Por ejemplo, apenas a principios de los años 1990s se confirmó experimentalmente la existencia de planetas fuera de nuestro Sistema Solar. Ahora, hasta el 27 de agosto, el número de observaciones confirmadas es de 490 de tales planetas. Más aún, en el número de esta semana de la revista Science se reporta la detección de un sistema con al menos un planeta de tamaño y características similares a los de la Tierra. Estas observaciones nos muestran algo que desde siempre se ha sospechado: es posible que la presencia de planetas alrededor de estrellas semejantes a nuestro Sol sea la regla, más que la excepción.

¿Estaremos finalmente a punto de observar vida fuera de nuestro Sistema Solar?

[Actualización 2 de marzo de 2012: Se cumplen 50 años del juego de básquetbol en el que Wilt Chamberlain anotó 100 puntos]