El mundo del ajedrez se conmocionó a finales de 2022 cuando Magnus Carlsen, actual campeón del mundo, acusó a Hans Niemann, un gran maestro estadounidense de 19 años, de hacer trampas utilizando un sistema de inteligencia artificial (IA) para jugar al ajedrez. Niemann había derrotado a Carlsen, lo que provocó la acusación de Carlsen; Niemann afirmó que había jugado limpiamente contra Carlsen, aunque más tarde admitió haber hecho trampas dos veces en partidas de ajedrez en línea, a los 12 y 16 años.
Un mes después, un informe de investigación de 72 páginas redactado por Chess.com afirmaba que Niemann "probablemente había hecho trampas" más de cien veces mientras jugaba al ajedrez en línea. Pero el informe también decía: "No hay pruebas directas que demuestren que Hans hizo trampas en la partida del 4 de septiembre de 2022 con Magnus".
Las trampas en el ajedrez se han convertido en un grave problema, especialmente en la era online. Entre las más de 500.000 cuentas que Chess.com ha dado de baja por hacer trampas, más de 500 pertenecían a jugadores con título (el título es una marca de habilidad). Para principios de 2024, el sitio espera cerrar más de un millón de cuentas.
¿Cómo se puede saber si un jugador ha hecho trampas? En primer lugar, los investigadores construyen un modelo estadístico a partir de la base de datos de millones de partidas de ajedrez finalizadas. A continuación, calculan la probabilidad de que la jugada de un jugador humano coincida con una jugada realizada por un motor de ajedrez utilizando el modelo ajustado.
Es algo así como un análisis de ADN de la escena del crimen para todos los ajedrecistas del mundo. Los motores de ajedrez como Leela Chess Zero y Stockfish no sólo son mejores jugadores que sus homólogos humanos (de media), sino que también juegan de forma diferente. Stockfish tiene una puntuación Elo de más de 3.500, en comparación con la puntuación Elo de Carlsen en 2014 de 2.882, la más alta que un humano ha alcanzado jamás. Además, los estilos de juego de los motores bien podrían ser de otro planeta porque se desarrollan de forma diferente a como lo hacen los humanos. Por eso se dice que la probabilidad de hacer trampas aumenta cuando aumenta la correlación entre las jugadas de un jugador y las de los motores de ajedrez.
Al introducir los registros de las partidas de Niemann en los motores de ajedrez, algunos expertos descubrieron que Niemann había realizado una larga serie de jugadas recomendadas por la IA en partidas de torneo y que sus tácticas eran con frecuencia similares a las de un ordenador. Pero algunos expertos sostuvieron que los movimientos a bordo en partidas reales de muchos jugadores podrían parecerse a los de una IA, ya que el entrenamiento, la preparación y las prácticas de los jugadores humanos ahora también se ven afectados por estos motores.
La disputa Carlsen-Niemann podría decidirse finalmente en los tribunales: Niemann ha demandado a Carlsen, Chess.com y al prodigio del ajedrez Hikaru Nakamura, que también acusó a Niemann de hacer trampas en partidas online, por 100 millones de dólares por difamación. No es la primera vez que las estadísticas son cruciales en un proceso judicial. Hay numerosos casos en Estados Unidos, el Reino Unido y otros países en los que las teorías estadísticas -principalmente las relacionadas con el cálculo de probabilidades- se han aplicado tanto bien como mal.
El caso Sally Clark
El uso de la estadística en los tribunales requiere la máxima precaución y pericia. Un tristemente célebre caso penal del Reino Unido en el que estaba implicada una mujer llamada Sally Clark es un excelente ejemplo de cómo el uso de estadísticas falsas dio lugar a una injusticia.
Tras la muerte prematura de dos de sus hijos por síndrome de muerte súbita del lactante (SMSL) en sendas ocasiones, Clark fue acusada de asesinato. Un pediatra afirmó que la probabilidad de que se produzca una muerte por SMSL al azar cuando la madre es mayor de 26 años, acomodada y no fumadora, es de 1 entre 8.543. Por tanto, la probabilidad de que se produzcan dos muertes de este tipo es de 1 entre 2.000. Así que la probabilidad de dos muertes de este tipo, continuó el experto, se calculó como 1/(8.543^2), o 1 entre 73 millones. Clark fue condenada en 1999.
Pero la Royal Statistical Society no estuvo de acuerdo y dijo que "no había base estadística" para la cifra del pediatra. De hecho, el pediatra había cometido la "falacia del fiscal" al considerar erróneamente que las dos muertes eran independientes. Cuando Ray Hill, profesor de matemáticas de la Universidad de Salford, examinó datos adicionales en 2002, llegó a la conclusión de que la probabilidad de que un segundo niño muriera de SMSL si el primero lo había hecho ¡podría ser de sólo 1 entre 60! Por ello, Clark fue puesta en libertad en 2003.
En un artículo de 2011, Norman Fenton, profesor de gestión de la información sobre riesgos en Queen Mary, Londres, escribió: "La mayoría de las falacias comunes del razonamiento estadístico pueden evitarse aplicando el teorema de Bayes, una regla que permite ponderar las pruebas."
Supongamos que una muestra de la escena del crimen ha arrojado un perfil de ADN parcial que coincide con las partes equivalentes del perfil de Swami con una probabilidad de coincidencia aleatoria de 2 entre 1.000. Así que el fiscal proclama que es un 99,8% probable que Swami cometiera el crimen porque sólo el 0,2% de las personas pueden tener esa coincidencia de ADN. Considere, sin embargo, que había 10.000 personas que podrían haber estado en el lugar del crimen. Así que Swami es sólo una de las 20 fuentes de coincidencia esperadas. En lugar del 99,8%, la probabilidad de que Swami haya cometido el crimen es sólo del 5%.
(Nótese que este método supone que cada una de las 10.000 fuentes potenciales tiene una probabilidad previa igual de haber sido la fuente).
En una conferencia pronunciada en julio de 2021, la jueza Lady Rose, del Tribunal Supremo del Reino Unido, afirmó: "Hay algunos ámbitos en los que los seres humanos somos especialmente falibles a la hora de utilizar la estadística para tomar decisiones racionales. Una importante es la evaluación del riesgo y la probabilidad".
Carlsen ha expresado su convicción de que hacer trampas es "una amenaza existencial" para el ajedrez. Podría ser tentador, con este telón de fondo, ver que el futuro de este juego de 1.500 años de antigüedad está incluso en parte en manos del caso Carlsen-Niemann, concretamente en el uso adecuado de las estadísticas y su interpretación. Pero habrá varias formas de calcularlas e interpretarlas, del mismo modo que el propio caso puede inclinarse hacia cualquier lado.
Por ejemplo, según el análisis de un usuario anónimo de Chessbase llamado gambit-man, Niemann tiene un número inusualmente alto de partidas con un 100% de correlación de motor. La defensa de Niemann podría ser que su juego es mucho menos parecido al de un ordenador que el de Carlsen en el pasado reciente.
Hay una métrica llamada pérdida de centipawn: mide lo peores que fueron las jugadas de un jugador en comparación con la mejor elección del motor. Un valor más bajo indica una mayor coincidencia con la elección del motor. Hay otra métrica llamada profundidad: el número de próximas jugadas de un solo jugador que un motor de ajedrez intenta predecir. En comparación con el motor de ajedrez de código abierto Stockfish (v. 15), con una profundidad de 18, las puntuaciones de Niemann y Carlsen son de 25,6 y 16,9 respectivamente.
Entonces, ¿gana la discusión Niemann o Carlsen?
Es difícil saberlo. Quizá nunca sepamos con certeza si Niemann realmente hizo trampas, porque los análisis estadísticos sólo sugieren si puede haber habido trampas; no proporcionan veredictos absolutos. Los expertos examinarán todos los aspectos de estos análisis -incluidos sus fundamentos estadísticos, su idoneidad y su interpretación- y, basándose en ellos, elaborarán argumentos y contraargumentos igualmente válidos.
Lo único de lo que podemos estar razonablemente seguros es de que, gane quien gane el caso, una partida de ajedrez honesta no tiene por qué pender de un hilo, pero no por las razones que preocupan a Carlsen.
Atanu Biswas es profesor de estadística en el Instituto Indio de Estadística de Calcuta.