Sumas fuera de lugar como éstas ocurren todos los días, aunque generalmente en situaciones no tan obvias. Al determinar el coste total de una huelga o la cuenta anual por cuidado de animales domésticos, por ejemplo, siempre hay una tendencia a añadir todo lo que se le ocurre a uno, aunque ello tenga como consecuencia que algunas cosas se cuenten varias veces bajo distinto nombre, o que no se tengan en cuenta ciertos ahorros que se derivan de la situación. Si usted se cree todas esas cifras, es muy probable que también crea que a los niños no les quedan días para ir a la escuela.
Si quiere impresionar a la gente, y en particular a los anuméricos, con la gravedad de una situación, al hablar de un fenómeno raro que afecte a una base amplia de población, siempre puede seguir la estrategia de hablar de los números absolutos y no de las probabilidades. Esta actitud se conoce a veces como la falacia de la «base extensa», y ya hemos citado un par de ejemplos de la misma. Qué cifra conviene destacar, si el número o la probabilidad, depende del contexto, pero es útil saber pasar rápidamente del uno a la otra para que titulares como «500 muertos en un puente de cuatro días» (es aproximadamente el mismo número de personas que se matan en cualquier período de cuatro días) no nos abrumen.
Otro ejemplo lo tenemos en el torrente de artículos publicados hace pocos años acerca de la pretendida relación entre el suicidio de adolescentes y el juego de
Dungeons and Dragons
. La idea consistía en que los adolescentes se obsesionaban con el juego, y de un modo u otro perdían el contacto con la realidad, y acababan por suicidarse. La prueba que se presentaba era que veintiocho adolescentes que solían jugar a menudo a ese juego se habían suicidado.
El dato estadístico parece bastante impresionante, pero sólo hasta que se tienen en cuenta otros dos hechos. En primer lugar, se vendieron millones de ejemplares del juego y se estima que jugaron a él unos tres millones de adolescentes. Y en segundo lugar, la tasa anual de suicidio para este grupo de edad es aproximadamente de 12 por cada 100.000. Los dos hechos juntos sugieren que el número esperado de adolescentes que jugaban al
Dungeons and Dragons
y podían suicidarse era ¡aproximadamente 360 (12 × 30)! No pretendo negar que el juego pudiera ser un factor influyente en alguno de esos suicidios, sino sólo dejar las cosas en su justa perspectiva.
La tentación de sacar promedios puede llegar a ser irresistible. Recuérdese el viejo chiste del hombre que dice que, aunque tiene la cabeza en el horno y los pies en la nevera, en promedio está bastante cómodo. O considérese una colección de bloques cúbicos cuyas aristas varíen entre una y cinco pulgadas. La arista del cubo medio de esta colección vale, podemos suponer, tres pulgadas. El volumen de estos mismos bloques cúbicos varía entre 1 y 125 pulgadas cúbicas. Por tanto, podemos suponer también que el bloque medio tendrá un volumen de 63 pulgadas cúbicas [(1 + 125)/2 = 63]. Juntando las dos suposiciones, llegamos a la conclusión de que el bloque cúbico medio de la colección tiene la interesante propiedad de tener ¡tres pulgadas de lado y 63 pulgadas cúbicas de volumen!
A veces un exceso de confianza en los promedios puede tener consecuencias más graves que unos cubos deformes. El doctor le dice que tiene usted una enfermedad espantosa, cuyas víctimas viven una media de cinco años. Si esto es todo lo que sabe, cabe aún alguna esperanza. A lo mejor dos tercios de los que padecen la enfermedad mueren en menos de un año y resulta que usted la contrajo hace ya un par de años.
Quizás el tercio «afortunado» de las víctimas sobrevive de diez a cuarenta años. La cuestión es que, si usted sólo conoce el tiempo medio de supervivencia y no sabe nada de la distribución de tiempos de supervivencia, es difícil hacer planes inteligentemente.
Un ejemplo numérico: el hecho de que el valor medio de cierta cantidad sea 100 puede significar que todos los valores de la misma están comprendidos entre 95 y 105; que la mitad de ellos están alrededor de 50 y la otra mitad alrededor de 150; que un cuarto de los valores son 0, la mitad están cerca de 50 y el cuarto restante aproximadamente de 300; o cualquier otra distribución con la misma media que uno quiera imaginar.
La mayoría de cantidades no tienen una curva de distribución en forma de campana, y su valor medio tiene una importancia limitada si no va acompañado de alguna medida de la variabilidad de la distribución y de una apreciación de la forma aproximada de dicha curva de distribución. Hay algunas situaciones cotidianas en las que la gente se forma una buena idea intuitiva de las curvas de distribución en cuestión. Los restaurantes de comida rápida, por ejemplo, sirven un producto de una calidad media moderada en el mejor de los casos, pero cuya variabilidad es muy pequeña (aparte de la rapidez en el servicio, su característica más atractiva). Los restaurantes tradicionales generalmente sirven un producto de una calidad media superior, pero con una variabilidad mucho mayor también, especialmente a peor.
Alguien le ofrece elegir entre dos sobres y le dice que uno contiene el doble de dinero que el otro. Usted toma el sobre A, lo abre y encuentra 100 dólares. Por tanto, el sobre B ha de contener 200 dólares o 50. Cuando el proponente le permite cambiar de sobre, usted piensa que tiene 100 dólares que ganar y sólo 50 que perder si acepta el cambio. Así que lo hace. La pregunta es: ¿por qué no tomó directamente el sobre B en primer lugar? Está claro que independientemente de la cantidad de dinero contenida en el sobre escogido en primer lugar, si le dieran permiso para cambiar, siempre lo haría y tomaría el otro sobre. Si no se tienen más datos acerca de la probabilidad con que las distintas cantidades de dinero están en los sobres, la situación anterior es un callejón sin salida. Variantes de la misma explican en parte la mentalidad de que «la hierba del vecino siempre es más verde» y que frecuentemente acompaña la divulgación de estadísticas sobre ingresos.
Otro juego más. Láncese al aire continuamente una moneda hasta que salga cruz por primera vez. Si esto no ocurre hasta el vigésimo lanzamiento (o después), usted gana mil millones de dólares. Si la primera cruz sale antes, paga 100 dólares. ¿Jugaría?
Tiene una posibilidad entre 524.288 (2
19
) de ganar los mil millones de dólares y 524.287 entre 524.288 de perder 100. Aunque es prácticamente seguro que va a perder cualquier apuesta particular, cuando gane (cosa que según la ley de los grandes números ocurrirá una vez de cada 524.288 aproximadamente), las ganancias le resarcirán con creces de sus pérdidas anteriores. En concreto, la ganancia media o esperada en este juego es de (1/524.288) × (+ mil millones) + (524.287/524.288) × (-100), que da aproximadamente 1.800 dólares por apuesta. Sin embargo, mucha gente opta por no jugar a este juego (que es una variante de lo que se conoce como paradoja de San Petersburgo) a pesar de que las ganancias medias sean de casi 2.000 dólares.
¿Qué ocurriría si pudiera jugar tan a menudo y tan seguido como quisiera y no hubiera que ajustar cuentas hasta que hubiera acabado la partida? ¿Jugaría entonces?
Obtener muestras aleatorias es un arte difícil y el encuestador no siempre lo consigue. Ni tampoco el gobierno. Es casi seguro que el sorteo del reemplazo de 1970, en los Estados Unidos, para el que se metieron los números del 1 al 366 en capsulitas para determinar quiénes iban a ser reclutados, fue injusto. Las 31 cápsulas correspondientes a las fechas de nacimientos del mes de enero se metieron en un gran arcón, a continuación se metieron las 29 correspondientes a febrero, y así sucesivamente hasta las 31 cápsulas de diciembre. Luego se mezclaron las cápsulas en el arcón pero, a lo que parece, no lo suficiente, pues las fechas de diciembre estaban desproporcionadamente representadas entre las primeras extracciones, mientras que las fechas de los primeros meses del año salieron casi al final, en una proporción significativamente mayor que la que habría correspondido al puro azar. El sorteo de 1971 ya se hizo con tablas de números aleatorios generadas por ordenador.
Tampoco es fácil obtener la aleatoriedad cuando se juega a las cartas, pues barajar un mazo de cartas dos o tres veces no es suficiente para destruir cualquier orden que pudiera haber previamente. Como ha demostrado el estadístico Persi Diaconis, normalmente es necesario barajar por completo de seis a ocho veces. Si un mazo de cartas con una ordenación conocida se baraja sólo dos o tres veces, se extrae una carta y se devuelve a algún otro lugar del mazo, un buen mago puede, casi siempre, acertar de qué carta se trataba. La mejor manera, aunque poco práctica, de ordenar una baraja al azar sería usar un ordenador para generar un ordenamiento aleatorio de las cartas.
Un modo gracioso empleado por las loterías ilegales para obtener cada día números aleatorios accesibles al público consiste en tomar la cifra de las centésimas (la última y más volátil) de los índices Dow Jones de Industrias, Transportes y Servicios Públicos, y ponerlas una tras otra en este orden. Por ejemplo, si las acciones de Industrias cerraran a 2.213,27, las de Transportes a 778,31 y las de Servicios Públicos a 251,32, el número del día sería el 712. Debido a su volatilidad, estas últimas cifras son esencialmente aleatorias, y cualquier número comprendido entre 000 y 999 tiene la misma probabilidad de salir. Y nadie tiene tampoco por qué temer que los números vayan a ser falsificados, pues aparecen en el prestigioso Wall Street Journal, y también en otros periódicos de menos alcurnia.
Además de garantizar apuestas no trucadas, encuestas no sesgadas y un buen trabajo en el contraste de hipótesis, la aleatoriedad es esencial también cuando se trata de hacer un modelo de una situación que tenga una fuerte componente probabilística. Para este fin hacen falta millones de números aleatorios. ¿Durante cuánto tiempo tendrá uno que hacer cola en un supermercado bajo determinadas condiciones? Se diseña un programa adecuado que reproduzca la situación del supermercado con sus distintos condicionamientos y se manda al ordenador que realice el programa unos pocos millones de veces para ver con qué frecuencia se dan los diferentes resultados. Muchos problemas matemáticos son tan intratables, y los experimentos que implican tan caros, que esta clase de simulación estadística es la única alternativa a renunciar a su resolución. Incluso cuando el problema es más fácil y se puede resolver completamente, muchas veces la simulación es más fácil y barata.
En la mayoría de los casos, los números pseudoaleatorios generados por ordenador son suficientemente buenos. Pero, aunque son aleatorios para la mayoría de fines prácticos, en realidad son generados por una fórmula determinista que impone demasiado orden en ellos, cosa que hace que no nos sirvan para otras. Una de esas aplicaciones es la teoría de la codificación, que permite a los funcionarios del gobierno, los banqueros y otros, pasar información secreta delicada sin temor a que vaya a ser descifrada. En estos casos se mezclan números pseudoaleatorios procedentes de varios ordenadores, y luego se le añade la indeterminación física de la fluctuación aleatoria del voltaje suministrado por una fuente de «ruido blanco».
Poco a poco va emergiendo la extraña idea de que la aleatoriedad tiene valor económico.
La significación estadística y la significación práctica son dos cosas distintas. Un resultado es estadísticamente significativo si la probabilidad de que se haya producido por casualidad es suficientemente baja. Esto solo no significa gran cosa. Hace varios años se realizó un estudio en el que un grupo de voluntarios recibía un placebo y a otro grupo se le suministraba grandes dosis de vitamina C. La incidencia de los resfriados en los individuos del segundo grupo era ligeramente inferior que en los del grupo de control. El tamaño de la muestra era lo bastante grande para que fuera del todo improbable que el efecto resultara fruto de la casualidad, pero la diferencia no era impresionante ni significativa en el sentido práctico.
Un buen número de medicamentos tienen la propiedad de que son demostrablemente mejores que nada, pero no mucho. La medicina X, que prueba tras prueba alivia inmediatamente el 3% de los dolores de cabeza, es ciertamente mejor que nada, pero ¿cuánto pagaría usted por ella? Puede dar por seguro que la anunciarían como fuente de alivio de un porcentaje «significativo» de casos, pero aquí significativo sólo quiere decir en el sentido estadístico.
Normalmente nos encontramos con la situación contraria: el resultado tiene una gran importancia práctica potencial pero casi ninguna significación estadística. Si algún famoso avala una marca de comida para perros, o algún taxista desaprueba el modo en que el alcalde ha manejado un dilema, es evidente que no hay razón alguna para asignar significado estadístico a estas expresiones personales. Lo mismo vale para los cuestionarios de las revistas femeninas: ¿cómo saber si él está enamorado de otra? ¿Padece su hombre de complejo de Boecio? ¿Cuál de estos siete tipos de amante es su hombre? La puntuación de estos cuestionarios casi nunca lleva ninguna validación estadística: ¿por qué una puntuación de 62 indica que un hombre es infiel? Quizá simplemente está acabando de superar su complejo de Boecio. ¿De dónde han sacado esta tipología de siete clases de amantes? Aunque las revistas masculinas presentan a veces idioteces peores, relacionadas con la violencia y los asesinos a sueldo, raramente llevan cuestionarios necios de esta clase.
Los humanos tenemos una marcada tendencia a quererlo todo y a negar que normalmente los compromisos sean necesarios. Debido a su posición, los políticos a menudo están más tentados que la mayoría a condescender con este pensamiento mágico. Los compromisos entre calidad y precio, entre rapidez y perfección, entre dar por bueno un fármaco posiblemente malo y vetar uno que posiblemente sea bueno, entre libertad e igualdad, etc., frecuentemente se difuminan y se ocultan tras una cortina de humo. Esta disminución de la claridad acaba por costarnos más cara a todos.
Por ejemplo, cuando los grupos de seguridad se opusieron a las recientes decisiones de algunos estados norteamericanos de aumentar a 65 millas por hora el límite de velocidad en algunas autopistas y no imponer castigos más duros a quienes condujeran en estado de embriaguez, se les contestó con la afirmación manifiestamente falsa de que no aumentaría la tasa de accidentes, en vez de reconocer abiertamente los factores económicos y políticos, que pesaban más que las probables muertes de más que se fueran a producir. Se podría citar una larga lista de otros incidentes, en su mayoría tienen que ver con el medio ambiente y los residuos tóxicos (dinero frente a vidas).