Los números de la vida. Kit Yates
resultaría distorsionado por Blancanieves, cuya estatura relativa la convierte en un valor atípico en el conjunto de datos. Un tipo de valor medio más representativo sería la mediana. Para hallar la estatura mediana del grupo, alineamos a Blancanieves y los enanos por orden de estatura (con Blancanieves delante de todo y Mudito ocupando el último lugar) y medimos la estatura de la persona que ocupa la parte central: como hay ocho en la fila, que es un número par, no tendremos a una sola persona en la parte central, de modo que calcularemos la estatura media de las dos que ocupan dicho lugar (Gruñón y Dormilón), y esa será la mediana. Al utilizar la mediana, hemos eliminado la altura discordante de Blancanieves, que distorsionaba la media. Por la misma razón, a menudo se utiliza la mediana cuando se presentan datos sobre valores medios de renta. Como puede verse en la Figura 4, los altos salarios de las personas más ricas de nuestras sociedades tienden a distorsionar la media (una idea que volveremos a encontrar en el próximo capítulo, en el contexto de las engañosas matemáticas de los tribunales); la mediana nos proporciona aquí una idea más precisa que la media en relación con cuál cabe esperar que sea la renta disponible de un hogar «típico». Obviamente, se podría argumentar que en este tipo de estadísticas no habría que descuidar la estatura de Blancanieves o la renta de las personas que más ganan, ya que son tan válidas como cualesquiera otros datos del conjunto. Aunque, en efecto, puede que sea así, lo cierto es que ni la media ni la mediana son correctas en un sentido objetivo: simplemente ofrecen distintos tipos de valores medios que resultan útiles para diferentes aplicaciones.
Figura 4. Frecuencia de las familias del Reino Unido con una determinada renta disponible (después de impuestos, y en bloques de 1000 libras) en 2017. Podría considerarse que la mediana (27310 libras) representa mejor la renta disponible de la familia «típica» que la media (32676 libras).
Cuando filtramos una imagen digital granulada, nuestro propósito es eliminar los efectos de los píxeles espurios. Al promediar los valores de los píxeles vecinos, el filtrado basado en la media modula esos valores extremos, pero no los elimina por completo. Por el contrario, el filtrado basado en la mediana ignora impunemente los valores de los píxeles extremadamente ruidosos.
Por esa misma razón, en los monitores de las UCI hospitalarias se está empezando a usar el filtrado basado en la mediana para evitar falsas alarmas.8 Tomando la mediana de una serie de lecturas secuenciales, las alarmas solo se activan si se cruzan los umbrales durante un período de tiempo sostenido (aunque todavía breve), en lugar de hacerlo en el momento en que se produce un pico o un valle puntual en la lectura del monitor. El filtrado basado en la mediana puede reducir la aparición de falsas alarmas en los monitores de las UCI hasta en un 60 % sin poner en peligro la seguridad de los pacientes.9
Las falsas alarmas son una subcategoría del tipo de errores conocidos como «falsos positivos». Un falso positivo, como su propio nombre indica, es un resultado de una prueba que señala que una determinada condición o atributo está presente cuando en realidad no lo está. Normalmente los falsos positivos se producen en pruebas binarias, es decir, en aquellas que admiten dos resultados posibles: positivo o negativo. En el contexto de las pruebas médicas, los falsos positivos implican que a personas que no están enfermas se les diga que sí lo están, mientras que en los tribunales suponen que se condene a personas inocentes por delitos que no han cometido (en el próximo capítulo conoceremos a muchas de estas víctimas).
Una prueba binaria puede ser errónea de dos maneras distintas. En la Tabla 2 pueden verse los cuatro resultados posibles de una prueba binaria: dos de ellos son correctos, y los otros dos incorrectos; además de falsos positivos, también hay falsos negativos.
En el contexto del diagnóstico médico, cabe suponer que los falsos negativos son potencialmente los más dañinos, ya que le dicen a un paciente que no tiene la enfermedad para la que se le realiza la prueba, cuando en realidad la tiene. Más adelante en este mismo capítulo conoceremos a algunas de las confiadas víctimas de falsos negativos. Pero los falsos positivos también pueden tener implicaciones tan serias como sorprendentes, aunque por razones completamente distintas.
Tabla 2. Los cuatro resultados posibles de una prueba binaria.
La gran criba
Tomemos el caso, por ejemplo, de la denominada «detección sistemática» de enfermedades o «cribado». El cribado es una prueba masiva en relación con una determinada enfermedad, que se realiza entre personas que pertenecen a un grupo con alto riesgo de padecerla, pero que no presentan síntomas de esta. Por ejemplo, en el Reino Unido se invita a todas las mujeres mayores de cincuenta años a someterse a exámenes rutinarios de mama, dado que el riesgo de desarrollar cáncer de mama aumenta a partir de esa edad. Actualmente la aparición de falsos positivos en los programas de cribado es objeto de un intenso debate.
Se calcula que en el Reino Unido la prevalencia del cáncer de mama no diagnosticado entre las mujeres es de alrededor de un 0,2 %. Eso significa que, en cualquier momento del tiempo, por cada 10 000 mujeres a las no que se ha diagnosticado cáncer de mama, cabría esperar que 20 de ellas tuvieran realmente la enfermedad. No parece un porcentaje muy elevado, pero eso se debe a que en la mayoría de los casos el cáncer de mama se detecta muy pronto. De hecho, se calcula que una de cada ocho mujeres recibirá un diagnóstico de cáncer de mama a lo largo de su vida. En el Reino Unido, alrededor de una de cada diez mujeres recibe el diagnóstico en una fase tardía de la enfermedad (en los estadios III o IV). El diagnóstico tardío reduce significativamente las posibilidades de supervivencia a largo plazo, lo que respalda el argumento de que las mamografías regulares resultan de vital importancia, especialmente para las mujeres que pertenecen a grupos de edad vulnerables. Sin embargo, existe un problema matemático en relación con el cribado del cáncer de mama del que la mayoría de las personas no son conscientes.
Kaz Daniels es madre de tres hijos y vive en Northampton. En 2010 se hizo su primera mamografía de rutina a los cincuenta años de edad. Al cabo de una semana recibió una carta en la que se le pedía que volviera en el plazo de dos días para hacerse más pruebas. Comprensiblemente, dada la urgencia de la convocatoria, se quedó aterrada. Durante los dos días siguientes estuvo demasiado preocupada para comer y demasiado angustiada para dormir, dándole vueltas a la cabeza sobre las posibles consecuencias de un diagnóstico positivo.
La mayoría de las pacientes que se someten a mamografías las perciben como una forma bastante precisa de detectar el cáncer de mama. De hecho, en las personas que realmente padecen la enfermedad, la prueba la detecta aproximadamente nueve de cada diez veces, mientras que en el caso de las que no la padecen los resultados de la prueba también aciertan en nueve de cada diez ocasiones.10 Conocedora de estas estadísticas, y tras haber recibido un resultado positivo de su mamografía, Kaz consideró que lo más probable era que tuviera la enfermedad. Sin embargo, un sencillo argumento matemático demuestra que en realidad ocurre todo lo contrario.
La prevalencia del cáncer de mama no diagnosticado en mujeres mayores de cincuenta años —el grupo de edad al que se invita a hacerse exámenes de detección de manera rutinaria— es ligeramente más alta que en el conjunto de la población femenina en general, y se puede estimar en aproximadamente el 0,4 %. En la Figura 5 se desglosan los datos relativos a 10 000 de estas mujeres. Podemos ver que, por término medio, solo 40 de ellas tendrán cáncer de mama, por lo que habrá 9960 que no padecerán esta afección. Sin embargo, del conjunto de las mujeres que están libres de la enfermedad, una de cada diez —o 996— recibirá un diagnóstico positivo incorrecto. Si lo comparamos con las 36 mujeres a las que se diagnostica acertadamente la enfermedad, eso significa que los resultados positivos de la prueba solo son correctos en 36 de cada 1032 casos (36 + 996), o, lo que es lo mismo, el 3,48% de las veces. La proporción de resultados positivos de una prueba que son auténticos positivos se conoce como la «precisión» de dicha prueba. De entre las 1032 mujeres que reciban un resultado positivo, solo 36 tendrán realmente cáncer de mama. En otras