Los números de la vida. Kit Yates
el artículo publicado en el New York Times sobre la experiencia de un desarrollador web de treinta y tres años de edad llamado Matt Fender no hizo nada para calmar mis inquietudes. Como obsesivo declarado y miembro de la creciente oleada de personas sanas que se preocupan excesivamente por su salud, Fender era el cliente ideal para 23andMe. Tras recibir los datos de su perfil y consultarlos con una fuente externa, descubrió que había dado positivo en la mutación PSEN1, un indicador de la enfermedad de Alzheimer de inicio temprano con «penetrancia completa», lo que significa que todos los que tienen la mutación contraen la enfermedad, sin condicionales ni excepciones. Como cabía esperar, Fender se alarmó ante la idea de perder su capacidad de pensar en términos abstractos, resolver problemas y rememorar recuerdos coherentes. El diagnóstico reducía sus expectativas de llevar una vida plena en al menos 30 años.
Incapaz de quitarse de la cabeza las implicaciones de la mutación, Fender quiso asegurarse. Dado que carecía de antecedentes familiares de Alzheimer, tenía difícil convencer a un genetista para que solicitara una prueba de seguimiento confirmatoria. En su lugar, optó por hacerse una segunda prueba genética por su cuenta. Envió un nuevo kit de saliva, esta vez a otra empresa llamada Ancestry.com, y esperó los resultados. Llegaron cinco semanas después: negativo para PSEN1. Ligeramente aliviado, pero aún más desconcertado que antes, finalmente Fender logró convencer a un médico para que le hiciera una evaluación clínica, que acabó confirmando el resultado negativo de Ancestry.com.
La tecnología de secuenciación empleada por 23andMe y Ancestry.com, con una tasa de error de solo un 0,1 %, parece increíblemente fiable. Sin embargo, vale la pena recordar que, cuando se verifican casi un millón de variantes genéticas, incluso ese reducido porcentaje implica que cabría esperar unos 1000 errores. Resulta preocupante, aunque quizá no sorprendente, que pueda haber discrepancia en los resultados de dos empresas independientes; pero probablemente aún lo sea más la evidente falta de apoyo tras haberlos recibido: los pacientes que solicitan perfiles genéticos a domicilio tienen que lidiar con sus resultados en un aislamiento casi completo desde un punto de vista médico.
Después de que 23andMe obtuviera gradualmente la aprobación de la FDA para una gama significativamente reducida de pruebas genéticas, en 2017 se relanzó la empresa en Estados Unidos, y su kit de prueba de ADN a domicilio se convirtió en uno de los artículos más vendidos en Amazon el Black Friday de ese año. A pesar de tener mis propias dudas al respecto —o tal vez precisamente por ello—, pedí un kit y envié mi muestra de saliva para que la analizaran.
En casi todas las células del cuerpo humano hay un núcleo que contiene una copia de nuestro ADN, el denominado «Libro de la vida». Heredamos esas largas y retorcidas escaleras de nucleótidos en 23 pares de cromosomas, donde uno de cada par proviene de cada uno de nuestros padres. Cada cromosoma de los dos que forman un par contiene una copia de los mismos genes que su pareja, cuyas secuencias son similares, pero no necesariamente iguales. Así, por ejemplo, hay dos variantes principales del gen ApoE asociado a la enfermedad de Alzheimer que evalúa 23andMe, denominadas ε3 y ε4. La variante ε4 está asociada a un mayor riesgo de contraer Alzheimer de inicio tardío. Dado que hay dos cromosomas, una persona puede tener una copia de ε4 (y una de ε3); dos de ε4 (y ninguna de ε3), o ninguna de ε4 (y dos de ε3): la cantidad de copias es lo que se conoce como genotipo. El genotipo más común son dos copias de ε3, que constituye la base de referencia con respecto a la que se evalúa la probabilidad de contraer Alzheimer. Cuantas más copias tenga una persona de la variante ε4, mayor será el riesgo asociado de desarrollar la enfermedad.
Pero ¿de qué hablamos exactamente cuando hablamos de un riesgo elevado? Dado que 23andMe había descubierto que yo tenía un determinado genotipo, ¿cuál era mi «riesgo previsto», esto es, la probabilidad de desarrollar la enfermedad? Si quería estar seguro de los riesgos que habían predicho para mí, necesitaba asegurarme de que su análisis matemático tenía una base sólida antes de llegar a ninguna conclusión.
La mejor forma de comprobar el riesgo previsto de contraer Alzheimer sería seleccionar a una gran cantidad de individuos representativos del conjunto de la población, determinar su genotipo y luego hacer un seguimiento regular para comprobar quién desarrolla Alzheimer. Con esos datos representativos sería fácil establecer una comparación entre el riesgo de contraer Alzheimer cuando se tiene un determinado genotipo y el riesgo de la población en general, lo que se denomina «riesgo relativo». No obstante, generalmente este tipo de estudios longitudinales tienen un coste prohibitivo debido a la gran cantidad de individuos que se requiere (especialmente en el caso de las enfermedades raras) y el prolongado período de tiempo durante el que se les debe observar.
Una opción más habitual —aunque con resultados menos potentes— es realizar lo que se conoce como un estudio de casos y controles (o estudio caso-control), que en el ejemplo que nos ocupa consistiría en seleccionar a varias personas que ya padecen Alzheimer junto con una serie de individuos «de control», es decir, personas con antecedentes similares, pero sin la enfermedad (en el capítulo 3 veremos por qué es tan importante realizar un minucioso control del historial de la gente). A diferencia del estudio longitudinal, en el que los participantes se seleccionan independientemente de su estado de salud en lo relativo a esa enfermedad concreta, en un estudio de casos y controles la selección está sesgada en favor de los portadores de la enfermedad, por lo que no es posible extrapolar una estimación de la incidencia de esta en el conjunto de la población; dicho de otro modo: lo que obtenemos es una predicción sesgada del riesgo relativo de contraer la enfermedad. No obstante, estos estudios nos permiten calcular con precisión las denominadas «razones de probabilidades», un parámetro que no requiere conocer la incidencia total de la enfermedad en la población.
Si alguna vez has estado en un canódromo o has apostado en una carrera de caballos, puede que recuerdes que la posibilidad de que un determinado animal gane una carrera suele expresarse en términos de probabilidades (habitualmente se habla de «apuestas»). Por ejemplo, en una carrera se podría decir que un caballo que no figura entre los favoritos tiene unas probabilidades de 5 a 1 en contra (o que las apuestas para ese caballo están en, o son de, 5 a 1 en contra). Eso significa que, si se corriera la misma carrera un total de seis veces, cabría esperar que ese caballo perdiera en cinco ocasiones y ganara solo en una, de modo que sus posibilidades de ganar son de 1 entre 6, o 1/6. La forma habitual de expresar las «probabilidades en contra» es hacerlo como la razón entre la posibilidad de que un evento no suceda y la posibilidad de que suceda (en este caso, 5/6 a 1/6, o, de forma simplificada, 5 a 1). En cambio, para el favorito de la carrera, las probabilidades podrían ser de 2 a 1 a favor. En el ámbito de las apuestas deportivas lo tradicional es poner siempre delante la cifra mayor, lo que nos obliga a distinguir entre probabilidades a favor o en contra. El concepto de «probabilidades a favor» (el inverso de las probabilidades en contra) expresa la razón entre la posibilidad de que un evento suceda y la posibilidad de que no suceda. Con unas probabilidades de 2 a 1 a favor, si la misma carrera se corriera un total de tres veces, cabría esperar que el favorito ganara dos de ellas y perdiera una. Las posibilidades de que el favorito gane son, pues, de 2 entre 3, o 2/3, mientras que las de que pierda son de 1/3, lo cual se expresa diciendo que las probabilidades son de 2/3 a 1/3 o, de forma simplificada, de 2 a 1.
En las competiciones en las que participa un reducido número de caballos, cualquiera que tenga las probabilidades a favor es también el favorito, puesto que en cualquier carrera dada solo puede haber un caballo que tenga más posibilidades de ganar que de perder. Sin embargo, en una competición con un mayor número de caballos es inusual que un solo caballo gane más carreras de las que pierde. Por ejemplo, en la competición ecuestre más famosa del Reino Unido, el Grand National, participan un total de 40 caballos; en la edición de 2019, incluso el ganador del año anterior, Tiger Roll, que partía como favorito (y que finalmente acabó ganando), tenía unas probabilidades de 4 a 1 en contra. Así pues, dado que no es probable que la mayoría de los caballos ganen la mayoría de sus carreras, a menos que se señale explícitamente lo contrario, cuando en el hipódromo se habla de probabilidades y se indica la cifra mayor delante, generalmente se hace referencia a las probabilidades en contra.
En el ámbito médico ocurre justamente lo contrario. Las probabilidades generalmente se expresan como probabilidades a favor: la posibilidad de que suceda un evento frente