Aprender con big data. Viktor Mayer-Schonberger
n>
A nuestros maestros y a nuestros alumnos.
–V. M.-S y K. N. C.
Título original
Learning with Big Data. The Future of Education, Houghton Mifflin, 2014
© Viktor Mayer-Schönberger y Kenneth Cukier, 2014
De esta edición
© Turner Publicaciones, S.L., marzo de 2018
Diego de León, 30, 28006 Madrid
De la traducción
© José Adrián Vitier, 2018
Cubierta
Diseño turner
ISBN: 978-84-17141-51-6
e-ISBN: 978-84-17866-42-6
D.L.: M-4757-2018
Impreso en España
Reservados todos los derechos en lengua castellana.
No está permitida la reproducción total o parcial de
esta obra, ni su tratamiento o trasmisión por ningún
medio o método sin la autorización por escrito de
la editorial.
La editorial agradece todos los comentarios y observaciones:
ÍNDICE
i Crepúsculo
ii Cambio
iii Plataformas
iv Consecuencias
v Amanecer
Notas
i
CREPÚSCULO
Dawa se concentra.1 Pone un poco de pigmento en la punta del pincel. Entonces, con trazo cuidadoso, pinta una fina línea negra. Repite esto una vez más. Y otra. Lentamente, según pasan las horas, el thangka empieza a cobrar forma: una imagen de Buda sobre un trozo de seda, con hipnóticos detalles geométricos.
Afuera, las nevadas cumbres del Himalaya que rodean Timbu, la capital del reino de Bután, resplandecen bajo el penúltimo sol de la tarde. Pero adentro, Dawa y sus compañeros de clase, todos de poco más de veinte años, con túnicas azules, han estado inmersos en la tarea, bajo la mirada vigilante de su instructor.
La formación de pintores de thangka es estricta y tradicional. No es su objetivo expandir las mentes de Dawa y sus condiscípulos con esa enseñanza, sino disciplinarlos como aprendices. Este aprendizaje no comporta investigación, sino imitación. Innumerables reglas establecidas desde hace siglos gobiernan exactamente qué se ha de pintar y cómo.
El maestro de Dawa se asegura de que los jóvenes artistas sigan sus instrucciones al pie de la letra, para repetir lo que han hecho antes que ellos generaciones de ilustradores de thangka. Cualquier desviación, cualquier incumplimiento de las reglas, no solo está mal visto, sino prohibido. El mejor pintor es aquel que copia a la perfección a su maestro. El profesor no cesa de señalar imperfecciones. Pero pese a su inmediata retroalimentación, esta es una forma de aprendizaje casi completamente desprovista de datos.
Y es una forma de enseñanza fundamentalmente distinta de las clases que Andrew Ng, científico informático de la universidad de Stanford, imparte por internet sobre el tema del aprendizaje automático o machine learning, una rama de la informática. El profesor Ng (se pronuncia aproximadamente “Nnn”) es cofundador de Coursera, una compañía pionera que ofrece clases por internet. Su enfoque proclama que los big data revolucionarán la educación.
El profesor Ng reúne información sobre todo lo que hacen sus alumnos.2 Esto le permite descubrir qué es lo que funciona mejor y diseñar sistemas que lo incorporen automáticamente a su clase: mejorando su práctica docente, la comprensión y los resultados de sus alumnos, y ajustando la enseñanza a las necesidades individuales de cada uno.
Por ejemplo, Ng revisa las interacciones de los alumnos con sus clases en vídeo: si lo detienen o lo adelantan, o si salen del vídeo antes de que este termine; el equivalente digital a salir a hurtadillas del aula antes de que suene el timbre. El profesor Ng puede comprobar si ven varias veces la misma lección, o si vuelven sobre el contenido de un vídeo anterior. También intercala exámenes sorpresa en sus videoclases. No para ver si sus educandos están prestando atención; esas formas arcaicas de disciplina docente no le interesan. Él quiere saber, más bien, si están comprendiendo el contenido; y si se están quedando atrás, exactamente dónde, atendiendo cada caso de manera individual.
Al revisar los deberes y exámenes hechos en ordenador o tableta, Ng puede identificar áreas específicas en las que un alumno necesita ayuda adicional. Puede analizar los datos de toda la clase para ver cómo va el aprendizaje en líneas generales y ajustar sus lecciones en consonancia. Puede incluso comparar esa información con la de otras clases de otros años y determinar qué es lo más efectivo.
Es ciertamente una ayuda el que las clases del profesor Ng contengan decenas de miles de alumnos: son lo bastante grandes para que sus hallazgos resulten estadísticamente sólidos, no basados tan solo en un puñado de observaciones, como es el caso de la mayoría de los estudios educacionales. Pero el tamaño de las clases no es en sí mismo la cuestión. Son los datos.
Ng ha logrado utilizar ya estos datos con extraordinarios resultados. Por ejemplo, al revisar la secuencia de videoclases que ven los alumnos, emergió una curiosa anomalía. Un alto porcentaje de ellos avanzaba en el orden previsto, pero al cabo de unas pocas semanas de clases, cerca de la lección siete, regresaban a la lección tres. ¿Por qué?
Ng investigó un poco más y vio que la lección siete pedía a los alumnos que escribieran una fórmula en álgebra lineal. La lección tres era un repaso de matemáticas. Evidentemente, muchos alumnos no se sentían seguros de sus habilidades matemáticas. De modo que el profesor Ng supo que debía modificar su clase y reforzar las matemáticas justo en aquellos puntos en que los alumnos tendían a desalentarse; los datos lo alertaron sobre cuáles eran esos puntos.
En otra ocasión, vio que muchos alumnos repetían las lecciones sobre cierto tema. Pudo verlo literalmente, pues creó una visualización de estos datos en la que el color variaba del azul oscuro al rojo intenso cuando la probabilidad estadística de que un usuario progresara al ritmo normal de la clase se descentraba. Entre la lección 75 y la 80 se producía una alteración en el patrón. Su conclusión: les estaba costando trabajo captar los conceptos. Comprendió que, con aquella información, los maestros podrían rehacer las lecciones… y revisar los datos resultantes para asegurarse de que la situación mejorase.
Hay muchos otros datos que se aprovechan de la misma forma. Las publicaciones de los foros online suelen controlar cuántas personas las leen, y se invita a la gente a evaluarlas, a juzgar su utilidad. Pero el profesor Ng llevó a cabo un estudio estadístico complejo de las publicaciones en los foros de su clase para evaluar su verdadera efectividad. Investigó el porcentaje de alumnos que, después de responder incorrectamente sobre un tema específico en un trabajo individual o un examen, habiendo leído una publicación dada en un foro, aportaron una respuesta correcta al toparse otra vez con la misma pregunta.
De este modo, en una clase de aprendizaje automático en 2011, miles de alumnos dieron una respuesta incorrecta respecto a un “coste de cómputo” en una regresión lineal. Pero aquellos que leyeron la publicación número 830 del foro correspondiente tuvieron una probabilidad del 64% de responder correctamente al volverse a encontrar con la pregunta.
De ahora en adelante,