Manuel Pérez Carrasco, Ingeniero Civil Industrial y estudiante del Magíster en Ciencias de la Computación ha vivido un año intenso, lleno de desafíos, y que culminó exitosamente con el Premio al Mejor Trabajo de Estudiantes presentado en la Conferencia Astroinformatics 2019, en Caltech, Pasadena, USA.
Este reconocimiento internacional fue el resultado de una investigación que Manuel inició con su memoria de título y que fue evolucionando y cambiando mientras efectuó una pasantía en el Instituto de Computación Aplicada de la Universidad de Harvard, que lidera el destacado académico Pavlos Protopapas de Harvard University.
El profesor Protopapas trabaja hace varios años con el académico Guillermo Cabrera, profesor guía de Manuel Pérez en su tesis de magíster. En enero 2017, dictó una Escuela de Verano en la Facultad de Ingeniería, espacio donde Manuel tuvo la ocasión de presentarle algunas ideas y donde comenzó a gestarse una nueva línea investigativa.
“Después de la Escuela quedamos en que seguir trabajando juntos, porque a los dos nos gustaba el mismo tópico, que era transfer learning. De hecho, en mi memoria de título Pavlos Protopapas no estaba incluido originalmente, y cuando le contamos lo que estábamos haciendo, se interesó y se involucró”, contó Manuel, quien actualmente trabaja en la Unidad de Data Science de la FI UdeC.
¿De qué trató tu memoria?
“Mi memoria consistía en hacer un catálogo de morfología de galaxias utilizando inteligencia artificial por medio de redes neuronales a través de transfer learning”, a lo que Guillermo Cabrera agrega que la idea de la memoria de título era que él comenzara a familiarizarse en estas herramientas de inteligencia artificial, usando este catálogo de morfología de galaxia. “Pero, lo que siempre pensamos que queríamos tratar de abordar era un problema un poco más complicado, que era lo que iba a desarrollar en su tesis de magíster, que es adaptación de dominio”.
Dicha memoria culminó con el envío de un paper que fue rápidamente aceptado. Pese a que con el envío de este paper Manuel cumplía requisitos para haberse graduado del magíster, decidió iniciar una segunda investigación. “Me quedaban 7 u 8 meses de beca de articulación por lo que decidí utilizar este tiemp para desarrollar una otra investigación y seguir haciendo lo que me gusta”.
¿Y cómo se explica su investigación? “Supongamos que queremos hacer que un computador sea capaz de discriminar entre perros y gatos a través de imágenes. Si contamos con la suficiente cantidad de imágenes y etiquetas (del orden de miles), podemos realizar fácilmente esta tarea utilizando redes neuronales. Si este modelo neuronal fue entrenado utilizando imágenes de perros y gatos en parques, y ahora queremos reconocer perros y gatos con un fondo blanco, este modelo probablemente no va a ser bueno realizando esta tarea dado los cambios en la imagen. Lo mismo pasaría con imágenes de tumores o galaxias si se cambian las características del tomógrafo o telescopio. La idea de la investigación era crear un modelo que fuera capaz de corregir los cambios en los dominios, de manera de que con la menor cantidad de etiquetas de perros y gatos de fondo blanco posibles fuesemos capaces de discriminar con alta precisión explotando el conocimiento almacenado en las miles de etiquetas de perros y gatos de parque”, contó Manuel, y frente a esa dificultad de llevar la teoría a la práctica es que nace la segunda idea de investigación y por lo que fue premiado en el Congreso.
Entre tanto, Manuel estuvo tres semanas en Harvard, gracias a un convenio que se llama Harvard Chile. La idea era trabajar en la tesis, pero como ya la tenía lista, decidió proponer algo distinto, un nuevo método para poder generar la adaptación de dominio de manera de utilizar la menor cantidad de etiquetas posibles, “tema que le gustó mucho al profesor Pavlos y donde me invitó a desarrollarla en una pasantía de 6 meses en su laboratorio”.
Fue así como en enero de este año, Manuel emprendió viaje a Boston, USA, específicamente, al Instituto de Computación Aplicada de la Universidad de Harvard.
Al inicio fue complicado, pero rápidamente se aclimató y sus temores, frente al idioma por ejemplo, se fueron enfrentando con práctica y voluntad. Pero quizás lo más complejo fue que la idea con la que llegó, que era buena, la tuvo que destruir. “Nos dimos cuenta que era muy compleja de realizar, empecé a leer más y me di cuenta que en el tiempo que tenía no iba a alcanzar… Me voy a dar una semana para pensar, iba a la oficina, leía papers hasta que se me vino un chispazo”, contó el Ingeniero Civil Industrial, quien además hizo ayudantía en el curso Data science 2: Advanced topics in data science, curso obligatorio del master en data science de Harvard.
¿Cuál era la idea?
“Utilizar algunas ideas de aprendizaje adversario para cumplir con la tarea. Primero mapeamos los datos de perros y gatos en parque a un espacio dimensional reducido, que capture las características más importantes de estas imágenes, llamado espacio latente. Luego se utilizaron dos modelos neuronales que compiten entre sí. El primero intenta imitar el espacio latente de perros y gatos con fondo de parque a través de las imágenes de fondo blanco, como si fueran lo más reales posibles. Mientras, el segundo modelo intenta discriminar si el dato proviene del espacio latente de parques o fue generado por el primer modelo a través de imágenes con fondo blanco. Finalmente, podemos llevar imágenes de ambos dominios a un espacio latente en común, en donde podemos realizar la tarea discriminatoria”
El trabajo fue tan exitoso, que se envió un paper este año y ganó en la Conferencia de Astroinformatics. Además, lo pudo aplicar en un caso real, que era un caso de galaxias, donde por medio de fotos, una etiqueta por galaxia, con una sola imagen se identifique a que galaxia corresponde. Sin embargo, esta investigación además tiene el plus que no solo sirve en el estudio de galaxias. “De hecho ya me despegue un poco de la astroinformática, porque la idea de esta tesis era hace un modelo general y aplicarlo a cualquier tarea y de hecho, a una tarea particular que corresponde a imágenes de dígitos, donde generalmente gente del área se testean este tipo de métodos, alcanzó el mejor resultado del estado del arte, que es reconocer básicamente números manuscritos”, contó.
Un buen chispazo
Cuando Manuel se fue a USA, contó Guillermo Cabrera, nosotros con Pavlos teníamos una idea de lo queríamos que hiciera, entonces cuando empezó a hacerla entendimos que no era tan fácil, al contrario, era muy difícil y no estaba funcionando.
“Nada funcionaba y teníamos reuniones semanales y durante meses nada le resultaba y derrepente un día nos dijo: se me ocurrió esta idea… y a mí me pareció espectacular. Una idea que se le ocurrió a él, después de que no le funcionó la otra. Y de hecho se le ocurrió algo que no existía, algo que nunca nadie antes había pensado en un área de investigación de frontera, algo que ni a Pavlos Protopapas ni a mí se nos había pasado por la mente. Ese chispazo es súper buen chispazo”, explicó Cabrera.