Noticias

Beauchef Magazine 2021

Matemáticas en ciencia de datos e inteligencia artificial

Matemáticas en ciencia de datos e inteligencia artificial

Al igual que muchos objetos y procesos tecnológicos, una red neuronal puede ser también un objeto de estudio y modelamiento matemático. También pueden serlo (de hecho, lo son) sus procesos de entrenamiento en línea usando bases de datos gigantes, y las formas posibles de integrar a ellas la física o la biología subyacentes a un problema científico dado.

En realidad, muchos problemas teóricos, prácticos y tecnológicos relacionados con el aprendizaje de máquinas pueden formularse matemáticamente, y beneficiarse de desarrollos matemáticos pasados, presentes y futuros, para encontrar respuestas, proponer soluciones más eficientes y robustas, o al menos, mejorar nuestra comprensión de los problemas. Preguntas tales como: ¿cómo se transforma la información en las capas de una red neuronal profunda? son estudiadas hoy matemáticamente, usando la teoría del control estocástico, EDPs y el transporte óptimo de masa (problema matemático de más de 200 años con aplicaciones en economía, física y biología). Los modelos generativos se benefician de lo aprendido en matemáticas tras décadas de desarrollos en modelamiento estocástico y métodos de simulación de tipo Monte Carlo. Las redes neuronales se entrenan mediante algoritmos estudiados por muchos años en optimización, motivados por problemáticas aplicadas mucho más “tradicionales”. Así, las redes adversariales se inspiran en la resolución de un problema de teoría de juegos, y el aprendizaje reforzado se puede entender con ayuda del principio de programación dinámica.

El algoritmo que sin duda hizo explotar el desarrollo del aprendizaje de máquinas neuronales y la IA en las últimas dos décadas (de la mano, obviamente, con desarrollos sin precedentes en tecnologías de almacenamiento de datos y en capacidades de cómputo) es el gradiente estocástico, inventado hace 70 años por Robbins y Monro, para optimizar problemas donde la función objetivo es la esperanza de una variable aleatoria que depende de un parámetro.

¿Qué pasa cuando se entrena una red neuronal con este método? ¿Por qué las redes profundas así entrenadas “generalizan bien”, es decir, no se sobreajustan a los datos de entrenamiento, y tienen muy buenos resultados (predicciones) con datos nuevos? ¿Tenemos garantías de que siempre sea así? Esas preguntas, complejas y totalmente nuevas, empiezan a tener respuestas desde las matemáticas, gracias a analogías con la minimización de la energía libre de sistemas aleatorios de partículas en interacción de campo medio (como en mecánica estadística). Y aunque parezcan teóricas, tienen implicancias prácticas (¿qué complejidad debe tener una red para lograr un nivel de precisión deseado en la predicción y a qué costo energético?) y éticas (¿un sistema autónomo estará preparado para responder a la diversidad de escenarios que puede encontrar, sin generar riesgos para los humanos alrededor de él?). Recíprocamente, las redes neuronales se están haciendo camino en matemáticas a través de nuevos métodos numéricos para resolver EDPs en alta dimensión y problemas inversos de geofísica e imágenes médicas.

Por supuesto, las matemáticas no pueden abordar ni responder por sí solas todas estas preguntas. Pero, al igual que lo ocurrido en otras aventuras del conocimiento humano, a través de colaboración con otras disciplinas se constituyen en una herramienta poderosísima para modelar y atacar problemas, inventar nuevos puntos de vista, descubrir conexiones, desarrollar nuevas aplicaciones y plantear soluciones o mejoras concretas. En ese proceso, las matemáticas se han ido reinventando continuamente, a la vez que han contribuido al desarrollo de nuevas ciencias y tecnologías.

Hoy tenemos condiciones idóneas en nuestro país y nuestra Facultad para levantar nuevas líneas de trabajo transdisciplinar en las interfases de las matemáticas, la inteligencia artificial y la ciencia de datos, las que potenciarán tanto la investigación científica que desarrollamos en estas áreas, como el impacto que tendrán en el desarrollo del país.

Galería de fotos

Últimas noticias

Académico expone sobre IA en encuentro de la APRU

Sergio Celis, profesor de la Facultad de Ciencias Físicas y Matemáticas de la Universidad de Chile, fue el único chileno presente en este encuentro internacional que reunió a especialistas de las 60 universidades que integran la Asociación de Universidades de la Cuenca del Pacífico (APRU). En la instancia, el académico abordó los desafíos y oportunidades en torno al uso de la inteligencia artificial en la educación superior, tecnología que ya es común entre estudiantes universitarios de todo el mundo.