Por Miriam Valenzuela N.
En el séptimo piso de Beauchef 851, un grupo interdisciplinario de investigadores e investigadoras forman el PESB2 (Protein Engineering, Structural Bioinformatics and Synthetic Biology Group), un laboratorio liderado por el académico Álvaro Olivera Nappa, del Departamento de Ingeniería Química, Biotecnología y Materiales (DIQBM), investigador principal del Centro de Biotecnología y Bioingeniería (CeBiB). Su investigación principal se centra en la ingeniería de proteínas, aplicando diferentes técnicas y metodologías para el estudio del proceso de mutaciones, diseño de péptidos sintéticos y evaluación familiar de proteínas. Y en ese sentido, la aplicación del aprendizaje de máquinas y el modelado matemático están contribuyendo en grandes aportes.
Las proteínas son macromoléculas orgánicas constituidas estructuralmente por aminoácidos, es decir, largas secuencias de combinaciones de ellos. Una técnica que permite su representación computacional y el desarrollo de modelos para predecir sus propiedades es la codificación de la secuencia (encoding). “Combinando distintas codificaciones para una misma proteína, distintos algoritmos de inteligencia artificial aplicados simultáneamente y ensamblados para entregar una respuesta única, con heurísticas para optimizar la simulación de variantes factibles, los investigadores e investigadoras del PESB2 proponemos un nuevo enfoque para el diseño de proteínas”, explica el académico.
Con estos métodos han conseguido mejorar la estabilidad de proteínas, encontrar puntos clave en la secuencia susceptibles de ser mutados, y diseñar péptidos con aplicaciones médicas, ayudando a comprender cómo mutaciones puntuales en proteínas pueden tener consecuencias clínicas y usos industriales sustentables.
“Entre otras aplicaciones, esto ha permitido identificar mutaciones clave para determinar la eficiencia de conversión catalítica en reacciones químicas verdes, diseñar péptidos anti-HIV, comprender cómo mutaciones puntuales se correlacionan con efectos clínicos en pacientes con enfermedad de Von Hippel-Lindau y cáncer renal y crear estrategias de diseño de anticuerpos”, comenta David Medina, investigador del CeBiB y estudiante del doctorado en en Ciencias de la Ingeniería mención Ingeniería Química y Biotecnología del DIQBM.
Actualmente, en conjunto a los temas de investigación basales, el PESB2 ha adaptado sus herramientas y capacidades para contribuir al estudio de la pandemia de COVID-19 en Chile. Es así como, combinando modelos matemáticos con técnicas de data science, el equipo ha desarrollado metodologías para la corrección automática de retrasos en la data reportada y el cálculo (y pronóstico) en tiempo real de la evolución del número reproductivo del virus.
Dichos proyectos se han fortalecido con la estrecha colaboración que el laboratorio mantiene con investigadores del Instituto Max Planck en Alemania, con quienes se trabaja en generar modelos predictivos para analizar las variantes del SARS-CoV-2. El trabajo conjunto ha permitido utilizar diversas técnicas matemáticas y de inteligencia artificial para analizar con mayor profundidad la propagación de la pandemia usando datos provenientes de Chile y de Europa. Estas herramientas permiten realizar mejores predicciones de los efectos de las medidas de control y vacunación, para lograr un regreso seguro a condiciones más normales en cada país, de acuerdo con sus condiciones locales.
“En el dinámico panorama de la investigación en COVID-19, donde abunda la información -y desinformación-, no basta con simplemente usar los datos, debemos entenderlos”, enfatiza Sebastián Contreras, miembro del PESB2 y estudiante del doctorado en Física del Instituto Max Planck.
Aplicaciones con impacto
Con el objetivo de innovar y masificar el uso de herramientas de machine learning para análisis de datos, el equipo del PESB2 desarrolló DMAKit, una herramienta que facilita el uso de métodos de data science, ya que permite acceder a análisis análisis de datos de manera más cercana a personas que no tienen el conocimiento suficiente sobre el tema. Asimismo, generaron sistemas como Peptipedia, que se ha convertido en la base de datos de péptidos con actividad biológica reportada más grande a la fecha, e Immune Molecule DB, una herramienta computacional que facilita el estudio de moléculas inmunológicas a partir de diferentes librerías, que ayudan a la comprensión de la interacción de sistemas antígeno- anticuerpo, herramientas de gran interés y utilidad para la comunidad científica.
El profesor Olivera destaca el trabajo permanente que realiza el equipo del PESB2 y su compromiso con la ciencia colaborativa, por lo que “todas las herramientas desarrolladas (como DMAKit y Peptipedia) están disponibles abiertamente y en forma accesible para cualquier usuario entusiasta que quiera analizar sus datos usando machine learning, sin requerir conocimientos específicos” Subraya además la enriquecedora labor que realiza el equipo de investigadores, investigadoras, estudiantes tesistas, colaboradores y colaboradoras internacionales, quienes permanentemente están desarrollando proyectos, herramientas y publicaciones.
Link: www.pesb2.cl
DATO: El equipo del PESB2 está conformado por Sebastián Contreras, David Medina, Karen Oróstica, Juan Pablo Biron, Juan Amado, Catalina Landeta, Danton Freire y Álvaro Olivera.