Para celebrar el día internacional de la astronomía queremos destacar sólo algunos de los muchos usos que se le da al Data Science en esta discipplina.
El Big Data permite explorar el Universo mediante el análisis de los datos generados por los complejos de observación, incluso sirve para atacar problemas de gran complejidad como los relacionados con la energía oscura.
La observación astronómica es la más grande fuente de datos a analizar en el planeta. Hace unos pocos años, la información brindada por el Sloan Digital Sky Survey ya superó la cantidad de un Petabyte (más de mil Terabytes).
El último mencionado es tan sólo un caso en particular, lo que refleja la gran exigencia de trabajo que demanda el análisis de información proveniente de la astronomía.
Astronomía Local y Data Science
El ALMA (Atacama Large Millimeter/submillimeter Array) en Chile es uno de los proyectos astronómicos más grandes del mundo que genera más de 100 terabytes de datos al año. También, presente en Chile está el LSST (Large Synoptic Survey Telescope), que operará a partir de 2022 con la capacidad de observar todo el cielo visible.
El problema de tal cantidad de datos
Toda la información recaudada por los diferentes proyectos debe ser procesada y un temor que afecta a la comunidad científica dedicada a la astronomía es que no baste el análisis para obtener todo el conocimiento que nos brinda dicha cantidad de información. El universo sigue en expansión, y el límite del observado está demasiado lejos por lo que es posible hacer modelos teóricos, en la mayoría de las ocasiones, de lo ya pasado.
Considerando que la cantidad de datos que emitir un proyecto como el LSST, puede igualar a la de todo internet en una sola jornada, se debe desarrollar una estrategia multidisciplinar para estudiarlos.
el Big Data permite, incluso, el descubrimiento de nuevas estrellas y otros objetos espaciales (cuyo rastro se revela como pauta escondida en los datos, por ejemplo, permitiendo una diferenciación entre fenómenos que se consideraban similares).
Dilucidar preguntas den torno a agujeros negros,
Galaxy Zoo
Machine Learning para procesar mejor
Distinguir tipos de galaxias (incluso antes de que nosotros sepamos que existen), dando un mayor campo de visión en el entendimiento del universo del que ya tenemeos es solo una de muchas aplicaciónes que se le puede dar al machine learning analizando inmensas cantidades de fotografías tomadas por telescopios.
El lente gravitacional
Un fenómeno provocado por grandes concentraciones de materia (por ejemplo, un conjunto de galaxias) que puede doblar la luz y distorcionar las imagenes que puedan tomar los telescopios. Otro empleo de machine learninrg es precisamente predecir este fenómeno para interpretar visualmente lo que registra con este fenómeno en las fotografías.
Eliminación de ruido
Así como en la fotografía más cotidiana, en las imágenes tomadas por telescopios también existe el “ruido”. Estos son elementos visuales no considerados para observarse y que pueden interferir con la imagen que se desea analizar. La eliminación del ruido producido por elementos como la atmosfera (la de la misma tierra en la que se sitúa un telescopio, o de otros astros), el viento u otros elementos volátiles en el vacío, puede ser filtrada y eliminada de una imagen gracias al Machine Learning con un algoritmo llamado Red Generativa Antagónica o GAN (Generative Adversarial Network).
Evaluación de terreno de cuerpos
Sondas son enviadas a cuerpos celestes para adquirir muestras del suelo de éstos y ser analizadas aquí en la tierra. En distintas fases de esta operación se aplica Machine Learning. Primero, la sonda toma fotos de distintos ángulos y las envía a la tierra. Estas se analizan para elegir un punto idóneo de aterrizaje y decidir cuáles son todos los procedimientos a seguir para tomar muestras del suelo.
Iniciativas de participación pública
La cantidad de datos a analizar, generados por entidades de análisis astronómico son inmensas lo que se ha traducido en una búsqueda capital humano para poder procesarlas y sacar conclusiones. Ante la necesidad de talentos científicos que puedan lidiar con toda esta información han nacido algunas iniciativas que invitan a científicos provenientes de la ciudadanía a colaborar con estas tareas.
Galaxy zoo
En 2007, un astrofísico de la universidad de Oxford debía clasificar cerca de 900 mil imágenes de galaxias del LSST (Large Synoptic Survey Telescope). Para hacer dicha tarea posible, se reclutó públicamente a científicos para repartir la carga de dicha labor. Inicialmente se esperaban entre 30 mil y 50 mil voluntarios pero sorprendentemente se enrolaron más de 150 mil logrando hacer en 2 años el trabajo de análisis de datos que para una sola persona podría haber tomado cerca de 5 años trabajando 24/7 sin parar. Así Nace Galaxy Zoo, una iniciativa Crowdsourced que consiste en la participación activa de voluntarios que llegan por una reclutación abierta
SETI (Search for Extra Terrestrial Intelligence)
SETI es una institución que enfrenta millones de filas de datos emitidos por el ATA (Allen Telescope Array), entre otras, produciondo grandes consultas empleando el el motor de análisis de Big Data Apache Spark por lo que han sido muy enfáticos en la importancia de contar con un capital humano multidisciplinario que incluya especialistas en Data Science para el análisis de información brindado por varias instituciones astronómicas. Esta institución busca atraer el interés del público en la astronomía, precisamente para contar con variedad de talentos que puedan dar soluciones que mejoren la exploración del universo.
El escenario actual y sus proyecciónes
Hasta ahora, la participación que ha tenido El Data Science en la astronomía es sólo del análisis de datos ya existentes, lo que plantea un gran desafío (y a la vez un próspero camino para esta área de la ciencia).
Se nececita el crecimiento de la comunidad de profesionales de la ciencia de datos para desarrollar predicciones en la Astronomía. Los casos mencionados reflejan el flujo de una inmensa cantidad de información que ha requerido de grandes equipos para analizar, sin embargo estos ejemplos son sólo unos pocos ya que existen muchas más instituciones de observación astronómica que son fuente de otra infinidad de datos.
La versatilidad del Data Science
Lo detallado en este artículo son sólo unos pocos aportes del Data Science a la astronomía, dejando en evidencia la versatilidad de esta disciplina, llegando a áreas de investigación que literalmente apuntan hacia el infinito. Para que sigas indagando en el mundo de Data Science te invitamos a leer un artículo relacionado al Mercado de esta práctica en Chile. Si te gustaría sumarte a la transformación digital y darle un nuevo camino a tu proyecciones profesionales con el Data Science puedes revisar el detalle de esta carrera en Desafío Latam aquí.