En un artículo anterior ya comentamos acerca de nuestra definición de Data Science o Ciencia de datos, sin embargo nos siguieron preguntando: ¿Dónde puedo trabajar? ¿Qué responsabilidades tengo dentro de las empresas? ¿Existe realmente trabajo en esta área? ¿Voy a ganar más plata?.
En las tecnologías de la información suele hablarse de “hype” o tema de moda a esas nuevas herramientas que surgen, que todo el mundo habla de ellas, muchos empiezan a usarse, pero en algunas ocasiones solo queda en eso y no logra consolidarse como una herramienta masiva. En este caso más que una “herramienta” estamos hablando de una disciplina, pero nadie puede negar que ha sido un tema popular, pero, a diferencia de otros, este “hype” no pasa solo porque se habla de él, sino que hay una demanda enorme de profesionales en el área, muchos más de los profesionales que surgen, lo que la transforma (como otra disciplinas de las tecnologías de la información) en una carrera profesional con amplias oportunidades. No por nada Harvard Business Review la nombró The Sexiest Job of the 21st Century, con ese nombre hasta Messi pensaría cambiar de rubro.
Según una investigación realizada por Glassdoor en Estados Unidos, la media de ingreso de un profesional de la ciencia de datos es de $100.000 dólares al año el 2018, convirtiéndolo en uno de los “Mejores trabajos del 2018 en EEUU”. No solo ellos han catalogado esta área como una gran oportunidad, sino que estudios de Linkedin, Deloitte y otros han llegado a conclusiones similares. Lo que pasa en el hemisferio norte no es muy distinto a lo que está pasando en latinoamérica, los invito a ir a los sitios de empleo y busquen Data Science, Machine Learning o Big Data y van a encontrar múltiples ofertas laborales. El Mercurio de Chile menciona que entre el 2008 y el 2016 aumentó en un 50% la demanda de profesionales en el área.
Lo primero que hay que tener claro es que dentro del área existen varias especialidades. Se debe destacar que este es un rubro relativamente nuevo y muchos de los conceptos no tienen un consenso en su definición y, entre ellos, existen muchos elementos en común. Especialmente en el mercado latinoamericano que está entrando lentamente a este mundo, los conceptos son un poco más nebulosos y los profesionales suelen ser un poco más generalistas.
Generalmente cuando uno revisa los trabajos de Ciencia de Datos, se puede encontrar con estos roles:
- Analista de Datos (Data Analysis): Este rol también es conocido en algunas industrias como Business Intelligence. Su labor principal es responder preguntas, es el responsable de adquirir los datos (¡y limpiar!), procesar la información y comunicar los resultados. Su tarea es esencial para el proceso de toma de decisiones. Actualmente mucho de este trabajo se realiza con MS Excel (no nos liberaremos tan fácil de él), pero de a poco el mercado laboral está solicitando conocimientos en Python, R, SQL, modelación y algunas herramientas de Machine Learning. En una primera instancia estos profesionales realizan los trabajos más operativos, pero con experiencia van entrando en la modelación de los análisis, en la predicción de resultados, en la interpretación de los mismos y finalmente en la toma de decisiones. Alguien que entiende muy bien los datos de una empresa tiene muchas opciones de surgir a puestos de mayor relevancia.
- Ingeniero de Datos (Data Engineer): Este profesional es el responsable de crear bases de datos o fuentes de información, esta tarea no es sencilla, porque muchos que trabajarán en sistemas saben que muchas veces la información está sucia, desestructurada, desorganizada o desordenada. Estos especialistas trabajan directamente con las bases de datos, integran la información de diferentes fuentes, organizan la información para que luego los analistas puedan realizar estudios sobre ellos. Generalmente se habla de las ETL (Extract/Load/Transform), su labor es diseñar las bases de datos y asegurarse de que la información fluya desde las diferentes fuentes a la extracción. En las últimas décadas estos profesionales se les requieren habilidades en técnicas de Big Data para el procesamiento de un número mayor de información.
Muchos otras roles se pueden ver en la industria: Ingeniero de Machine Learning, Analista Big Data o simplemente Data Scientist.
Sea como sea, en un equipo de Data Science existirán estos roles, en algunos casos será la misma persona que realizará más que uno o cada rol debe tener claro lo que hace su compañero. Es importante que los profesionales de esta área entiendan el trabajo de sus compañeros para generar una mejor sinergia y coordinación.
Con esto último en mente estamos construyendo nuestro Bootcamp Analista Data Science que busca generar los profesionales completos en el área, que luego podrán especializarse en alguno de los roles anteriores.