Data Profile Series 1: Data Analyst
Desde hace algunos años no hay conversación o artículos sobre management en que los datos no sean los protagonistas. Todo el mundo habla y parece entender sobre Big Data y Business Intelligence. Abundan los gurús de los datos pero pocos han bajado al “barro”. Muchos de estos artículos califican a los datos como la materia prima de las organizaciones del siglo XXI, su principal activo, el nuevo petróleo. La realidad es que la economía digital y los avances tecnológicos han permitido a las organizaciones capturar cantidades ingentes de datos. Pensad en las grandes plataformas tecnológicas como Facebook, Google o Twitter que han hecho de los datos el principal activo para desarrollar sus modelos de negocio basados en la publicidad. Con mucho éxito por cierto. O Amazon que con sus algoritmos aplicados a sus datos es capaz de hacer cross y up selling en forma de recomendaciones de otros productos relacionados. Por lo que los datos quizás sean el nuevo petróleo, pero a diferencia de éste cuya oferta es finita, el crecimiento de los datos es exponencial.
Ahora bien un tema es capturar esos datos y otros convertirlos en información para la toma de decisiones. Convertir datos en bruto en información relevante es una labor ingente, oscura y desagradecida, pero es uno de los principales retos de las organizaciones. Actualmente sobran datos y faltan skills para saber aprovecharlos.
Este artículo pretende ser la primera entrega de lo que espero que sea una serie sobre perfiles profesionales relacionados con los Datos. La idea es entender las competencias, conocimientos y habilidades para el desempeño profesional de los diferentes roles que conviven con los datos a partir de las ofertas de trabajo que las empresas tienes abiertas en diferentes webs especializadas. También intentaré estimar el salario medio. No será fácil ya que en las ofertas que lo indica (menos de la mitad) la horquilla es amplia. Pero algún dato daremos. Esta Data Profile Serie no tiene una periodicidad establecida. Lo ire haciendo a medida que tenga tiempo, por lo que será más lenta que rápida. Una vez finalizada la descripción de los roles, mi idea es hacer una comparativa entre ellos y sacar alguna conclusión. Pero sin compromiso. Mucha paciencia. Gracias.
El Data Analyst
Hoy empezamos con el DATA ANALYST o Analista de Datos. Mis fuentes de información han sido las búsquedas abiertas de estos perfiles que las siguientes empresas:
Evernote, Visa, Nytec, Walmart, Stanford University, 80Twenty, Adara Media, methinks
tienen publicadas en las siguientes webs:
- Glasdoor enfocado en el área de Silicon Valley donde hay más demanda de estos perfiles
- Linkedin para los perfiles en España. La verdad es que la descripción de los puestos de trabajo es muy pobre comparado con el anterior. En cuanto a industrias la mayoría son consultoras que trabaja para grandes empresas, empresas del sector financiero y alguna startup. El resto está missing.
- Angelist una de las web de referencia del mundo startupero. Lleno de Business Angel y proyectos de todo tipo. Hace un par de años abrieron una sección de Jobs que empieza a ser importante.
Educación
Antes con una carrera y un MBA tenías el futuro asegurado. Era un salvoconducto al éxito (entendiendo como éxito ganar mucho dinero, tener coche de empresa y despacho para ti solito). Actualmente los profesionales estudian diversos masters de disciplinas diversas, abundan los Phd como capa superior de conocimiento, pero la formación sirve de poco sino se sabe aplicarla. Hay que demostrar que se sabe hacer. En el caso del Data Analyst si eres cinturón negro de Mysql (demostrable cuando te pongan delante del código durante la entrevista) el hecho de que no seas ingeniero de software no es determinante. Si eres un sociólogo geek también tendrás tu oportunidad. Esta reflexión es algo que las recruiters de las principales empresas tecnológicas llevan mucho tiempo diciendo: eres lo que sabes hacer y los CV cada vez valen menos. Y para saber hacer tienes que haber adquirido conocimiento teórico y saberlo aplicar. Si lo has conseguido en Stanford o picando código en tu habitación es cada vez menos relevante. Digo menos, no nada.
Dicho lo anterior el background académico más demandado para el role de Data Analyst es:
- BE = Bachelor of Engineering
- BTECH = Bachelor of Technology
- BS = Bachelor of Science
- BM = Bachelor of Mathematics
- Bachelor of Statistics
Es decir una carrera científica con un gran dominio de las matemáticas que al final es la base de la mayoría de las ciencias. Todo muy cuantitativo. No hay sitio para el humanismo, lo cual es un error que da para otro artículo. Pero en un mundo científico, la parte humana del profesional se subestima, lo cual es un tremendo error. Esto es la base, ahora vienen los toppins
- Master’s degree in Science, Technology, Engineering, or Math. Es decir más de lo mismo nivel Dios.
- PhD en disciplinas cuantitativas es un plus. Ideal si has estado dos años investigando y has publicado una tesis. Qué mejor que contratar a una persona que se ha estado pegando con un problema similar durante algunos años.
En aquellos organizaciones donde buscan DATA ANALYST en área de negocio también se pide conocimientos de economía, finanzas o marketing. Son perfiles más abiertos donde el DATA ANALYST además de mucho mysql también ha de saber interpretar datos en el contexto de su negocio.
Conocimientos
La educación presupone los conocimientos pero cada vez menos por lo comentado anteriormente. En una organización el objetivo principal de los roles de DATA es extraer la señal dentro de todo el ruido de los datos masivos. Encontrar patrones que conviertan los datos en información que ayude en la toma de decisiones de negocio. La labor del analista de datos es tratar con inmensa cantidades de datos de diversas fuentes algunas de dudosa fiabilidad, en repositorios diferentes, desestructurados, en diferentes formatos,y mcuhas veces contradictorias, para convertirlas en algo manejable para el análisis posterior. Es menos glamouroso y mas duro de lo que piensas. A continuación los conocimientos que se demandan:
- Cinturon negro y mínimo tercer dan de SQL. Esto incluye saber diseñar bases de datos relacionales, realizar consultas, etc…
- Experiencia con Hive y Spark de Apache (si no te suenan, “Gracias por venir. Ya te llamaremos”)
- Dominio de Data Warehousing y técnicas de ETL ( (Extract, Transform and Load). Es decir ser un number crunching y saber torturar las bbdd hasta que canten lo que queremos oir.
- Comprensión de alto nivel en al menos un lenguaje de scripting como Ruby, Shell, Python o Javascript. Phyton es el preferido. Es un lenguaje muy descriptivo y polivalente.
- Sistemas Unix o GNU / Linux, incluidos los scripts de shell.
- Análisis estadístico.
- Saber realizar presentaciones visuales e infografías .
- Aplicar métodos de análisis de inferencia causal en situaciones experimentales y no experimentales.
Tecnologías
A continuación el cinturón de herramientas del obrero de los datos para poder realizar su trabajo con éxito:
- Oracle
- Vertica
- Los ya comentados Hive, Spark y MySQL
- Excel. Si habéis leído bien. El Excel sigue siendo la herramienta de análisis de Datos más utilizada. No subestiméis la potencia de Excel. Si lo dominas se pueden hacer auténticas diabluras. Recuerdo cuando sabía hacer macros con Visual Basic
Statistical analysis:
- R
- MATLAB
- SPSS
- SAS
- Stata
Lenguajes de programación
- Python
- JavaScript
- Java
- C++
Entornos de desarrollo
- GNU/Linux systems incluido shell scripting
Visualization
- Tableau.
Business Intelligence
- Microstrategy
De todas las tecnologías listada, tener conocimientos de Tableau o similares apenas aparece en las ofertas, pero me parece vital. No se trata tan solo de saber extraer datos e interpretarlos, sino de saberlos vender internamente para que las conclusiones del análisis se implementen. Y para ello las infografías, los gráficos y el storytelling son de gran ayuda. Hacer toda la parte de análisis para luego no saber venderlo es morir en la orilla.
Salario
¿Y todo lo anterior por cuanto al año? Pues depende de muchos factores pero principalmente la ley de la oferta y la demanda, y cuanto conscientes son las empresas de la importancia de los datos. Por ejemplo, en el area de San Francisco donde la demanda es mayor ya que hay una gran concentración de proyectos tecnológicos, el salario medio anual es de $86k.
En el caso de España la horquilla estaría entre €20k euros y €50k.
Estos datos en algunos casos son estimaciones ya que en muchas ofertas no figura el salario ofrecido. Son temas banales que se tratan en la recta final del proceso de selección.
¿Te he convencido para empezar a hacer un curso de Mysql y jugar con las tablas pivotantes de Excel?