Científico de datos

La guía profesional para científicos de datos de BrainStation puede ayudarlo a dar los primeros pasos hacia una carrera lucrativa en ciencia de datos. Siga leyendo para obtener una descripción general del campo de la ciencia de datos, así como del puesto de trabajo de científico de datos.

Conviértase en un científico de datos

Hable con un asesor de aprendizaje para obtener más información sobre cómo nuestros bootcamps y cursos pueden ayudarlo a convertirse en un científico de datos.



Al hacer clic en Enviar, acepta nuestra Términos .



Entregar

¡No se pudo enviar! ¿Actualizar la página e intentarlo de nuevo?

Más información sobre nuestro Bootcamp de ciencia de datos

¡Gracias!

Nos veremos pronto.



Ver la página del campo de entrenamiento de ciencia de datos

¿Qué es un científico de datos?

Los científicos de datos recopilan, organizan y analizan grandes conjuntos de macrodatos (datos estructurados y no estructurados) para crear planes y soluciones comerciales accionables basados ​​en datos para empresas y otras organizaciones. Al combinar un sentido de las matemáticas, la informática y los negocios, los científicos de datos deben poseer tanto las habilidades técnicas para procesar y analizar big data como la perspicacia comercial para descubrir información procesable oculta en esos datos.

Ciencia de datos frente a minería de datos

Existen algunas diferencias entre la ciencia de datos y la minería de datos. Miremos más de cerca:

Ciencia de los datos

  • Es un campo amplio que tiende a incluir el aprendizaje automático, la inteligencia artificial, el análisis causal predictivo y el análisis prescriptivo.
  • Trata con todo tipo de datos, incluidos datos estructurados y no estructurados.
  • Tiene como objetivo crear productos centrados en datos y tomar decisiones basadas en datos.
  • Se centra en el estudio científico de datos y patrones.

Procesamiento de datos

  • Es un subconjunto de la ciencia de datos que incluye limpieza de datos, análisis estadístico y reconocimiento de patrones y, a veces, incluye visualización de datos, aprendizaje automático y transformación de datos.
  • Trata principalmente con datos estructurados, no con datos no estructurados
  • Tiene como objetivo tomar datos de varias fuentes y hacerlos utilizables.
  • Se centra en las prácticas comerciales.

¿Qué hace un científico de datos?

Un científico de datos analiza grandes conjuntos de datos para descubrir patrones y tendencias que conducen a conocimientos comerciales procesables y ayudan a las organizaciones a resolver problemas complicados o identificar oportunidades de ingresos y crecimiento. Un científico de datos puede trabajar en prácticamente todos los campos y debe ser experto en el manejo de conjuntos de datos estructurados y no estructurados. Es un trabajo multidisciplinario y para convertirse en un científico de datos, debe tener conocimientos de matemáticas, informática, negocios y comunicación para realizar su trabajo de manera efectiva.



Aunque los deberes y responsabilidades laborales específicos de un científico de datos variarán mucho según la industria, el puesto y la organización, la mayoría de los roles de científico de datos incluirán las siguientes áreas de responsabilidad:

Investigar

Un científico de datos necesita comprender las oportunidades y los puntos débiles específicos tanto de una industria como de una empresa individual.

Preparando datos

Antes de que se pueda encontrar información valiosa, un científico de datos debe definir qué conjuntos de datos son útiles y relevantes antes de recopilar, extraer, limpiar y aplicar datos estructurados y no estructurados de una variedad de fuentes.



Creación de modelos y algoritmos.

Utilizando los principios de aprendizaje automático e inteligencia artificial, un científico de datos debe ser capaz de crear y aplicar los algoritmos necesarios para implementar herramientas de automatización.

Análisis de los datos

Es importante que un científico de datos pueda analizar rápidamente sus datos para identificar patrones, tendencias y oportunidades.

Visualización y Comunicación

Un científico de datos debe ser capaz de contar las historias descubiertas a través de los datos creando y organizando paneles y visualizaciones estéticamente atractivos, al mismo tiempo que posee las habilidades de comunicación para persuadir a las partes interesadas y a otros miembros del equipo de que vale la pena actuar en función de los hallazgos en los datos.

La Encuesta de habilidades digitales de BrainStation más reciente encontró que los profesionales de datos dedican la mayor parte de su tiempo a disputar y limpiar datos. Los encuestados también concluyeron que el objetivo de su trabajo con mayor frecuencia es la optimización de una plataforma, producto o sistema existente (45 por ciento) o el desarrollo de nuevos (42 por ciento).

Tipos de ciencia de datos

El campo más amplio de la ciencia de datos incorpora muchas disciplinas diferentes, que incluyen:

ingeniería de datos

Diseñar, construir, optimizar, mantener y administrar la infraestructura que respalda los datos, así como el flujo de datos en toda una organización.

Preparación de datos

Limpieza y transformación de datos.

Procesamiento de datos

Extraer (y, a veces, limpiar y transformar) datos utilizables de un conjunto de datos más grande.

Analítica predictiva

Usar datos, algoritmos y técnicas de aprendizaje automático para analizar la probabilidad de varios resultados futuros posibles en función del análisis de datos.

Aprendizaje automático

Automatización de la construcción de modelos analíticos en el proceso de análisis de datos para aprender de los datos, descubrir patrones y capacitar a los sistemas para tomar decisiones sin mucha intervención humana.

Visualización de datos

Usar elementos visuales (incluidos gráficos, mapas y tablas) para ilustrar los conocimientos que se encuentran en los datos de una manera accesible para que las audiencias puedan comprender las tendencias, los valores atípicos y los patrones que se encuentran en los datos.

Beneficios de la ciencia de datos

Las empresas de todas las industrias en todas partes del mundo dedican cada vez más dinero, tiempo y atención a la ciencia de datos y buscan agregar un científico de datos a su equipo. La investigación muestra que las empresas que realmente adoptan la toma de decisiones basada en datos son más productivas, rentables y eficientes que la competencia.

La ciencia de datos es crucial para ayudar a las organizaciones a identificar los problemas y oportunidades correctos, al mismo tiempo que ayuda a formar una imagen clara del comportamiento y las necesidades de los clientes, el rendimiento de los empleados y los productos y los posibles problemas futuros.

La ciencia de datos puede ayudar a las empresas a:

  • Toma mejores decisiones
  • Más información sobre clientes y clientes
  • Aprovecha las tendencias
  • Anticipar el futuro

¿Cómo puede la ciencia de datos mejorar el valor para una empresa?

La ciencia de datos es una inversión cada vez más popular para las empresas porque el ROI potencial para desbloquear el valor de los grandes datos es enorme. La ciencia de datos es una inversión que vale la pena porque:

    Elimina las conjeturas y proporciona información procesable.Las empresas toman mejores decisiones basadas en datos y evidencia cuantificable.Las empresas comprenden mejor su lugar en el mercado.La ciencia de datos ayudará a las empresas a analizar la competencia, explorar ejemplos históricos y hacer recomendaciones basadas en números.Se puede aprovechar para identificar a los mejores talentos.Al acecho en los grandes datos hay muchos conocimientos sobre la productividad, la eficiencia de los empleados y el rendimiento general. Los datos también se pueden utilizar para reclutar y capacitar talentos.Conocerá todo sobre su público objetivo, cliente o consumidor.Todo el mundo está generando y recopilando datos ahora, y las empresas que no invierten adecuadamente en ciencia de datos simplemente recopilan más datos de los que saben qué hacer con ellos. Los conocimientos sobre el comportamiento, las prioridades y las preferencias de clientes o clientes anteriores o potenciales son invaluables, y simplemente están esperando que un científico de datos calificado los descubra.

Salarios de los científicos de datos

Si bien los salarios de los científicos de datos varían mucho según la región y la industria, se informa que el salario promedio de un científico de datos en los EE. UU. oscila entre $ 96,000 y $ 113,000, según la fuente. Un científico de datos sénior puede generar aproximadamente $130,000 en promedio.

Demanda de científicos de datos

Los científicos de datos tienen una gran demanda y escasez en prácticamente todas las industrias. Un informe de Deloitte Access Economics encontró que el 76 por ciento de las empresas planeaba aumentar el gasto en los próximos años en capacidades de análisis de datos, mientras que IBM predijo un aumento del 28 por ciento en la demanda de ciencia de datos a principios de la década.

La Oficina de Estadísticas Laborales de EE. UU. ha proyectado un crecimiento del 31 % en la ciencia de datos durante los próximos 10 años. Mientras tanto, un Informe de Mercados y Mercados encontró que se prevé que el mercado global de big data crezca a $ 229.4 mil millones para 2025, con la plataforma de ciencia de datos creciendo un 30 por ciento para 2024.

En todo el mundo, al parecer, se espera que aumenten las inversiones en ciencia de datos y, con ello, la demanda de científicos de datos.

¿Qué herramientas utilizan los científicos de datos?

Los científicos de datos utilizan una variedad de herramientas y programas diferentes para actividades que incluyen el análisis de datos, la limpieza de datos y la creación de visualizaciones.

Python es el principal lenguaje de programación para los científicos de datos encuestados en la Encuesta de habilidades digitales de BrainStation. Python, un lenguaje de programación de propósito general, es útil para aplicaciones de procesamiento de idiomas nacionales y análisis de datos. R también se usa a menudo para el análisis de datos y la minería de datos. Para el procesamiento de números más pesados, las herramientas basadas en Hadoop como Hive son populares. Para el aprendizaje automático, los científicos de datos pueden elegir entre una amplia gama de herramientas, incluidas h2o.ai, TensorFlow, Apache Mahout y Accord.Net. Las herramientas de visualización también son una parte importante del arsenal de un científico de datos. Programas como Tableau, PowerBI, Bokeh, Plotly e Infogram ayudan a los científicos de datos a crear diagramas visualmente atractivos, mapas de calor, gráficos, diagramas de dispersión y más.

Los científicos de datos también deben sentirse extremadamente cómodos con SQL (utilizado en una variedad de plataformas, incluidas MySQL, Microsoft SQL y Oracle) y programas de hojas de cálculo (generalmente Excel).

¿Qué habilidades necesitan los científicos de datos?

Hay una serie de habilidades que todos los aspirantes a científicos de datos deben desarrollar, que incluyen:

    Excel.La herramienta más utilizada por el 66 por ciento de los profesionales de datos encuestados en la Encuesta de habilidades digitales de BrainStation, Excel sigue siendo crucial para los científicos de datos.SQL.Este lenguaje de consulta es indispensable en la gestión de bases de datos y lo utiliza aproximadamente la mitad de los encuestados de datos.Programación estadística.Los científicos de datos suelen utilizar Python y R para ejecutar pruebas, crear modelos y realizar análisis de grandes conjuntos de datos.Visualización de datos.Herramientas como Tableau, Plotly, Bokeh, PowerBl y Matplotlib ayudan a los científicos de datos a crear representaciones visuales convincentes y accesibles de sus hallazgos.

Trayectorias profesionales de los científicos de datos

Como una profesión relativamente nueva, las trayectorias profesionales de los científicos de datos no están escritas en piedra, y muchas personas encuentran su camino hacia la ciencia de datos con experiencia en informática, TI, matemáticas y negocios. Pero los cuatro ejes principales de la trayectoria profesional de un científico de datos generalmente son datos, ingeniería, negocios y productos. Muchos roles multidisciplinarios en la ciencia de datos requieren un dominio de varias o todas esas áreas.

Las personas que trabajan en ciencia de datos están a la vanguardia de los cambios tecnológicos que tendrán un mayor impacto en el futuro. Debido a que la ciencia de datos puede contribuir a los avances en prácticamente todos los demás campos, los científicos de datos están en condiciones de seguir investigando en todo, desde finanzas y comercio hasta estadísticas actuariales, energía verde, epidemiología, medicina y productos farmacéuticos, telecomunicaciones: la lista es prácticamente interminable. Cada industria trafica con sus propios tipos diferentes de datos, aprovechándolos de diferentes maneras para alcanzar diferentes objetivos. Donde sea que eso suceda, los científicos de datos pueden guiar una mejor toma de decisiones, ya sea en el desarrollo de productos, análisis de mercado, gestión de relaciones con los clientes, recursos humanos o algo completamente diferente.

Las aplicaciones de la ciencia de datos no solo son amplias y abarcan muchos sectores diferentes, sino que también existen diferentes tipos de ciencia de datos. Lo que todas estas actividades tienen en común es que todas ellas intentan convertir los datos en conocimiento. Más precisamente, los científicos de datos utilizan un enfoque metódico para organizar y analizar datos sin procesar para identificar patrones a partir de los cuales se puede identificar o inferir información útil.

Dado el alcance de su impacto, no es de extrañar que los científicos de datos ocupen puestos que son muy influyentes y muy solicitados. Si bien el camino para convertirse en un científico de datos puede ser exigente, ahora hay más recursos que nunca para los aspirantes a científicos de datos y más oportunidades para que construyan el tipo de carrera que desean.

Pero a pesar de todas las formas en que los científicos de datos pueden contribuir a diferentes industrias y todas las diferentes trayectorias profesionales que puede seguir un científico de datos, los tipos de trabajo que realizan se pueden dividir en algunas categorías principales. No toda la ciencia de datos encaja perfectamente en estos grupos, especialmente en la vanguardia de la informática, donde continuamente se abren nuevos caminos, pero le darán una idea de las formas en que los científicos de datos convierten los datos en información.

Estadísticas

En el corazón de la ciencia de datos, la estadística es el campo de las matemáticas que describe las diferentes características de un conjunto de datos, ya sean números, palabras, imágenes o algún otro tipo de información medible. Gran parte de las estadísticas se concentran simplemente en identificar y describir lo que hay, especialmente con conjuntos de datos muy grandes, saber qué incluye y qué no incluye la información es una tarea en sí misma. Dentro del campo de la ciencia de datos, esto a menudo se denomina análisis descriptivo. Pero las estadísticas pueden ir aún más allá, probando para ver si sus suposiciones sobre lo que hay en los datos son correctas o, si son correctas, si son significativas o útiles. Esto puede implicar no solo examinar los datos, sino también manipularlos para extraer sus características más destacadas. Hay muchas formas diferentes de hacer esto: regresión lineal, regresión logística y análisis discriminante, diferentes métodos de muestreo, etc., pero en última instancia, cada una de estas técnicas se trata de comprender las características de un conjunto de datos y la precisión con la que estas características. reflejan alguna verdad significativa sobre el mundo al que corresponden.

Análisis de los datos

Si bien se basa en la base de las estadísticas, el análisis de datos va un poco más allá, en términos de comprensión de la causalidad, visualización y comunicación de los hallazgos a otros. Si las estadísticas se proponen definir el qué y el cuándo de un conjunto de datos, el análisis de datos trata de identificar el por qué y el cómo. Los analistas de datos hacen esto limpiando los datos, resumiéndolos, transformándolos, modelándolos y probándolos. Como se mencionó anteriormente, este análisis no se limita solo a los números. Si bien gran parte del análisis de datos utiliza datos numéricos, también es posible realizar análisis en otros tipos de datos: comentarios escritos de los clientes, por ejemplo, o publicaciones en redes sociales, o incluso imágenes, audio y video.

Uno de los principales objetivos de los analistas de datos es comprender la causalidad, que luego se puede utilizar para comprender y predecir tendencias en una amplia gama de aplicaciones. En el análisis de diagnóstico, los analistas de datos buscan correlaciones que sugieran una causa y un efecto, cuya información a su vez se puede utilizar para ayudar a modificar los resultados. El análisis predictivo busca patrones de manera similar, pero luego los amplía aún más, extrapolando sus trayectorias más allá de los datos conocidos para ayudar a predecir cómo podrían desarrollarse eventos no medidos o hipotéticos, incluidos eventos futuros. Las formas más avanzadas de análisis de datos se proponen brindar orientación sobre decisiones específicas al modelar y predecir los resultados de varias opciones para identificar el curso de acción más apropiado.

Inteligencia artificial y aprendizaje automático

Uno de los grandes avances que se están produciendo actualmente en la ciencia de datos, y que está a punto de ejercer una enorme influencia en el futuro, es la inteligencia artificial y, más específicamente, el aprendizaje automático. En pocas palabras, el aprendizaje automático implica entrenar una computadora para realizar tareas que normalmente consideramos que requieren algún tipo de inteligencia o juicio, como ser capaz de identificar los objetos en una foto. Por lo general, esto se logra brindándole abundantes ejemplos del tipo de determinación que está entrenando a la red para que tome. Como se puede imaginar, esto requiere montones de datos (generalmente estructurados) y la capacidad de hacer que una computadora le dé sentido a esos datos. Fuertes habilidades estadísticas y habilidades de programación son imprescindibles.

Los efectos beneficiosos del aprendizaje automático son prácticamente ilimitados, pero lo primero y más importante es la capacidad de realizar tareas complejas o prolongadas más rápido que cualquier humano, como identificar una huella dactilar específica dentro de un depósito de millones de imágenes o hacer referencias cruzadas. docenas de variables en miles de archivos médicos para identificar asociaciones que podrían ofrecer pistas sobre las causas de la enfermedad. Con suficientes datos, los expertos en aprendizaje automático pueden incluso entrenar redes neuronales para producir imágenes originales, extraer información significativa de cuerpos masivos de texto escrito, hacer predicciones sobre futuras tendencias de gasto u otros eventos del mercado, y asignar recursos que dependen de una distribución altamente compleja, como la energía. , con la máxima eficacia. El beneficio de usar el aprendizaje automático para realizar estas tareas, a diferencia de otras formas de automatización, es que una IA no supervisada. El sistema puede aprender y mejorar automáticamente con el tiempo, incluso sin una nueva programación.

Inteligencia de Negocio

Como habrá adivinado por la referencia anterior a los eventos del mercado, el mundo de los negocios y las finanzas es uno de los lugares donde el aprendizaje automático ha tenido uno de sus impactos más tempranos y profundos. Gracias a la enorme cantidad de datos numéricos disponibles (bases de datos de marketing, encuestas, información bancaria, cifras de ventas, etc., la mayoría de los cuales están altamente organizados y son relativamente fáciles de manejar), los científicos de datos pueden usar estadísticas, análisis de datos y aprendizaje automático para extraer información sobre innumerables aspectos del mundo empresarial, guiar la toma de decisiones y optimizar los resultados, hasta el punto de que la inteligencia empresarial se ha convertido en un campo de la ciencia de datos en sí mismo.

Muy a menudo, los desarrolladores de Business Intelligence no se limitan a mirar cualquier dato que esté disponible para ver qué pueden descubrir; buscan de manera proactiva la recopilación de datos y el desarrollo de técnicas y productos para responder preguntas específicas y alcanzar objetivos específicos. En ese sentido, los desarrolladores y analistas de Business Intelligence son cruciales para el desarrollo estratégico en los mundos de los negocios y las finanzas: ayudan a los líderes a tomar mejores decisiones y hacerlas más rápido, comprender el mercado para identificar las oportunidades y los desafíos de un negocio y mejorar la eficiencia general de los sistemas y la operación de una empresa, todo con el objetivo general de lograr una ventaja competitiva y aumentar las ganancias.

ingeniería de datos

El último campo de estudio principal en el que trabajan a menudo los científicos de datos comprende una amplia gama de diferentes títulos de trabajo: ingeniero de datos, arquitecto de sistemas, arquitecto de aplicaciones, arquitecto de datos, arquitecto empresarial o arquitecto de infraestructura, por nombrar solo algunos. Cada uno de estos roles tiene su propio conjunto de responsabilidades, algunos desarrollan software, otros diseñan sistemas de TI y otros más alinean la estructura y los procesos internos de una empresa con la tecnología que utiliza para perseguir sus estrategias comerciales. Lo que los une a todos es que los científicos de datos que trabajan en este campo están aplicando tecnología de datos e información para crear o mejorar sistemas con una función específica en mente.

Un arquitecto de aplicaciones, por ejemplo, observa cómo una empresa u otra empresa utiliza soluciones tecnológicas específicas, luego diseña y desarrolla aplicaciones (incluido el software o la infraestructura de TI) para mejorar el rendimiento. De manera similar, un Arquitecto de datos desarrolla aplicaciones; en este caso, soluciones para almacenamiento, administración y análisis de datos. Un Arquitecto de Infraestructura podría desarrollar las soluciones generales que una empresa utiliza para realizar negocios diarios para garantizar que esas soluciones cumplan con los requisitos del sistema de la empresa, ya sea fuera de línea o en la nube. Los ingenieros de datos, por su parte, se enfocan en el procesamiento de datos, concibiendo e implementando las canalizaciones de datos que recopilan, organizan, almacenan, recuperan y procesan los datos de una organización. En otras palabras, la característica definitoria de esta amplia categoría de ciencia de datos es que implica diseñar y construir cosas: los sistemas, estructuras y procesos mediante los cuales se lleva a cabo la ciencia de datos.

¿Cuáles son los trabajos de ciencia de datos más demandados?

La ciencia de datos en general es una habilidad muy demandada, por lo que se pueden encontrar muchas oportunidades en cada área y especialidad del campo. De hecho, en 2019, LinkedIn incluyó al científico de datos como el trabajo más prometedor del año, y QuantHub predijo una gran escasez de científicos de datos calificados para el próximo año.

La palabra clave aquí es calificada. A menudo, los requisitos técnicos que debe cumplir un científico de datos son tan específicos que puede tomar algunos años de experiencia trabajando en la industria para desarrollar el rango necesario de competencias, comenzando como un generalista, luego agregando lentamente más y más aptitudes y habilidades para su conjunto de habilidades.

Estas son solo algunas de las formas más comunes en que los científicos de datos pueden hacer eso: hay tantas trayectorias profesionales potenciales como científicos de datos, pero en todos los casos, el avance profesional depende de la adquisición de nuevas habilidades y experiencia con el tiempo.

Analista de datos

Como sugiere el nombre, los analistas de datos analizan datos, pero ese breve título solo captura una pequeña parte de lo que los analistas de datos realmente pueden lograr. Por un lado, los datos rara vez comienzan en un formato fácil de usar y, por lo general, los analistas de datos son los responsables de identificar el tipo de datos necesarios, recopilarlos y ensamblarlos, y luego limpiarlos y organizarlos, convirtiéndolos en un formato más completo. forma utilizable, determinando qué contiene realmente el conjunto de datos, eliminando los datos dañados y evaluando su precisión. Luego está el análisis en sí mismo: usar diferentes técnicas para examinar y modelar datos, buscar patrones, extraer significado de esos patrones y extrapolarlos o modelarlos. Finalmente, los analistas de datos ponen sus conocimientos a disposición de los demás mediante la presentación de los datos en un tablero o una base de datos a la que otras personas pueden acceder, y comunican sus hallazgos a los demás a través de presentaciones, documentos escritos y tablas, gráficos y otras visualizaciones.

Trayectoria profesional de analista de datos

Data Analyst es un excelente punto de entrada al mundo de la ciencia de datos; puede ser una posición de nivel de entrada, dependiendo del nivel de experiencia requerido. Los nuevos analistas de datos generalmente ingresan al campo directamente después de la escuela, con un título en estadística, matemáticas, informática o similar, o hacen la transición al análisis de datos desde un campo relacionado como negocios, economía o incluso ciencias sociales, generalmente mejorando su habilidades a mitad de carrera a través de un campo de entrenamiento de análisis de datos o un programa de certificación similar.

Pero ya sean recién graduados o profesionales experimentados que están haciendo un cambio en la mitad de su carrera, los nuevos científicos de datos generalmente comienzan realizando tareas rutinarias como adquirir y manipular datos con un lenguaje como R o SQL, crear bases de datos, realizar análisis básicos y generar visualizaciones usando programas como Tableau. No todos los analistas de datos necesitarán saber cómo hacer todas estas cosas (puede haber especialización, incluso en un puesto junior), pero debería poder realizar todas estas tareas si espera progresar en su carrera. La flexibilidad es un gran activo en esta etapa temprana.

La forma en que avanza como analista de datos depende en cierta medida de la industria en la que está trabajando: marketing, por ejemplo, o finanzas. Según el sector y el tipo de trabajo que esté realizando, puede optar por especializarse en programación en Python o R, convertirse en un profesional en la limpieza de datos o concentrarse únicamente en construir modelos estadísticos complejos o generar bellas imágenes; por otro lado, también puede optar por aprender un poco de todo, lo que lo preparará para asumir una posición de liderazgo al asumir el título de Analista de datos sénior. Con una experiencia lo suficientemente amplia y profunda, un analista de datos sénior está preparado para asumir un rol de liderazgo supervisando un equipo de otros analistas de datos, y eventualmente convertirse en gerente o director de departamento. Con capacitación adicional en habilidades, los analistas de datos también están en una posición sólida para pasar a la posición más avanzada de científico de datos.

Científico de datos

Los científicos de datos propiamente dichos pueden hacer todas las cosas que pueden hacer los analistas de datos, además de algunas cosas más; de hecho, con la capacitación y la experiencia adecuadas, un analista de datos puede eventualmente avanzar al puesto de científico de datos. Entonces, sí, los científicos de datos deberían poder adquirir, limpiar, manipular, almacenar y analizar datos, pero también comprender y trabajar con diferentes métodos de aprendizaje automático, y poder programar en Python, R o un lenguaje de programación estadístico similar para construir y evaluar modelos más avanzados.

Trayectoria profesional de científico de datos

Muchas personas ingresan al campo como analistas de datos antes de obtener la experiencia y las habilidades adicionales necesarias para llamarse a sí mismos científicos de datos. Luego, de Científico de datos junior, el siguiente paso suele ser Científico de datos senior, aunque ese simple cambio en el título desmiente el trabajo que se necesita para hacer esa transición; un científico de datos sénior dominará una comprensión superior de prácticamente todos los aspectos de la ciencia de datos (IA, almacenamiento de datos, minería de datos, computación en la nube, etc.), además de su familiaridad con un campo específico de la industria, como estrategia comercial o análisis de atención médica , o se especializarán en una de estas áreas con experiencia a nivel de gurú.

Vale la pena mencionar que, si bien algunos científicos de datos comienzan sus carreras en análisis y se abren camino hacia puestos más altos en campos especializados como psicología, marketing, economía, etc., otros comienzan como profesionales en uno de esos campos diferentes antes de hacer la transición a un data. papel de la ciencia.

Para muchos, el científico de datos sénior es el objetivo final de su carrera; este ya es un rol tan avanzado que, al menos dentro del campo de la ciencia de datos, a menudo es el puesto más alto que se puede alcanzar: simplemente se convierte en un científico de datos senior mejor y más capaz con mayores áreas de especialización. Sin embargo, para algunos, especialmente aquellos que adoptan un enfoque más generalista, es posible avanzar más hacia un puesto gerencial como el de científico principal de datos, dirigiendo un equipo o departamento, o incluso como director de datos, liderando la estrategia de datos de una institución al más alto nivel. y respondiendo sólo al CEO.

Ingeniero de datos

Lo que distingue a los ingenieros de datos de otros profesionales que trabajan en el campo de los datos es el hecho de que diseñan y crean sistemas completos, incluida la infraestructura y los procesos que utiliza la empresa para aprovechar al máximo esos datos. Es decir, los ingenieros de datos son las personas que determinan las formas en que otros científicos de datos pueden hacer su trabajo. ¿Qué formas de datos puede acomodar el sistema de la empresa? ¿Qué métodos se utilizan para recopilar datos de ventas y marketing, o los resultados de una encuesta de atención médica, y ponerlos a disposición para su análisis? Para hacer esto, los ingenieros de datos deben estar muy familiarizados con los tipos de trabajo que realizan otros profesionales de la ciencia de datos: administradores de bases de datos, analistas de datos, arquitectos de datos, etc., hasta el punto de que los ingenieros de datos a menudo pueden desempeñar cada uno de estos roles como bien. Pero debido a que son constructores, los ingenieros de datos generalmente pasan más tiempo trabajando en el desarrollo que otros profesionales de la ciencia de datos: escribiendo programas de software, creando bases de datos relacionales o desarrollando herramientas que permiten a las empresas compartir datos entre departamentos.

Trayectoria profesional de ingeniero de datos

Al igual que otros trabajos que trabajan con datos, el primer paso para convertirse en ingeniero de datos suele ser un título universitario (generalmente una licenciatura o maestría en ingeniería, informática o matemáticas), pero no siempre. Alguien con mucha experiencia trabajando en TI o desarrollo de software puede descubrir que ya tiene todas las habilidades necesarias para convertirse en un ingeniero de datos, excepto las habilidades de datos en sí, en cuyo caso, algunas habilidades de reciclaje, como un bootcamp de datos, pueden ayudar a traerlos. hasta la velocidad. Muchas de las habilidades que requiere un ingeniero de datos (como SQL, UNIX y Linux, desarrollo de ETL o configuración de sistemas de TI) se pueden desarrollar trabajando en un campo adyacente; otros (como el aprendizaje automático o la creación de canalizaciones de datos) requerirán un aprendizaje más centrado.

Dicho esto, la mayoría de los ingenieros de datos comienzan sus carreras trabajando en algún subcampo de la informática antes de adquirir todas las habilidades necesarias para convertirse en un ingeniero de datos junior; de hecho, la mayoría de los puestos de trabajo para ingenieros de datos junior requieren entre uno y cinco años de experiencia laboral. A partir de ahí, el siguiente paso lógico es convertirse en ingeniero de datos sénior e ingeniero de datos principal. Pero, con su dominio de tantos aspectos de TI, ingeniería de software y ciencia de datos, también hay muchos otros puestos disponibles para ingenieros de datos, incluidos Arquitecto de datos, Arquitecto de soluciones o Arquitecto de aplicaciones. Para alguien que busca hacer menos trabajo práctico y más gestión de empleados, otras opciones incluyen Gerente de desarrollo de productos o, eventualmente, dadas las habilidades adecuadas, incluso Director de datos o Director de información.

¿Pueden los científicos de datos trabajar desde casa?

Al igual que muchos trabajos en el campo de la tecnología, los roles de científico de datos a menudo se pueden realizar de forma remota, pero esto depende en última instancia de la empresa para la que trabaja y el tipo de trabajo que realiza.

¿Cuándo pueden los científicos de datos trabajar de forma remota?

Los puestos de ciencia de datos que trabajan con datos e información altamente sensibles o confidenciales (lo que incluye una gran cantidad de ellos, incluso fuera de los campos de privacidad como la banca y la atención médica, ya que los datos propietarios pueden ser uno de los activos más valiosos de una gran empresa) encontrarán que enfrentan muchas más restricciones con respecto al trabajo remoto. En estos casos, es probable que deba trabajar en la oficina durante el horario laboral.

Algunos otros factores a considerar:

  • Cuán tradicional es su empresa. Las empresas más grandes y antiguas no suelen ser tan amigables con el control remoto, aunque es posible que COVID haya traído grandes cambios en esta área.
  • Con qué facilidad puede trabajar con otros compañeros de equipo y departamentos de forma remota. Si su trabajo es altamente colaborativo, es más probable que deba presentarse en persona.
  • Los científicos de datos que trabajan por contrato, o incluso como consultores, también pueden tener más flexibilidad para elegir su propia ubicación.

Kategori: Noticias