Un día en la vida de un científico de datos

La guía profesional para científicos de datos de BrainStation puede ayudarlo a dar los primeros pasos hacia una carrera lucrativa en ciencia de datos. Siga leyendo para obtener una descripción general de cómo los científicos de datos pasan sus días en el trabajo.

Conviértase en un científico de datos

Hable con un asesor de aprendizaje para obtener más información sobre cómo nuestros bootcamps y cursos pueden ayudarlo a convertirse en un científico de datos.



Al hacer clic en Enviar, acepta nuestra Términos .



Entregar

¡No se pudo enviar! ¿Actualizar la página e intentarlo de nuevo?

Más información sobre nuestro Bootcamp de ciencia de datos

¡Gracias!

Nos veremos pronto.



Ver la página del campo de entrenamiento de ciencia de datos

Un día en la vida de un científico de datos

De todas las disciplinas examinadas en la Encuesta de habilidades digitales de Brainstation, la ciencia de datos puede abarcar la gama más amplia de aplicaciones. Pero aunque la ciencia de datos ha existido durante décadas, solo recientemente ha florecido por completo. A medida que se expandió la disponibilidad de datos, las empresas se dieron cuenta de lo importante que puede ser la ciencia de datos, dice Briana Brownell, fundadora y directora ejecutiva de Pure Strategy, y científica de datos durante 13 años. Cada empresa ahora necesita tener un enfoque parcial en la tecnología. Solo esta semana, por ejemplo, McDonald's pagó un estimado de $300 millones de dólares para adquirir su propia firma de big data.

No es de extrañar, entonces, que la competencia por los científicos de datos sea increíblemente alta. En solo dos años, se espera que la demanda crezca un 28 por ciento, lo que equivale a unos 2,7 millones de nuevos puestos de trabajo. Son más vacantes de las que los nuevos graduados podrán llenar, lo que significa que los trabajadores tecnológicos en otros campos tendrán que refrescar sus habilidades y hacer la transición a los datos para satisfacer esta demanda.

De hecho, nuestra encuesta sugiere que esto ya está sucediendo. Aproximadamente cuatro de cada cinco profesionales de datos comenzaron su carrera haciendo otra cosa, y el 65 por ciento de todos los científicos de datos han estado trabajando en el campo durante cinco años o menos. Esta enorme afluencia de nuevas mentes tiene un efecto de doble filo, dice Brownell; por un lado, están surgiendo muchas ideas nuevas, dice. Cuando observo parte del contenido que surge de la comunidad de ciencia de datos, me sorprende la cantidad de innovación que hay. La otra cara, sin embargo, es una tendencia a reinventar la rueda.



La alta demanda de científicos de datos es excelente si usted es uno (o está pensando en convertirse en uno), pero para los empleadores, el reclutamiento puede ser un desafío desalentador. Aquí, la recapacitación es una solución obvia; puede ser más rentable volver a capacitar a un empleado actual en ciencia de datos que buscar uno nuevo.

Pero incluso si planea contratar un nuevo equipo de ciencia de datos, es posible que su organización en su conjunto necesite repasar su alfabetización de datos, advierte Brownell. Todo el mundo quiere trabajar en algo que tenga un impacto en su lugar de trabajo, que mejore la vida de las personas, dice ella. Si la cultura de su empresa no es tal que [sus científicos de datos] puedan tener un impacto, es casi imposible contratarlos. El liderazgo debe ser capaz no solo de comunicar a los empleados potenciales cómo podrán contribuir, sino también de comprender las propuestas que su equipo de ciencia de datos finalmente presente.

Desafortunadamente, dice Brownell, la mayoría incómoda son las empresas que no han descubierto las cosas. Nuestra encuesta respalda esto: la mayoría de los encuestados (52 por ciento) describieron el nivel de alfabetización de datos en sus organizaciones como básico, siendo intermedio la siguiente respuesta más común (31 por ciento). Esto sugiere que cierta capacitación básica en ciencia de datos podría ser útil para la gran mayoría de las empresas, especialmente en el liderazgo.



Esta necesidad de mejorar la alfabetización de datos y la comunicación se ve acentuada por la forma en que la mayoría de los equipos de ciencia de datos están estructurados: como un equipo discreto, generalmente con 10 personas o menos (según el 71 por ciento de los encuestados) y, a menudo, cinco o menos (38 por ciento). ). Estos equipos muy unidos no pueden darse el lujo de estar aislados. Las personas que trabajan en empresas más grandes generalmente se encuentran dentro de un pequeño grupo específico de ciencia de datos, y sus clientes son internos: otras partes de la organización, explica Brownell, por lo que es un equipo que tiene que operar en muchas áreas diferentes de la organización.

¿Qué es exactamente la ciencia de datos?

La percepción común (que los científicos de datos procesan números) no está demasiado lejos de la realidad, dice Brownell. Hay una gran cantidad de conjuntos de datos que necesitan que se revelen conocimientos a partir de ellos, y eso implica muchos pasos, como la creación de modelos y la limpieza de datos, e incluso simplemente decidir qué datos necesita. Sin embargo, en última instancia, este esfuerzo está orientado a objetivos: en esencia, debe hacer algo con los datos.

De hecho, los datos no siempre son números. Si bien la mayoría de los encuestados (73 por ciento) indicó que trabaja con datos numéricos, el 61 por ciento dijo que también trabaja con texto, el 44 por ciento con datos estructurados, el 13 por ciento con imágenes y el 12 por ciento con gráficos (y una pequeña minoría incluso trabaja con video y audio). —6 por ciento y 4 por ciento respectivamente). Los resultados de esta encuesta insinúan las formas en que la ciencia de datos se está expandiendo mucho más allá de las tablas financieras, reclutando personas para proyectos tales como maximizar la satisfacción del cliente o recopilar información valiosa de la manguera contra incendios de las redes sociales.

Como resultado, existe una enorme variedad dentro del campo de la ciencia de datos, dice Brownell. Cada industria tiene su propia opinión sobre los tipos de datos en los que trabajan los científicos de datos, los tipos de resultados que esperan y cómo encajan en la estructura de liderazgo de su empresa. Sin embargo, en todos los casos, el objetivo es aprovechar los datos para ayudar a una empresa a tomar mejores decisiones. Eso podría ser mejorar los productos, comprender el mercado al que quieren ingresar, retener a más clientes, comprender el uso de su fuerza laboral, comprender cómo hacer buenas contrataciones, todo tipo de cosas diferentes.

Trabajos de ciencia de datos

En algunas áreas de tecnología, convertirse en un generalista puede ser su mejor paso en la puerta, no así con la ciencia de datos. Los empleadores suelen buscar habilidades especializadas en su industria. Debido a que la ciencia de datos viene en tantos sabores diferentes, nuestra encuesta investigó más profundamente, examinando cinco categorías laborales principales: analista de datos, investigador, analista de negocios, gerente de datos y análisis y científico de datos propiamente dicho.

En todos estos títulos de trabajo, la disputa y limpieza de datos ocupa la mayor parte del tiempo, pero ¿con qué fin? En la mayoría de los casos, el objetivo es optimizar una plataforma, producto o sistema existente (45 %) o desarrollar otros nuevos (42 %). Profundizando más, descubrimos que la optimización de las soluciones existentes tiende a recaer en los analistas de negocios y los analistas de datos, mientras que el desarrollo de nuevas soluciones recae más a menudo en los científicos e investigadores de datos.

Las técnicas que usan los científicos de datos también varían según las especializaciones. La regresión lineal fue una herramienta común en todas las categorías, citada por el 54 por ciento de los encuestados, pero hubo algunas sorpresas cuando observamos el software que usa la gente.

Excel, ese caballo de batalla de la manipulación de conjuntos de datos, es prácticamente omnipresente, citado por el 81 por ciento de todos los encuestados, y la herramienta más popular en todas las categorías, excepto los científicos de datos propiamente dichos (que confían con mayor frecuencia en Python, y también mencionaron un conjunto de herramientas más grande que otras categorías ). ¿Qué hace que Excel sea tan ineludible, incluso en 2019?

Lo que me encanta de Excel es cómo te permite ver los datos y tener una idea intuitiva de ellos, explicó Brownell. También usamos mucho Python y, en ese caso, cuando realiza análisis en un archivo de datos, está oculto; a menos que programe específicamente parte de su código para hacer una visualización de los datos sin procesar que está analizando, no lo verá. Mientras que con Excel, está justo frente a ti. Eso tiene muchas ventajas. A veces puede detectar problemas con el archivo de datos. No veo que Excel desaparezca nunca del análisis.

Dicho esto, todavía hay una larga lista de otros programas utilizados en el campo, lo que no sorprende dada su diversidad. SQL (43 por ciento) y Python (26 por ciento) lideran en popularidad, con Tableau (23 por ciento), R (16 por ciento), Jupyter Notebooks (14 por ciento) y un puñado de otros registrando números significativos, sin mencionar la enorme 32 por ciento de los encuestados que citaron otras herramientas, incluso teniendo en cuenta esta lista ya larga.

¿Cuál es el futuro de la ciencia de datos?

Finalmente, preguntamos qué tendencias darán forma al panorama digital en los próximos cinco a 10 años. El aprendizaje automático y la IA, que tienen aplicaciones dentro de la ciencia de datos, fueron abrumadoramente los desarrollos que los encuestados esperan que tengan el mayor impacto, con un 80 % y un 79 % respectivamente. Esto a pesar de que menos de una cuarta parte (23 por ciento) de ellos trabajan actualmente con IA.

La inteligencia artificial puede transformar absolutamente la ciencia de datos, confirma Brownell, cuya empresa desarrolla productos de IA. Esa es realmente la gloria de los métodos de aprendizaje no supervisados. Tenemos poco tiempo para mirar estos conjuntos de datos y, especialmente con los grandes, es muy difícil hacerlo todo. Las herramientas de IA pueden ayudar a revelar algo que quizás no hubieras pensado buscar. Definitivamente nos ha pasado eso.

Otras tendencias que los científicos de datos esperan dominar en un futuro próximo: Internet de las cosas (51 %), blockchain (50 %) y comercio electrónico (36 %), realidad aumentada y realidad virtual (38 % y 27 %) e incluso voz. Experiencias basadas (25 por ciento): todas las demostraciones significativas y todas las áreas en las que la ciencia de datos puede ser de utilidad.

Kategori: Noticias