Columnistas
Algo de cultura de ciencia de datos
Las empresas y organizaciones enfrentan actualmente la realidad de inmensos avances: tecnológicos, conectividad, internet y ciencia de datos; lo cual demanda nuevas estructuras, procesos, funciones y empleados. Lo requerido es complejo y exige especialistas. Aquí presentamos muestras sencillas de algunos temas sensitivos y varias referencias, como forma de abordar en parte la complejidad del tema y la inmensa diferencia con lo tradicional.
El ganador del premio Turing, Jim Gray, imaginó la CIENCIA DE DATOS como un «cuarto paradigma» de la ciencia (empírico, teórico, computacional, y ahora con base en datos), y afirmó que «todo lo relacionado con la ciencia está cambiando debido a la tecnología de la información y el diluvio de datos». Según Gartner, un “Citizen Data Scientist” crea modelos que aprovechan el análisis predictivo o prescriptivo, pero cuya función principal está fuera del campo de la estadística y el análisis. Los “Citizen Data Scientists” no pueden reemplazar a los “Expert Data Scientists”; son complemento de los roles de análisis existentes, participan en el proceso con el “Expert Data Scientist” quien valida esos modelos dice Ganeshan.
BUILD WITH GOOGLE CLOUD:
En 2020, las cifras del universo digital son 44 zettabytes, o 44 billones de gigabytes, según IDG- International Data Group. Con un volumen creciente de datos para analizar y una creciente competencia para contratar científicos de datos capacitados, las organizaciones deben encontrar formas de cultivar ciencia de datos. Una cultura de ciencia de datos lleva el concepto de «Citizen Data Scientists» un paso más allá, extendiendo su impacto en toda la organización. Las empresas pueden enfrentar este desafío capacitando a empleados como «Citizen Data Scientists» con acceso a datos y herramientas.
Organizaciones que logren una cultura de ciencia de datos estarán mejor equipadas para los beneficios de Big Data.
AUGE DEL CITIZEN DATA SCIENTIST: TIENEN LA RESPONSABILIDAD DE SACAR CONCLUSIONES ESTADÍSTICAMENTE PRECISAS CON BASE EN DATOS. FUE UNA VEZ COMPETENCIA EXCLUSIVA DE LOS CIENTÍFICOS DE DATOS PROFESIONALES. Pero para 2018, según McKinsey, «solo EEUU podría enfrentar una escasez de 140,000 a 190,000 personas con habilidades analíticas profundas, así como 1.5 millones de gerentes y analistas con el conocimiento para usar el análisis de Big Data «.
Citizen data scientists-quienes, como se define en Information Week, son personas que aprovechan el análisis de datos, para ser un poderoso complemento a los científicos de datos internos, especialmente para cultura de ciencia de datos.
Los análisis sofisticados pueden mejorar sustancialmente la toma de decisiones, mitigar los riesgos y descubrir información valiosa que de otro modo permanecería oculta. INSTITUTO GLOBAL MCKINSEY
FORBES- extractos de: Citizen Data Scientist: un nuevo rol clave en la transformación Pedro P. Morcillo 28/05/2020
“Las empresas se están descubriendo y adaptando que no necesitan tener un científico de datos altamente educado para cada rol de datos”.
La actual coyuntura ha permitido ser conscientes de la interrelación existente entre la Inteligencia Artificial (IA) y los datos. Los modelos predictivos son tan confiables como confiables sean los datos que se les proporcionen al crearlos. Hoy mas que nunca es importante tener presente que el 90% de los datos que se manejan en todo el mundo se ha generado en los últimos dos años. Ante tal avalancha de datos, la compleja tarea de analizar estos datos se encarga a los científicos de datos: ingenieros con doctorados, estadísticos, físicos y matemáticos.
Debido a que las empresas, particularmente las más grandes con operaciones analíticas más maduras de Big Data, están descubriendo que es un tema demasiado importante como para dejarlo únicamente en manos de los científicos de datos, porque simplemente no hay suficientes; son muy necesarios, y las personas con esta formación profesional continuarán desempeñando un papel crucial. Cada vez hay mas herramientas y servicios para análisis de grandes volúmenes de datos.
Gartner define a un Citizen Data Scientist como “una persona que crea o genera modelos que aprovechan el análisis predictivo o prescriptivo, pero cuya función principal de trabajo está fuera del campo de la estadística, física y Machine Learning avanzado. Cubren la brecha entre análisis prácticos y usuarios de negocio y análisis científicos de datos.
Los analistas de Gartner IT predijeron que la demanda de estas personas aumentará 5 veces más rápidamente que la demanda de científicos de datos “tradicionales”, altamente calificados. Incluso en el mercado colombiano ya es posible encontrar profesionales en publicidad y mercadeo expertos en programación en R Studio y/o Pytnon que les permite diseñar modelos analíticos avanzados a partir de datos estructurados y no estructurados, que han aprendido estas habilidades en plataformas de educación en línea como Platzi, con herramientas tales como Power BI o Tableau.
Las empresas están descubriendo y se están adaptando a que no necesitan tener un científico de datos altamente educado para cada rol de datos. El promedio de estas empresas solo requiere profesionales con el conjunto de habilidades y capacitación adecuadas para abordar tareas específicas. Da lugar a un nuevo papel emergente: El Citizen Data Scientist.
El pronóstico se basa en modelos matemáticos y estadísticos tradicionales; el análisis predictivo utiliza el aprendizaje automático o ML (Machine Learning), la inteligencia artificial (AI) y otros análisis avanzados para predecir/pronosticar.
Y en Colombia, compañías como Nutresa y Alpina están haciendo lo propio en esta época, por exigencia de los clientes.
Hay lo siguiente: INVESTIGACION CUANTITATIVA: Data estructurada, análisis estadístico, conclusiones objetivas, Surveys, experimentos; INVESTIGACIÓN CUALITATIVA: Data no estructurada, conclusiones subjetivas, entrevistas, Focus Groups.
RESUMEN: Gartner define a un Citizen Data Scientist, como alguien que genera modelos que aprovechan el análisis de diagnóstico avanzado o las capacidades predictivas y prescriptivas, pero cuya función principal de trabajo está fuera del campo de la analítica. Aunque. los investigadores de Gartner señalan que los Citizen Data Scientist proporcionan un papel complementario a los científicos de datos profesionales.
Lo descrito muestra la escasez de científicos de datos, sobre lo cual hay lo siguiente: las universidades trabajan para reducir la brecha, se les pide a los gerentes de negocios que «piensen como científicos de datos», se promueve a los analistas a «Citizen Data Scientists» y el software avanzado busca dar a los analistas poderes similares a los de los científicos de datos. Muy diferente a industrias, empresas y organizaciones tradicionales.
Adicionalmente, observamos la CIENCIA DE DATOS como un «cuarto paradigma» de la ciencia, muy diferente a lo tradicional.
Todo esto, es crucial que la dirección y gerencia de organizaciones y empresas actuales lo tengan en cuenta y manejen.