Los ingenieros y científicos de datos prefieren usar Python (estudio)

Según un nuevo estudio, los científicos de datos, los desarrolladores de aprendizaje automático y los ingenieros de datos están recurriendo decisivamente al lenguaje de programación Python.

Un análisis de uso anual publicado esta semana por O’Reilly Media también encontró un cambio decidido hacia el diseño nativo de la nube para software, infraestructura de TI y DevOps. 

El estudio rastreó los términos de búsqueda más populares en la plataforma de O’Reilly en 2019. Los términos de búsqueda de más rápido crecimiento fueron «prácticas de codificación», que aumentaron casi un 40 por ciento interanual.

Otro tema candente a medida que los datos y las aplicaciones cambian a la nube fue la seguridad. Un par de certificaciones de seguridad desarrolladas por el grupo industrial CompTIA se dispararon durante el año pasado, lo que refleja la necesidad de más habilidades de seguridad a medida que las empresas se trasladan a la nube. 

En general, la seguridad registró el mayor crecimiento como búsqueda de temas en 2019, subiendo casi un 30 por ciento.


Mientras tanto, la creciente popularidad de Python fue impulsada por el desarrollo del aprendizaje automático. 

La encuesta encontró que el uso de Python para los proyectos de inteligencia artificial, aprendizaje profundo y procesamiento del lenguaje natural creció un 9 por ciento durante 2018.

Java ocupó el segundo lugar en 2019, pero el uso en realidad disminuyó ligeramente año tras año.

La encuesta también identificó un cambio creciente de la ciencia de datos directa al campo emergente de la «ingeniería de datos». Si bien la gestión de datos sigue siendo un requisito clave a medida que los volúmenes continúan aumentando, las búsquedas de ingeniería de datos crecieron a la tasa anual más rápida en 2019, según la encuesta.

“Hemos visto que las herramientas y los marcos populares generalmente incorporan capacidades de ingeniería de datos, ya sea en forma de funciones automáticas [o] de autoservicio guiadas o … la capacidad de construir y orquestar tuberías de ingeniería de datos que invocan bibliotecas Python [o] R para ejecutar trabajos de ingeniería de datos al mismo tiempo o, si es posible, en paralelo ”, encontró la encuesta.

Los autores agregaron que Jupyter y otros portátiles están entre las herramientas más populares para desarrollar esas canalizaciones de datos.

Deja un comentario