Curso Gratis de Manipulación de Datos a Escala

El análisis de datos ha reemplazado a la adquisición de datos como el cuello de botella para la toma de decisiones basada en evidencia; nos estamos ahogando en ella.

Extraer conocimiento de conjuntos de datos grandes, heterogéneos y ruidosos requiere no solo recursos informáticos poderosos, sino también las abstracciones de programación para usarlos de manera efectiva.

Las abstracciones que han surgido en la última década combinan ideas de bases de datos paralelas, sistemas distribuidos y lenguajes de programación para crear una nueva clase de plataformas de análisis de datos escalables que forman la base para la ciencia de datos a escalas realistas.

En este curso, aprenderá el panorama de los sistemas relevantes, los principios detrás de ellos, sus compensaciones y cómo evaluar su utilidad frente a sus requisitos.

Aprenderá cómo se derivaron los sistemas prácticos de la frontera de la investigación informática y qué sistemas están en el horizonte.

Se cubrirán la informática en la nube, las bases de datos SQL y NoSQL, MapReduce y el ecosistema que generó, Spark y sus contemporáneos, y los sistemas especializados para gráficos y matrices.

También aprenderá la historia y el contexto de la ciencia de datos, las habilidades, los desafíos y las metodologías que implica el término, y cómo estructurar un proyecto de ciencia de datos. Al final de este curso, usted podrá:

Metas de aprendizaje:

Describir patrones, desafíos y enfoques comunes asociados con los proyectos de ciencia de datos y qué la diferencia de los proyectos en campos relacionados.
Identificar y utilizar modelos de programación asociados con la manipulación de datos escalables, incluidos el álgebra relacional, mapreduce y otros modelos de flujo de datos.
Usar tecnología de base de datos adaptada para análisis a gran escala, incluidos conceptos que impulsan bases de datos paralelas, procesamiento de consultas en paralelo y análisis en la base de datos.
Evaluar almacenes de valor clave y sistemas NoSQL, describir sus ventajas y desventajas con sistemas comparables, detalles de ejemplos importantes en el espacio y tendencias futuras.
“Piense” MapReduce para escribir algoritmos de manera efectiva para sistemas que incluyen Hadoop y Spark. Comprenderá sus limitaciones, detalles de diseño, su relación con las bases de datos y su ecosistema asociado de algoritmos, extensiones e idiomas, escribir programas en chispa
Describir el panorama de los sistemas de Big Data especializados para gráficos, matrices y flujos

Las habilidades que conseguirás

Álgebra relacional
Programación pitón
Pequeño mapa
SQL

Este curso es ofrecido por la Universidad de Washington

Fundada en 1861, la Universidad de Washington es una de las instituciones de educación superior financiadas por el estado más antiguas de la costa oeste y es una de las universidades de investigación más importantes del mundo.

Accede a este Curso

Si te ha parecido interesante y quieres inscribirte a este curso gratuito, solo debes dar clic o tocar el botón de aquí abajo. Recuerda que, al ser un sitio externo, este puede presentar fallas o retirar el curso sin previo aviso. ¡Éxito!

Programa Especializado

Inscríbete Aquí