Este curso trata sobre los enormes datos. Es para alumnos con vivencia en SQL que aspiran ofrecer el siguiente paso en su viaje de datos al aprender computación distribuida utilizando Apache Spark.

Los alumnos obtendrán una comprensión intensa de este estándar de código abierto para laborar con monumentales conjuntos de datos.

Los alumnos obtendrán una comprensión de los fundamentos del estudio de datos usando SQL en Spark, sentando las bases referentes a cómo combinar datos con estudio avanzados a escala y en espacios de producción.




Coursera prueba gratis

Los 4 módulos se complementan entre sí y, finalmente del curso, comprenderá: la arquitectura de Spark, las consultas en Spark, las maneras usuales de optimizar Spark SQL y cómo generar canalizaciones de datos confiables.

El primer módulo muestra Spark y el ámbito de Databricks, incluida la manera en que Spark distribuye la computación y Spark SQL.

El módulo 2 cubre los conceptos básicos de Spark, como almacenamiento ante cómputo, almacenamiento en caché, particiones y resolución de inconvenientes de rendimiento por medio de la interfaz de cliente de Spark.

Además cubre las novedosas funcionalidades de Apache Spark 3.x, como la ejecución de consultas adaptativas. El tercer módulo se concentra en la ingeniería de canalizaciones de datos, incluida la conexión a bases de datos, esquemas y tipos de datos, formatos de documento y escritura de datos fiables.

El módulo final cubre lagos de datos, almacenes de datos y viviendas de lagos. Los alumnos construyen canalizaciones de datos de nivel de producción al combinar Spark con el plan de código abierto Delta Lake.

Lo que aprenderás:

  • Utilice el espacio de trabajo colaborativo de Databricks para escribir código Spark SQL escalable que se ejecuta en un clúster de máquinas.
  • Inspeccione la interfaz de usuario de Spark para analizar el rendimiento de las consultas e identificar cuellos de botella
  • Cree una canalización de extremo a extremo que lea datos, los transforme y guarde el resultado
  • Cree una arquitectura de lago medallón (bronce, plata, oro) con Delta Lake para garantizar la confiabilidad, la escalabilidad y el rendimiento de sus datos


Las habilidades que obtendrás:

  • Ciencia de los datos
  • chispa apache
  • lago delta
  • SQL

Los temas del curso son:

  1. Introducción a la chispa
  2. Conceptos básicos de Spark
  3. Canalizaciones de datos de ingeniería
  4. Lagos de datos, almacenes y casas lago

Este Curso es Ofrecido por la Universidad de California, Davis

UC Davis, una de las universidades de investigación mejor clasificadas del país, es líder mundial en agricultura, medicina veterinaria, sustentabilidad, ciencias ambientales y biológicas y tecnología. Con cuatro universidades y seis escuelas profesionales, UC Davis y sus estudiantes y ex alumnos son conocidos por su excelencia académica, servicio público significativo y profundo impacto internacional.

Además, forma parte de un programa especializado

Esta especialización está destinada a un alumno sin experiencia previa en codificación que busca desarrollar fluidez en las consultas SQL.

A través de cuatro proyectos de SQL progresivamente más difíciles con aplicaciones de ciencia de datos, cubrirá temas como los conceptos básicos de SQL, la disputa de datos, el análisis de SQL, las pruebas AB, la computación distribuida con Apache Spark, Delta Lake y más.

Estos temas lo prepararán para aplicar SQL de manera creativa para analizar y explorar datos; demostrar eficiencia en la redacción de consultas; crear conjuntos de datos de análisis de datos; realizar ingeniería de funciones, usar SQL con otros conjuntos de herramientas de análisis de datos y aprendizaje automático; y use SQL con conjuntos de datos no estructurados.



Accede a este Curso

Si te ha parecido interesante y quieres inscribirte a este curso gratuito, solo debes dar clic o tocar el botón de aquí abajo. Recuerda que, al ser un sitio externo, este puede presentar fallas o retirar el curso sin previo aviso. ¡Éxito!



Encuentra cursos y libros gratuitos, además de cupones de Udemy, en nuestros Telegram.


Jesús Amaro

Si lees esto, es por que sabes leer. Un saludo...