El siguiente curso gratuito está dirigido para todas aquellas personas interesadas en aprender sobre el Big Data.
Sobre el Curso (Por la Plataforma)
Bernard Marr define Big Data como la huella digital que estamos generando en esta era digital. En este curso, aprenderá sobre las características de Big Data y su aplicación en Big Data Analytics.
Obtendrá una comprensión de las características, los beneficios, las limitaciones y las aplicaciones de algunas de las herramientas de procesamiento de Big Data. Explorará cómo Hadoop y Hive ayudan a aprovechar los beneficios de Big Data mientras supera algunos de los desafíos que plantea.
Hadoop es un marco de código abierto que permite el procesamiento distribuido de grandes conjuntos de datos en grupos de computadoras utilizando modelos de programación simples.
Hive, un software de almacenamiento de datos, proporciona una interfaz similar a SQL para consultar y manipular de manera eficiente grandes conjuntos de datos que residen en varias bases de datos y sistemas de archivos que se integran con Hadoop.
Apache Spark es un motor de procesamiento de código abierto que brinda a los usuarios nuevas formas de almacenar y utilizar big data.
Es un motor de procesamiento de código abierto creado en torno a la velocidad, la facilidad de uso y el análisis. En este curso, descubrirá cómo aprovechar Spark para brindar información confiable. El curso proporciona una descripción general de la plataforma, adentrándose en los diferentes componentes que componen Apache Spark.
En este curso, también aprenderá sobre conjuntos de datos distribuidos resistentes, o RDD, que permiten el procesamiento paralelo en los nodos de un clúster de Spark.
Qué aprenderás
- Explicar el impacto de Big Data, incluidos los casos de uso, las herramientas y los métodos de procesamiento.
- Explique la arquitectura, el ecosistema y las prácticas de Apache Hadoop, y use aplicaciones relacionadas, incluidas HDFS, HBase, Spark y MapReduce.
- Aplique los conceptos básicos de programación de Spark, incluidos los conceptos básicos de programación paralela para DataFrames, conjuntos de datos y Spark SQL.
- Use los conjuntos de datos y RDD de Spark, optimizando SparkSQL con Catalyst y Tungsten, y use las opciones de entorno de tiempo de ejecución y desarrollo de Spark.
Instructores
- Karthik Muthuraman – Ingeniero de Software
- Aije Egwaikhide – Científico de Datos sénior
Ofrecido por
IBM es el líder mundial en transformación empresarial a través de una plataforma de nube híbrida abierta e IA, y atiende a clientes en más de 170 países de todo el mundo.
En la actualidad, 47 de las 50 empresas de Fortune confían en IBM Cloud para administrar sus negocios, y la IA empresarial de IBM Watson está trabajando arduamente en más de 30 000 compromisos.
IBM es también una de las organizaciones de investigación empresarial más vitales del mundo, con 28 años consecutivos de liderazgo en patentes. Sobre todo, guiada por los principios de confianza y transparencia y el apoyo a una sociedad más inclusiva, IBM se compromete a ser un innovador tecnológico responsable y una fuerza para el bien en el mundo.
Programa (Contenido)
¿Qué es Big Data?
Comience su adquisición de conocimientos de Big Data con la definición más actualizada de Big Data. Explorará el impacto de Big Data en las tareas personales cotidianas y las transacciones comerciales con casos de uso de Big Data.
Descubra cómo Big Data utiliza el procesamiento en paralelo, el escalado y el paralelismo de datos. Obtenga información sobre las herramientas de Big Data más utilizadas. Luego, vaya más allá de la exageración y explore puntos de vista adicionales de Big Data.
Videos: 7
Duración: 42 Minutos
Introducción al ecosistema de Hadoop
En este módulo, obtendrá una comprensión fundamental de la arquitectura, el ecosistema, las prácticas y las aplicaciones de uso común de Apache Hadoop, incluido el sistema de archivos distribuido (HDFS), MapReduce, HIVE y HBase. Obtenga habilidades prácticas en el laboratorio de este módulo cuando inicie un clúster de Hadoop de un solo nodo con Docker y ejecute trabajos de MapReduce.
Videos: 6
Duración: 37 Minutos
Chispa Apache
Desarrolle sus habilidades cuando dirija su atención a la popular plataforma Apache Spark. Explore los atributos y beneficios de Apache Spark y la computación distribuida.
Obtendrá información clave sobre la programación funcional y las funciones de Lambda. Explore los conjuntos de datos distribuidos resistentes (RDD), la programación paralela, la resiliencia en Apache Spark y relacione los RDD y la programación paralela con Apache Spark.
Sumérjase en los componentes adicionales de Apache Spark y aprenda cómo Apache Spark escala con Big Data. Trabajar con Big Data señala la necesidad de trabajar con consultas, incluidas las consultas estructuradas que utilizan SQL.
Conozca las funciones, las partes y los beneficios de las consultas de Spark SQL y DataFrame, y descubra cómo funcionan los DataFrames con SparkSQL.
Videos: 5
Duración: 24 Minutos
Marcos de datos y SparkSQL
Obtenga información sobre los conjuntos de datos distribuidos resistentes (RDD), sus usos en Apache Spark y las transformaciones y acciones de RDD. Comparará el uso de conjuntos de datos con la abstracción de datos más reciente de Spark, DataFrames.
Aprenderá a identificar y aplicar operaciones básicas de DataFrame. Explore la optimización de Apache Spark SQL. Descubra cómo Spark SQL y la optimización de la memoria se benefician del uso de Catalyst y Tungsten. Aprenda a crear una vista de tabla y aplicar técnicas de agregación de datos. Fortalezca sus habilidades guiado a través del laboratorio práctico.
Videos: 5
Duración: 26 Minutos
Opciones de entorno de desarrollo y tiempo de ejecución
Explore cómo Spark procesa las solicitudes que envía su aplicación. Descubra cómo puede realizar un seguimiento del trabajo con la interfaz de usuario de la aplicación Spark.
Debido a que el trabajo de la aplicación Spark ocurre en el clúster, debe poder identificar los administradores de clústeres de Apache, sus componentes, beneficios y saber cómo conectarse con cada administrador de clústeres y cómo y cuándo es posible que desee configurar una instancia de Spark local e independiente.
Videos: 6
Duración: 33 Minutos
Monitoreo y ajuste
Las plataformas y aplicaciones requieren supervisión y ajuste para gestionar los problemas que inevitablemente suceden. En este módulo, aprenderá a conectar el servidor web de la interfaz de usuario de Apache Spark y a usar el mismo servidor web de la interfaz de usuario para administrar los procesos de la aplicación. Identificar problemas comunes de la aplicación Apache Spark.
Obtenga información sobre la depuración de problemas mediante la interfaz de usuario de la aplicación y la ubicación de archivos de registro relacionados. Descubra y obtenga conocimientos del mundo real sobre cómo Spark administra la memoria y los recursos del procesador a través de videos y en el laboratorio práctico disponible.
Videos: 5
Duración: 30 Minutos
Preguntas Frecuentes
¿Cuándo podré acceder a las lecciones y tareas?
El acceso a las clases y las asignaciones depende del tipo de inscripción que tengas. Si tomas un curso en modo de oyente, verás la mayoría de los materiales del curso en forma gratuita. Para acceder a asignaciones calificadas y obtener un certificado, deberás comprar la experiencia de Certificado, ya sea durante o después de participar como oyente. Si no ves la opción de oyente:
- Es posible que el curso no ofrezca la opción de participar como oyente. En cambio, puedes intentar con una Prueba gratis o postularte para recibir ayuda económica.
- Es posible que el curso ofrezca la opción ‘Curso completo, sin certificado’. Esta opción te permite ver todos los materiales del curso, enviar las evaluaciones requeridas y obtener una calificación final. También significa que no podrás comprar una experiencia de Certificado.
¿Qué recibiré si me suscribo a este Certificado?
Cuando te inscribes en un curso, obtienes acceso a todos los cursos del Certificado y te darán un certificado cuando completes el trabajo. Se añadirá tu Certificado electrónico a la página Logros. Desde allí, puedes imprimir tu Certificado o añadirlo a tu perfil de LinkedIn. Si solo quieres leer y visualizar el contenido del curso, puedes auditar el curso sin costo.
Inscríbete al Curso
Si te ha parecido interesante puedes inscribirte en el curso con el botón de aquí abajo.
¿Quieres Más?
Encuentra cursos y libros gratuitos, además de cupones de Udemy, en nuestros Telegram.