Enroll Course: https://www.coursera.org/learn/spark-sql
¿Por qué tomar este curso?
En el mundo actual de los datos, comprender y manejar grandes volúmenes de información es esencial. El curso ‘Computación Distribuida con Spark SQL’ es una excelente oportunidad para aquellos que ya tienen experiencia en SQL y desean avanzar en su carrera aprendiendo sobre computación distribuida utilizando Apache Spark.
Descripción general del curso
Este curso está diseñado para estudiantes que buscan profundizar su conocimiento en análisis de datos mediante el uso de Spark, un estándar de código abierto para trabajar con grandes datasets. A través de cuatro módulos cuidadosamente elaborados, los estudiantes adquirirán una comprensión sólida de la analítica de datos utilizando SQL en Spark, sentando las bases para combinar datos con análisis avanzados a gran escala.
Contenido del curso
1. Introducción a Spark: En este módulo, se discutirá la computación distribuida y se aprenderá a reconocer cuándo aplicarla. Se explorará el concepto de DataFrame en Spark y se enseñará a utilizar el entorno colaborativo de Databricks.
2. Conceptos fundamentales de Spark: Se explicarán los conceptos básicos de Spark, así como formas comunes de mejorar el rendimiento de las consultas mediante el almacenamiento en caché y la modificación de configuraciones de Spark. Se usará la interfaz de usuario de Spark para analizar el rendimiento y optimizar las consultas.
3. Ingeniería de tuberías de datos: Este módulo se centra en las demandas generales de las aplicaciones de datos. Se explorará el acceso a datos en formatos variados, con un enfoque en datos semi-estructurados como JSON, y se creará una tubería de datos de extremo a extremo.
4. Lagos de datos, almacenes de datos y lakehouses: Aquí se identificarán las características clave de cada uno. Se aprenderá a combinar las ventajas de un lago de datos con las garantías transaccionales de un almacén de datos, construyendo un lakehouse de grado de producción.
Recomendación
Recomiendo encarecidamente este curso a aquellos que, al igual que yo, desean dar el siguiente paso en su carrera de datos. No solo aprenderás sobre Spark, sino que también aplicarás ese conocimiento en un entorno práctico, lo que es invaluable en el mercado laboral actual. Al finalizar, tendrás las herramientas necesarias para manejar grandes volúmenes de datos y realizar análisis avanzados.
Enroll Course: https://www.coursera.org/learn/spark-sql