Enroll Course: https://www.coursera.org/learn/batch-data-pipelines-gcp-br
Si estás buscando una manera efectiva de gestionar y transformar datos en bloque, el curso ‘Building Batch Data Pipelines on GCP em Português Brasileiro’ de Coursera es una excelente opción. Este curso está diseñado para guiarte a través de los fundamentos de la creación de pipelines de datos utilizando tecnologías de Google Cloud Platform (GCP).
**Visión general del curso**
El curso se centra en la importancia de elegir el paradigma adecuado para la manipulación de datos, ya sea extracción-carga (EL), extracción-carga-transformación (ELT) o extracción-transformación-carga (ETL). Cada paradigma tiene su propósito y el curso ofrece orientación sobre cuándo utilizar cada uno basado en situaciones específicas con datos en lote.
**Contenido del curso**
1. **Introducción**
Este módulo nos prepara para el contenido del curso, presentándonos la programación y los objetivos.
2. **Introducción a la creación de pipelines de datos en lote**
Aquí se analiza a fondo los métodos de carga de datos, explicando el significado y el uso correcto de EL, ELT y ETL.
3. **Cómo ejecutar Spark en Dataproc**
Este módulo es fascinante ya que enseña a ejecutar Hadoop en Dataproc, además de cómo utilizar el Cloud Storage y optimizar los trabajos de Dataproc.
4. **Procesamiento de datos sin servidor con Dataflow**
Aprenderás a utilizar Dataflow para crear pipelines que no requieren servidores, una habilidad valiosa en el entorno actual.
5. **Gerenciamento de pipelines de dados com Cloud Data Fusion e Cloud Composer**
En este último módulo, se explora la gestión de pipelines, lo que es crucial para mantener un flujo de trabajo efectivo y eficiente.
6. **Resumo do curso**
Finalmente, el curso concluye con un resumen que refuerza lo aprendido.
En general, la calidad de la enseñanza y los recursos proporcionados en el curso son excepcionales. Se recomienda para aquellos que desean profundizar en el manejo de pipelines de datos usando GCP y desean hacerlo en un formato que es accesible y estructurado.
No solo es útil para principiantes, sino que también ofrece conocimientos avanzados que pueden beneficiar a profesionales en el diseño y gestión de sus flujos de datos. No pierdas la oportunidad de inscribirte y mejorar tus habilidades en el área de data engineering.
Enroll Course: https://www.coursera.org/learn/batch-data-pipelines-gcp-br