Enroll Course: https://www.coursera.org/learn/batch-data-pipelines-gcp-br

소개

현대 데이터 엔지니어링에서는 효과적인 데이터 파이프라인 구축이 필수적입니다. Coursera에서 제공하는 ‘Building Batch Data Pipelines on GCP em Português Brasileiro’는 이러한 필요를 충족시키는 훌륭한 강좌입니다. 이 코스는 특히 Google Cloud Platform(GCP)을 사용하여 배치 데이터 파이프라인을 구축하는 방법을 심도 있게 다룹니다.

코스 개요

이 코스는 데이터 파이프라인의 기본 구조와 다양한 데이터 파이프라인 구축 모델에 대해 설명합니다. EL, ELT, ETL의 사용 시나리오를 배우고, 또한 Spark를 Dataproc에서 실행하는 방법과 Cloud Storage 최적화에 대해 다룹니다. Dataflow를 활용한 서버리스 데이터 처리 방법과 Cloud Data Fusion 및 Cloud Composer를 통한 데이터 파이프라인 관리 방법도 배울 수 있습니다.

강의 구성

1. **Introdução**: 강의 소개 및 일정 설명
2. **Introdução à criação de pipelines de dados em lote**: 데이터 로딩 방법에 대한 분석
3. **Como executar o Spark no Dataproc**: Dataproc에서 Hadoop 실행 방법 및 Cloud Storage 사용법
4. **Processamento de dados sem servidor com o Dataflow**: Dataflow를 통한 데이터 처리 파이프라인 구축
5. **Gerenciamento de pipelines de dados com**: Cloud Data Fusion 및 Cloud Composer를 통한 데이터 파이프라인 관리
6. **Resumo do curso**: 코스의 요약 및 정리

추천 이유

이 코스는 데이터 엔지니어링에 대한 기초 지식이 없더라도 이해할 수 있도록 구성되어 있습니다. 각 모듈은 실용적인 예시와 함께 제공되어 이론을 실제로 적용할 수 있는 능력을 키울 수 있습니다. 또한 포르투갈어로 진행되므로 브라질 포르투갈어를 사용하는 이들에게 최적의 선택이 될 것입니다.

결론

배치 데이터 파이프라인을 구축하는 방법에 대해 배우고 싶다면, 이 Coursera 코스는 꼭 수강해보길 추천합니다. GCP의 다양한 툴과 기술을 활용하여 데이터 파이프라인을 효과적으로 관리하는 방법을 배우게 될 것입니다!

Enroll Course: https://www.coursera.org/learn/batch-data-pipelines-gcp-br