Enroll Course: https://www.coursera.org/learn/introduction-to-designing-data-lakes-in-aws
저는 최근 Coursera에서 Introduction to Designing Data Lakes on AWS라는 과정을 수강했습니다. 이 과정은 데이터 과학에 대한 사전 지식 없이도 다양한 교육을 제공하여 데이터 레이크의 기초를 이해하는 데 큰 도움을 주었습니다.
첫 주에는 데이터 레이크의 필요성과 특성, 그리고 데이터베이스 및 데이터 웨어하우스와의 차이를 다루었습니다. 강의가 매우 잘 구성되어 있어 데이터 레이크가 어떤 상황에서 유용한지를 직관적으로 이해할 수 있었습니다.
둘째 주에는 AWS의 다양한 데이터 레이크 아키텍처에서 사용될 수 있는 서비스들에 대해 학습했습니다. Amazon S3, AWS Glue, Amazon Athena 등 여러 서비스를 접할 수 있었고, 데이터 이동 및 처리를 위한 다양한 툴을 어떻게 사용할 수 있는지를 배웠습니다.
셋째 주에는 데이터 카탈로깅 및 데이터 수집에 대해 심도 있게 공부했습니다. AWS Transfer Family, Kinesis Data Streams와 같은 서비스의 특징과 사용 시기를 파악하는 것이 주된 내용이었습니다. 이 주에서는 주어진 상황에 기반하여 데이터를 처리할 적절한 시기를 결정하고, 적절한 AWS 서비스와 매치하는 능력을 키울 수 있었습니다.
마지막 주에는 데이터 최적화 및 데이터 처리에 대한 심층적인 내용을 다뤘습니다. 다양한 데모를 통해 성능과 비용을 최적화하는 다양한 팁을 주셨고, 데이터 보안 및 데이터 시각화 도구에 대해서도 알아볼 수 있었습니다.
전반적으로 이 과정은 데이터 레이크를 처음 다루는 사람들에게 매우 유익한 과정이며, 과정 중 배운 내용을 통해 실제 데이터 환경에서 데이터 레이크를 설계하고 운영하는 데 큰 도움이 될 것입니다. 데이터 관리에 관심이 있다면 이 강의를 추천합니다!
Enroll Course: https://www.coursera.org/learn/introduction-to-designing-data-lakes-in-aws