Enroll Course: https://www.coursera.org/learn/big-data-integration-processing
Coursera의 ‘빅 데이터 통합 및 처리’ 과정 리뷰
데이터 과학의 기초를 배우고자 하는 이들을 위해, Coursera에서 제공하는 ‘빅 데이터 통합 및 처리’ 과정을 소개하고자 합니다. 이 과정은 빅 데이터의 기초를 이해하고, 간단한 빅 데이터 통합과 처리를 실행할 수 있는 능력을 배양할 수 있도록 설계되었습니다.
과정 개요
과정을 마치면 다음과 같은 능력을 갖추게 됩니다:
- 예제 데이터베이스 및 빅 데이터 관리 시스템에서 데이터 검색하기
- 대규모 분석 애플리케이션에서 활용하기 위한 데이터 관리 작업과 빅 데이터 처리 패턴 간의 연결 설명하기
- 빅 데이터 문제 해결을 위한 데이터 통합 필요성 인식하기
- Hadoop 및 Spark 플랫폼에서 간단한 빅 데이터 통합 및 처리 실행하기
주요 학습 내용
이 과정은 빅 데이터 전문 과정의 세 번째 강좌로, 아래와 같은 모듈로 구성되어 있습니다:
- 빅 데이터 검색 (1부): 데이터 검색 및 관계형 쿼리에 대한 기본 개념을 배우고, Postgres 데이터베이스를 소개받습니다.
- 빅 데이터 검색 (2부): NoSQL 데이터에 대한 검색 및 데이터 집합, 데이터 프레임 사용법을 배우며 MongoDB와 Aerospike에 대한 실습을 진행합니다.
- 빅 데이터 통합: Splunk와 Datameer 같은 데이터 통합 도구를 배우고, 정보 통합 프로세스를 실습합니다.
- 빅 데이터 처리: Apache Spark를 이용한 빅 데이터 파이프라인과 워크플로우에 대해 다룹니다.
- Spark를 이용한 빅 데이터 분석: Spark Core의 내부 기능 및 Spark MLlib, GraphX를 배웁니다.
- 실습: MongoDB와 Spark 활용하기: Twitter 데이터를 분석하기 위해 MongoDB와 Spark에 대한 실습 경험을 쌓습니다.
결론
‘빅 데이터 통합 및 처리’ 과정은 데이터 과학에 입문하려는 모든 이들에게 완벽한 선택입니다. 이론과 실습을 통해 빅 데이터의 세계에 쉽게 들어갈 수 있도록 도와주며, 향후 데이터 과학자로서의 경로를 여는 기회를 제공합니다. 특히, Hadoop과 Spark를 활용한 실제 경험은 매우 유용할 것입니다.
과정을 수강하고 싶은 분들은 Coursera에서 쉽게 신청할 수 있으니, 검색해 보시길 바랍니다!
Enroll Course: https://www.coursera.org/learn/big-data-integration-processing