Enroll Course: https://www.coursera.org/learn/data-results
과정 개요
오늘은 Coursera에서 제공하는 ‘데이터 과학 결과 전달하기’ 과정에 대해 리뷰하고 추천하고자 합니다. 이 과정은 데이터 과학의 인사이트를 이해하고 효과적으로 전달하는 방법을 배우는 데 중점을 두고 있습니다. 특히 두 번째 과제에서는 Cloud에서 그래프 분석을 다루며, Elastic MapReduce와 Pig 언어를 사용하여 약 600GB의 대규모 데이터셋을 분석하는 경험을 가져보게 됩니다.
과제를 완료하기 위해 AWS(Amazon Web Services)를 사용해야 하며, Amazon은 이 과정에 참여하는 각 학습자에게 최대 $50의 무료 AWS 크레딧을 제공하여 과제를 완료할 수 있도록 지원하고 있습니다.
주요 모듈 설명
1. 시각화
우리는 대규모, 이질적이며 잡Noise가 있는 데이터셋에서 통계적 추론을 하더라도, 이를 동료나 고객, 경영진 및 기타 이해 관계자에게 효과적으로 전달하지 않으면 무용지물이 될 수 있습니다. 이 모듈은 인간 중심 디자인 및 공학 부서의 Cecilia Aragon 교수가 가르치며, 정보 시각화의 핵심 개념에 대해 학습할 수 있습니다.
2. 프라이버시 및 윤리
빅데이터는 프라이버시와 윤리 문제와 밀접하게 연관되어 있습니다. 데이터가 가지고 있는 잠재력을 최대한 활용하는 것이 가능해짐에 따라 데이터로 무엇을 할 수 있는지에 대한 질문보다, 데이터로 무엇을 해야 하는지가 더욱 중요해지고 있습니다. 이 모듈에서는 사례 연구를 바탕으로 데이터 과학과 통계 분석을 위한 행동 강령의 핵심 원칙을 배우게 됩니다.
3. 재현 가능성과 클라우드 컴퓨팅
과학계는 신뢰할 수 있는 재현 가능성 부족으로 위기에 처해 있으며, 자료가 점점 더 계산적으로 변해가면서 이 문제는 더욱 악화되고 있습니다. 그러나 재현 가능성은 학계에만 해당되는 것은 아닙니다. 자신의 방법을 공유하고 설명할 수 없는 데이터 과학자는 위험할 수 있습니다. 이 모듈에서는 재현 가능한 연구의 중요성과 클라우드 컴퓨팅이 코드, 데이터, 환경, 심지어 비용 공유를 위한 새로운 메커니즘을 제공하여 실제 재현 가능성을 높일 수 있는 방법을 탐구합니다.
마무리
‘데이터 과학 결과 전달하기’ 과정은 데이터 과학자들에게 필수적인 소통 능력을 키우는 데 큰 도움이 됩니다. 비록 도전적인 과제들이 있지만, 그만큼 얻는 것도 많습니다. 데이터에 대한 이해를 높이고 이를 효과적으로 전달하는 능력을 키우고 싶다면 이 과정을 꼭 추천합니다!
Enroll Course: https://www.coursera.org/learn/data-results