Courseraコースレビュー: 生産における機械学習データライフサイクル
Enroll Course: https://www.coursera.org/learn/machine-learning-data-lifecycle-in-production コース紹介 今回ご紹介するのは、Courseraの「生産における機械学習データライフサイクル」コースです。このコースは、機械学習エンジニアリングのための専門プログラムの第2コースにあたります。データパイプラインを構築し、データセットを収集、クリーニング、検証する方法を学びます。また、TensorFlow Extendedを使用して、特徴量エンジニアリングや変換、選択を実施し、データから最大限の予測力を引き出すことに焦点を当てています。 このコースを受講することで、データライフサイクルを確立し、データの進化を追跡するためにデータ系統と起源メタデータツールを活用する方法をマスターできます。 シラバスの概要 このコースは全4週間にわたり構成されています: Week 1: データの収集、ラベリング、検証 機械学習生産システムの簡単な概要を学び、TensorFlow Extended (TFX) ライブラリを活用して、データを生産準備状態にするための操作を体験します。 Week 2: 特徴量エンジニアリング、変換、選択 TFXを使って、構造化データと非構造化データをエンコードし、クラス不均衡に対処する方法を学びます。 Week 3: データの旅とデータストレージ 生産システムのライフサイクルにおけるデータの流れを理解し、すばやく進化するデータに対応するためのMLメタデータと企業スキーマを活用します。 Week 4 (オプション): 高度なラベリング、拡張、データ前処理 ラベル付きデータとラベルなしデータを組み合わせることでMLモデルの精度を向上させる方法を学び、データの多様化を図ります。 おすすめポイント…