Enroll Course: https://www.coursera.org/learn/spark-sql
إذا كنت مهتمًا بعالم البيانات الكبيرة وترغب في تحقيق قفزة كبيرة في مهاراتك في SQL، فإن دورة الحوسبة الموزعة مع Spark SQL المتاحة على منصة كورسيرا هي الخيار المثالي لك. تستهدف هذه الدورة الطلاب الذين يتمتعون بخبرة في SQL ويرغبون في استكشاف الحوسبة الموزعة باستخدام Apache Spark، وهي أداة مفتوحة المصدر تُستخدم بشكل واسع لمعالجة كميات ضخمة من البيانات.
يتضمن محتوى الدورة مواضيع مهمة مثل:
- مقدمة في Spark: ستحصل على فهم شامل للمفاهيم الأساسية للحوسبة الموزعة وستتعلم كيفية التعرف على الأوقات المناسبة لتطبيق هذه المفاهيم. ستتعلم أيضًا كيفية استخدام مساحة العمل التعاونية Databricks وكتابة أكواد SQL التي تعمل على مجموعة من الآلات.
- المفاهيم الأساسية لـ Spark: ستكتسب معرفة حول تحسين أداء الاستعلامات باستخدام تقنيات مثل تخزين البيانات في الذاكرة وتعديل إعدادات Spark. ستستخدم أيضًا واجهة Spark لتحليل الأداء وتحديد نقاط الاختناق.
- هندسة خطوط بيانات: ستتعلم كيفية الوصول إلى البيانات بتنسيقات متنوعة وتفاوت المزايا والعيوب بين هذه التنسيقات. سيتم استكشاف بيانات JSON شبه المنظمة، بالإضافة إلى إنشاء خط بيانات من البداية للنهاية.
- بحيرات البيانات، المستودعات و Lakehouses: ستتعلم عن الخصائص الأساسية لكل من بحيرات البيانات والمستودعات وLakehouses. ستقوم ببناء Lakehouse من الدرجة الإنتاجية من خلال دمج Spark مع مشروع Delta Lake المفتوح المصدر.
الدورة مثالية للمبتدئين الذين لديهم معرفة سابقة بـ SQL، لكنها أيضًا مناسبة للمحترفين الذين يرغبون في تحديث معرفتهم وتحسين مهاراتهم في التعامل مع البيانات الكبيرة. إن التعلم من خلال الوسائط التفاعلية والمشروعات العملية يعزز فهمك ويجعل المحتوى أكثر جاذبية.
ننصح بشدة بالتسجيل في هذه الدورة إذا كنت ترغب في توسيع مهاراتك وتحقيق تقدم ملحوظ في مجال تحليل البيانات الضخمة.
Enroll Course: https://www.coursera.org/learn/spark-sql