Enroll Course: https://www.coursera.org/learn/developing-pipelines-on-dataflow
مقدمة
تعتبر الدورة “التعامل مع البيانات بدون خادم باستخدام Dataflow: تطوير الأنابيب” من كورسيرا واحدة من الدورات المتقدمة التي تتيح للمطورين والخبراء في بيانات الحوسبة السحابية فرصة استكشاف القدرة الحقيقية لأنابيب البيانات. هذه الدورة، التي تعد الجزء الثاني من سلسلة Dataflow، تقدم نظرة عميقة على كيفية تطوير أنابيب البيانات باستخدام Beam SDK.
نظرة عامة على الدورة
تبدأ الدورة بمراجعة مفاهيم Apache Beam، ثم تنتقل إلى كيفية معالجة البيانات المتدفقة باستخدام النوافذ، والمياه الرمادية، والإشارات. بعد ذلك، يتم مناقشة الخيارات المتعلقة بالمصادر والمخارج في أنابيبك، بالإضافة إلى التهيئات اللازمة للتعبير عن البيانات المنظمة.
برنامج الدورة
تتضمن الدورة عدة وحدات رئيسية:
– مراجعة مفاهيم Beam: تركز على كيفية كتابة أنابيب معالجة البيانات باستخدام المفاهيم الأساسية لـ Apache Beam.
– النوافذ، المياه الرمادية، والإشارات: تعلم كيفية معالجة البيانات المتدفقة وكيفية التحكم في نوافذ البيانات.
– المصادر والمخارج: استكشاف أنواع مختلفة من المصارد مثل BigQuery، وPubSub وغيرها.
– التهيئات: التعرف على كيفية استخدام التهيئات في أنابيب Beam.
– الحالة والموقتات: تعلم كيفية تنفيذ التحولات ذات الحالة باستخدام هذه الميزات.
– أفضل الممارسات: مناقشة الأنماط الشائعة التي تعزز الأداء.
– Dataflow SQL وDataFrames: تقديم واجهات برمجة التطبيقات الجديدة.
– دفاتر Beam: تعلم استخدام دفتر Jupyter لتطوير الأنابيب بشكل تفاعلي.
التوصية
إذا كنت تبحث عن تحسين مهاراتك في معالجة البيانات في سحابة Google، فإن هذه الدورة ستكون خيارًا ممتازًا. ستساعدك المعرفة المكتسبة في إنشاء أنابيب بيانات عالية الكفاءة وتطبيق أفضل الممارسات.
ختام
في النهاية، تعد دورة “التعامل مع البيانات بدون خادم باستخدام Dataflow” من كورسيرا فرصة مثيرة لتوسيع مهاراتك في مجال البيانات. أنصح بشدة بالتسجيل فيها وزيادة معرفتك في هذا المجال المتطور.
Enroll Course: https://www.coursera.org/learn/developing-pipelines-on-dataflow