شهادة في البيانات الضخمة المتقدمة وتحليلها - التعلّم الافتراضي Meirc Plus Speciality Training

شهادة في البيانات الضخمة المتقدمة وتحليلها - التعلّم الافتراضي

لمحة عامة

البيانات الضخمة هي عامل تغيير يتحدى الطرق التي يتخذ بها قادة المنظمات قراراتهم تقليديًا. تقدم هذه الدورة للمشاركين الثقة لتخزين ومعالجة وتحليل وتقديم حالات استخدام البيانات الضخمة داخل منظماتهم. تقدم هذه الدورة العديد من المختبرات العملية باستخدام Spark، وهي تقنية رئيسية في البيانات الضخمة تُستخدم لحل المشكلات التي تتطلب بيانات كثيفة. سيكتسب المشاركون المعرفة والمهارات التي يحتاجونها لتجميع وإدارة مشروع تحليلات بيانات ضخمة على نطاق واسع. وأخيرًا، سيعمل المشاركون على حالات استخدام التعلم الآلي المتقدم والتعلم العميق.

تعد هذه الدورة الأكثر تقدمًا في سلسلة الدورات الخاصة بنا في البيانات الضخمة، بعد دورة "خبير معتمد في البيانات الضخمة وتحليلها" وشهادة "شهادة في أساسيات البيانات الضخمة". سيهدف المشاركون إلى تحديد المجالات داخل منظماتهم التي يمكن تحسينها من خلال حالات استخدام البيانات الضخمة، والعمل على مشروع بيانات فردي يختارونه خلال الدورة. بنهاية الدورة، سيتمكن المشاركون على استخدام عدة طرق وأساليب عملية للاستفادة من Spark لتحليل البيانات الضخمة المتقدم.

Meirc Plus Speciality Training
استفسار سريع أعد الإتصال بي
نظرة عامة
المنهجية

ستكون هذه الدورة تقنية للغاية مع مناقشات جماعية، وتمارين عملية تطبيقية، وأنشطة جماعية كتركيز أساسي.

أهداف الدورة

سيتمكن المشاركون في نهاية الدورة من:

  • فهم تقنيات البيانات الضخمة الرئيسية، بما في ذلك دراسة معمقة لـ Apache Spark
  • وصف التحديات الرئيسية وفوائد Hadoop map-reduce
  • عرض ومناقشة التقنيات الرئيسية لتخزين البيانات الضخمة والحوسبة، مثل PostgreSQL والتخزين الكائنات
  • مناقشة الخوارزميات الشائعة في التعلم الآلي، تقنيات التعلم العميق وأهمية الأخلاقيات في تحليل البيانات والذكاء الاصطناعي
  • تقديم عرض تقديمي يظهر دورة حياة التحليلات و Spark
الفئات المستهدفة

هذه دورة على مستوى متقدم. من المتوقع أن يكون لدى المشاركين عدد من سنوات الخبرة في استخدام البيانات الضخمة، أو أن يكونوا قد حضروا دورة "خبير معتمد في البيانات الضخمة وتحليلها" سابقًا. هذه الدورة مثالية لمهندسي البيانات، مهندسي الذكاء الاصطناعي، وعلماء البيانات. تشمل المعرفة المسبقة الموصى بها بعض الخبرة في برمجة Python وممارسة تحليل البيانات.

الكفاءات المستهدفة
  • استخدام البيانات الضخمة
  • هياكل وتقنيات تحليلات البيانات الضخمة
  • الأخلاقيات والنزاهة في تطوير البيانات الضخمة والذكاء الاصطناعي
  • تخزين البيانات الضخمة
  • أفضل الممارسات لـ Apache Spark
محتوى الدورة
  • حالات استخدام تحليل البيانات الضخمة
    • كيف يمكن لمشروعات البيانات الضخمة تلبية احتياجات المنظمة
    • أمثلة على البيانات الضخمة:
      • نتفليكس (Netflix)
      • لينكد إن (LinkedIn)
      • فيسبوك (Facebook)
      • جوجل (Google)
      • أوربيتز (Orbitz)
      • ديل (Dell)
      • أخرى
    • أفضل الممارسات في تصميم المشاريع
    • تقييم الحالة الحالية لمنظمتك
    • اختيار مجموعات البيانات لمشاريع الدورة
  • تخزين البيانات الضخمة
    • هياكل ونماذج البيانات الضخمة
      • نظام Hadoop البيئي
        • نظرة عامة على Hadoop
        • نظام Hadoop للملفات الموزعة (HDFS)
      • المعالجة المتوازية بشكل ضخم (MPP) مقابل التطبيقات الموزعة في الذاكرة
      • قواعد البيانات العلائقية (RDBMS) مقابل قواعد البيانات غير العلائقية (NoSQL DBs)
        • PostgreSQL
        • MongoDB
        • Cassandra
      • البيانات المتدفقة
    • تخزين البيانات مقابل مستودع البيانات
    • مقدمة ل Apache Spark
    • مختبرات SQL للبيانات الضخمة
  • حساب البيانات الضخمة
    • كيفية الوصول إلى البيانات الضخمة
      • دور الحوسبة السحابية
      • مخاطر حركة البيانات
      • الشبكات والموقع المشترك
      • مختبر Apache Spark
    • استخراج وتحويل وتحميل البيانات الضخمة (ETL) وتقنيات الحوسبة للبيانات الضخمة
      • الحوسبة الموزعة
      • العناقيد العالية الأداء مقابل Apache Spark
      • البيانات المتدفقة: Storm، Spark Structured Streaming
    • مختبرات Apache Spark ETL
    • هندسة البيانات باستخدام Apache Spark
  • تحليل البيانات الضخمة المتقدمة والذكاء الاصطناعي
    • دورة حياة التحليلات
    • Apache Spark مقابل Pandas
    • التعلم الآلي العميق والتعلم الآلي للبيانات الضخمة في Spark
    • أهمية الأخلاقيات في الذكاء الاصطناعي
    • أتمتة التعلم وضبط المعاملات (Automl & Hyperparameter tuning)
  • مشاريع البيانات الضخمة للدورة
    • تحديد الفرص التحليلية في المنظمة
      • تعريف وتقييم المشكلة
      • وصف تأثير واستخدام البيانات لحل المشكلة
      • تحديد مصادر البيانات المحتملة
      • تصميم مشروع تحليل البيانات
    • الوصول إلى مجموعة البيانات المختارة واستكشافها وتحليلها وتصويرها للمشروع
    • تقديم رؤى المشروع في الدورة
شهادة ميرك المعتمدة (MPC)
MPC Certifications
شهادة ميرك المعتمدة (MPC)

تهدف الدورات المعتمدة التي تقدمها ميرك للتدريب والاستشارات الى تمييز المشاركين المستعدين لتحدي أنفسهم بهدف التعلم. فعند اتمام الحضور الكامل لدورة معتمدة والانتهاء من الاختبار في اليوم الأخير بنجاح، يحصل المشاركون على شهادة خاصة أو معتمدة بالإضافة إلى شهادة الحضور. هذه الشهادات معترف بها إقليميا ويمكن أن تكون ذات قيمة عند التقدم للحصول على ترقية أو من أجل مزايا أعلى داخل المنظمة أو خارجها.

قائمة بالتخصصات معتمد
الجدول الزمني والرسوم
الاتصال...بالطبع
اتصل بي اذا كان لديك أي أسئلة.
أنا أتحدث الإنجليزية والعربية!