مسابقة التعلم الآلي في مجال علوم بيانات

  • تم تحديد التخصص: علوم البيانات
  • مسابقات

نقدم لكم Titanic ML مسابقة التعلم الآلي- التحدي الأول والأمثل لاستكشاف عمق مسابقات تعلم الآلة وفهم كيفية عمل منصة Kaggle.

إذا كنت تتوقع التواصل مع مشاركين آخرين حول هذه المسابقة، ندعوك للانضمام إلينا على Discord! يُتيح لك ذلك التواصل في قنوات مخصصة للمسابقة، وإعلانات الوظائف، والمناقشات المهنية، ومشاركة الموارد، بالإضافة إلى التواصل الاجتماعي مع زملائك من علماء البيانات.

تتلخص هذه المسابقة في مهمة بسيطة: استخدم تقنيات التعلم الآلي لبناء نموذج يتنبأ بالركاب الذين نجوا من كارثة غرق سفينة تيتانيك.

لمزيد من التفاصيل، يمكنك متابعة القراءة وحالما تكون جاهزًا للبدء في المنافسة، ببساطة انقر على زر “الانضمام إلى المنافسة” لإنشاء حسابك والوصول إلى بيانات المسابقة.

بعد ذلك، توجه إلى البرنامج التعليمي المخصص لمسابقة Titanic والذي أعده Alexis Cook، والذي سيقودك خطوة بخطوة في تقديم مشاركتك الأولى!

التحدي

في 15 أبريل 1912، شهد العالم غرق سفينة تايتانيك، وهي واحدة من أكثر حوادث غرق السفن إثارة للجدل في التاريخ.

تحطمت سفينة آر إم إس تايتانيك أثناء رحلتها الأولى، بعد اصطدامها بجبل جليدي في تاريخ 15 أبريل 1912. وعلى الرغم من سمعتها بأنها “غير قابلة للغرق”، فإن نقص عدد قوارب النجاة أدى إلى فقدان حياة 1502 شخصًا من إجمالي 2224 راكب وطاقم.

ورغم العوامل العديدة التي أثرت على من نجا، يبدو أن بعض الفئات احتمتلت بفرص أكبر للبقاء على قيد الحياة من غيرها.

في هذا التحدي المثير، ندعوك لبناء نموذج تنبؤ يجيب على السؤال التالي: “ما هي الفئات من الأشخاص الذين كانت لديها فرص أكبر للبقاء على قيد الحياة؟” من خلال استخدام بيانات الركاب، مثل الاسم والعمر والجنس والطبقة الاجتماعية والوضع الاقتصادي، وما إلى ذلك.

سجّل الآن بدون قراءة التفاصيل من هنا أو سجّل في موقع ستودي شووت للحصول على خدمة تجهيز الوثائق.

نظرة عامة على كيفية عمل مسابقات Kaggle:

  1. انضم إلى المسابقة:
    ابدأ بقراءة وصف التحدي بعناية وتأكد من فهم قواعد المسابقة. بمجرد قبولك للتحدي، ستحصل على وصول إلى مجموعة بيانات المسابقة.
  2. ابدأ في العمل:
    قم بتنزيل بيانات المسابقة وابدأ في إنشاء نماذج تنبؤ باستخدام هذه البيانات. يمكنك إنشاء النماذج على جهاز الكمبيوتر الخاص بك باستخدام بيئات محلية، أو يمكنك استخدام “Kaggle Notebooks”، وهي بيئة Jupyter Notebooks مُخصصة توفر وحدات معالجة رسومات مجانية لتسهيل العملية.
  3. قدم توقعاتك:
    بمجرد أن تكون راضيًا عن نموذجك، قم بتحميل توقعاتك كملف إرسال على منصة Kaggle. ستقوم المنصة بتقييم أداء نموذجك وتقديم درجة دقته.
  4. تحقق من التصنيف:
    يمكنك متابعة تصنيف نموذجك وأدائه مقارنةً بنماذج الآخرين على لوحة المتصدرين المتاحة على المنصة.
  5. تحسين درجاتك:
    لتحسين أداء نموذجك وزيادة فهمك، توجه إلى منتدى المناقشة المخصص للمسابقة. هناك ستجد برامج تعليمية وأفكارًا من مشتركين آخرين قد يساعدونك في تطوير نموذجك.

من خلال هذه الخطوات، ستكون قادرًا على المشاركة في مسابقات Kaggle وتحسين مهاراتك في تحليل البيانات وتطوير نماذج التنبؤ.

ستستخدم في هذه المسابقة مجموعتي بيانات، وهي كما يلي:

  1. مجموعة البيانات Train.csv:
    هذه المجموعة تحتوي على تفاصيل حول مجموعة فرعية من الركاب الذين كانوا على متن السفينة (إجمالي عددهم 891 راكبًا تقريبًا). والمعلومة الأكثر أهمية هنا هي ما إذا كان الركاب قد نجوا أو لم ينجوا (الحقيقة الأرضية).
  2. مجموعة البيانات Test.csv:
    هذه المجموعة تحتوي على معلومات مشابهة لمجموعة Train.csv، ولكنها لا تكشف عن النتائج الحقيقية لكل راكب. عليك استخدام الأنماط التي تم اكتشافها في مجموعة Train.csv للتنبؤ بما إذا كان الركاب في مجموعة Test.csv قد نجوا أم لا.

لتقديم توقعاتك إلى Kaggle:

  • قم بتنزيل ملف البيانات Test.csv.
  • قم بإنشاء نموذج تنبؤ باستخدام هذه البيانات.
  • قم بتوليد توقعاتك باستخدام النموذج.
  • انتقل إلى منصة Kaggle وانقر على زر “Submit Predictions” (تقديم التوقعات).
  • قم بتحميل ملف توقعاتك واتبع الخطوات لتقديمه.
  • سيتم تقييم توقعاتك وعرض درجة دقتك على لوحة المتصدرين.

لاحظ أن التحدي يتطلب توقعات للنجاة أو عدم النجاة، لذلك يجب أن يكون نموذجك قادرًا على توقع هذه القيمة لكل راكب في مجموعة البيانات Test.csv.

شكراً لتقييمك وملاحظاتك .

اذا كنت تريد تعديل قسم أو اضافة معلومات أخرى. فقط اذكرها لنا هنا.