في دورات تدريبية في التصور الثابت ستتعلم الأساليب المتقدمة لتصور الجينوم ، والتحليل القابل للتكرار ، وهندسة البيانات ، واستكشاف البيانات الجينومية التي تم إنشاؤها على نطاق السحابة.

ماذا ستتعلم

  • التصور الثابت والتفاعلي للبيانات الجينومية
  • طرق التحليل القابلة للتكرار
  • تمثيلات تجنيب الذاكرة للمقايسات الجينومية
  • العمل مع تجارب متعددة المرات في السرطان
  • الاستجواب المستهدف للأرشيفات الجينومية على نطاق السحابة

وصف الدورة التدريبية

في هذه الدورة ، نبدأ بأساليب تصور بيانات مقياس الجينوم ، ونوفر أدوات لبناء واجهات رسومية تفاعلية لتسريع الاكتشاف والتفسير. باستخدام knitr و rmarkdown كأدوات تأليف أساسية ، يتم تطوير مفهوم البحث القابل للتكرار ، ويتم تقديم مفهوم المستند القابل للتنفيذ. في هذا الإطار ، ترتبط التقارير ارتباطًا وثيقًا بالبيانات الأساسية والتعليمات البرمجية ، مما يعزز إمكانية استنساخ التحليلات المكتملة وقابليتها للتوسع.

 ندرس مناهج خارج الذاكرة لتحليل موارد البيانات الكبيرة جدًا ، باستخدام قواعد البيانات العلائقية أو HDF5 كـ “نهايات خلفية” مع واجهات R مألوفة. يتم توضيح تكامل البيانات المتعددة باستخدام نسخة منسقة من أطلس جينوم السرطان. أخيرًا ، نستكشف الموارد المقيمة في السحابة والتي تم تطويرها لموسوعة عناصر DNA (مشروع ENCODE).

نظرًا للتنوع في الخلفية التعليمية لطلابنا ، قمنا بتقسيم السلسلة إلى سبعة أجزاء. يمكنك أن تأخذ السلسلة بأكملها أو الدورات الفردية التي تهمك. إذا كنت إحصائيًا ، فيجب أن تفكر في تخطي أول دورتين أو ثلاث دورات ، وبالمثل ، إذا كنت من علماء الأحياء ، فيجب أن تفكر في تخطي بعض المحاضرات التمهيدية في علم الأحياء. لاحظ أن الجوانب الإحصائية والبرمجة للفصل تزداد صعوبة بسرعة نسبيًا عبر الدورات الثلاث الأولى. 

بحلول الدورة الثالثة ، سيتم تدريس المفاهيم الإحصائية المتقدمة مثل النماذج الهرمية ومهارات هندسة البرمجيات المتقدمة الرابعة ، مثل الحوسبة المتوازية ومفاهيم البحث القابلة للتكرار.