Le MOOC «Fondamentaux pour le big data» permet d'acquérir efficacement le niveau prérequis en informatique et en statistiques pour suivre des formations dans le domaine du big data et data science.

Le big data offre de nouvelles opportunités d’emplois au sein des entreprises et des administrations. De nombreuses formations préparant à ces opportunités de métiers existent.

Le suivi de ces formations nécessite des connaissances de base en statistiques et en informatique que ce MOOC vous propose d’acquérir dans les domaines de l’analyse, algèbre, probabilités, statistiques, programmation Python et bases de données.

À la fin de ce cours, vous serez capable de :

  • Pourquoi les bases de données relationnelles ne sont pas toujours adaptées aux systèmes de données massives qui sont déployées dans les contextes big data.
  • Pourquoi le langage Python est un langage très utilisé dans le domaine du traitement des masses de données. Ce cours vous initie à la programmation avec ce langage, particulièrement en utilisant la bibliothèque Numpy.
  • Quelles analyses statistiques nécessitent le traitement des données massives et la prédiction.

Cette formation vous fournit les concepts élémentaires en statistiques tels que :

  • les variables aléatoires,
  • le calcul différentiel,
  • les fonctions convexes,
  • les problèmes d'optimisation,
  • les modèles de régression.

Ces bases sont appliquées sur un algorithme de classification le Perceptron.

more_horiz Lire moins
report_problem

Les prérequis

Ce MOOC s'adresse à un public ayant des bases en mathématiques et en algorithmique (niveau L2 validé) nécessitant un rafraichissement de ces connaissances pour suivre des formations en data science et big data.
Il peut être suivi en préparation du Mastère Spécialisé « Big data : Gestion et analyse des données massives », du Certificat d’Etudes Spécialisées « Data Scientist » et de la formation courte «Data Science : Introduction au Machine Learning».

dns

Le programme

Semaine 0 : Introduction - Les enjeux du Big Data et de ce MOOC
Semaine 1 : Python Partie 1 / Algèbre Partie 1
Semaine 2 : Limites des bases de données relationnelles / Python Partie 2/ Algèbre Partie 2
Semaine 3 : Probabilités Partie 1 / Analyse Partie 1
Semaine 4 : Probabilités Partie 2 / Analyse Partie 2
Semaine 5 : Statistique
Semaine 6 : Le classifieur Perceptron