Fondamentaux de la science des données
Offered By: Université de Montréal via edX
Course Description
Overview
Les données sont omniprésentes dans nos vies modernes, et leur quantité est faramineuse. Elles peuvent nous être très utiles dans tous les domaines de l’activité humaine comme la santé, le commerce et l’environnement, pour n’en nommer que quelques-uns. Mais comment tirer profit de ces données sans s’y perdre? Le cours Science des données présente les concepts essentiels permettant de collecter les données, de les traiter statistiquement, de les vérifier, de les visualiser, de les structurer et de les analyser. Nous allons décrire certains algorithmes d'apprentissage automatique, et leurs applications aux données.
Ce cours s'adresse principalement aux professionnels du secteur et aux universitaires ayant des connaissances de base en mathématiques et en programmation (idéalement Python). Les étudiants diplômés en sciences et en ingénierie (principalement ceux qui ne sont pas encore familiarisés avec la science des données) peuvent trouver ce contenu instructif et convaincant. Le contenu de ce cours sera également d’une grande utilité pour quiconque utilise ou s’intéresse à la science des données, de quelque manière que ce soit.
Nous estimons qu’il faut environ 8 semaines pour suivre ce cours. Celui-ci est divisé en segments pertinents que vous pouvez regarder à votre propre rythme. Des quiz récapitulatifs sont prévus à la fin de chaque segment pour évaluer votre compréhension du contenu. Vous pourrez également mettre la main à la pâte en réalisant des exercices pratiques qui vous permettront de vous familiariser avec les principaux savoir-faire issus de la science des données.
Ce cours a été développé par des experts du domaine du département d’informatique et de recherche opérationnelle (DIRO) de l’université de Montréal.
L’Université de Montréal rayonne depuis de nombreuses années par la qualité de son enseignement et la diversité de son offre, ce qui en fait une des meilleures universités francophones au monde. Que vous choisissiez ce cours à titre personnel ou dans une perspective de carrière en science, le point de départ est ici. La matière parcourue vous permettra de vous préparer avant de commencer un programme d’études en science des données ou toute autre étude liée à ce domaine.
Nous vous souhaitons la bienvenue dans ce cours en sciences des données, une des pierres angulaires de l'intelligence artificielle.
Syllabus
Module 1 – Introduction et vulgarisation
- Introduction
- Survol des principaux thèmes
- Formation pratique 1 : Introduction à la syntaxe en Python
Module 2 – Méthodologie
- Introduction
- Méthodologie
- Formation pratique 2 : Manipulation, analyse et gestion de données
Module 3 – Les données structurées
- Introduction
- Données structurées
- Préparation et nettoyage
- Formation pratique 3 : Visualisation de données
Module 4 – Probabilités et statistiques
- Introduction
- Rappel des probabilités
- Distributions
- Probabilités et statistiques
- Formation pratique 4 : Analyse et traitement d’un jeu de données
Module 5 – Inférence probabiliste
- Introduction
- Probabilités conditionnelles
- Réseaux bayésiens
Module 6 – Prédiction
- Notions d’apprentissage automatique
- Les techniques de prédiction
- Formation pratique 6 : k-NN, sklearn et arbres de décision
Module 7 – Évaluation et sélection de modèles
- Introduction Sur-apprentissage et sous-apprentissage
- Évaluation du modèle
- Méthodes d’ensemble
- Conclusion
- Formation pratique 7 : Régression, biais et variance
Module 8 – Partitionnement des données
- Qu’est-ce que le partitionnement des données?
- Les techniques
- Indices de qualité de partitionnement
- Formation pratique 8 : Partitionnement, K-moyennes, GMM, DBSCAN
Module 9 – Réduction de dimensionnalité
- Qu’est-ce que la réduction de dimensionnalité?
- Les techniques
- Conclusion
- Formation pratique 9 : Réduction de dimensionnalité
Projet intégrateur : Confidentialité différentielle
Taught by
Alain Tapp and Mohamed Nabil Lokbani
Tags
Related Courses
Artificial IntelligenceMassachusetts Institute of Technology via MIT OpenCourseWare A Synthesis of Logical Reasoning and Word Learning Abilities in Children and Adults - 2007
Center for Language & Speech Processing(CLSP), JHU via YouTube AI & ML in Cyber Security - Why Algorithms Are Dangerous
Black Hat via YouTube Better Priors for Everyone - Choosing Prior Distributions in Bayesian Modeling
Finnish Center for Artificial Intelligence FCAI via YouTube Bayesian Models for Social Interactions - 2013
Center for Language & Speech Processing(CLSP), JHU via YouTube