Familles de Compétences
-
CF6 : Concevoir des systèmes orientés données et/ou d'aide à la décision
Type de compétence:
TEC : Technique,
MET : Méthodologique,
MOD : Modélisation,
OPE : Opérationnel,
|
Niveau de compétence:
Base |
Intermédiaire |
Avancé |
|
Description du programme de la matière
Objectifs: | L’utilisation de l’analyse de données s’étend à des domaines très vastes, dont la reconnaissance de formes, Data mining, prédiction, marketing, biostatistique……… OBJECTIFS : Présenter des techniques de descriptions multidimensionnelles (réduction, visualisation, clustering,…), de modélisation statistique (régression, classification) et on introduira la théorie de l’apprentissage utilisées en data mining nécessaire dans des champs d’applications très divers : industriels, marketing…. Le but est de ressortir l’information pertinente contenue dans une masse importante de données. A l’issue de ce cours, les étudiants seront capables de mobiliser les outils pour traiter les données et interpréter les résultats des différentes mesures qu'ils rencontreront dans l'exercice de leur métier. |
Contenu: | I. - Rappel (1h) Algèbre linéaire, statistique descriptive, dérivation matricielle et optimisation de fonctions. - Introduction au data mining. - Définition, processus de data mining II. Méthodes factorielles (Description, Réduction, Visualisation et Interprétation des données) (14h) 1. Analyse en composantes principales. 2. Analyse factorielle des correspondances. 3. Analyse factorielle des correspondances multiples. III. Fouille de données : Classification supervisée et non supervisée (15h) 1. Classification et Classement (Prédiction) de données Introduction du principe d’apprentissage statistique Analyse discriminante factorielle. Classification automatique. 2. Modélisation et prévision Régression simple et multiple. ANOVA à 1 facteur et à 2 facteurs |
Travail Personnel: | TD pour permettre à l’étudiant de manipuler les outils de l’analyse de données. TPs sur des datasets et sur des données réels tels que ( le PV de délibération des étudiants) en utilisant des logiciels appropriés notamment R. |
Bibliographie: | L. Lebart, A. Morineau, M. Piron, « Statistique exploratoire multidimensionnelle », Dunod, 2006. G. Saporta, « Probabilites Analyse des Données et Statistique », 3ème édition, Technip, 2011. Ressources en ligne : http://www.math.univ-toulouse.fr/~besse/enseignement.html. R. O. Duda, P.E. Hart, D.G. Stork, « Pattern classification », 2nd edition, Wiley and sons, 2001. T. Hastie, R. Tibshirani, J. Friedman, «The elements of statistical learning. Data mining, inference and prediction », Springer, 2001. |
|