Logo ESI
Bannière
ESI talents

Bienvenue



Retour - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

Syllabus ANAD
Télécharger



Crédits : 4

ANAD
Analyse et fouille de données
Data Mining and Analysis

Coef : 4
VH Cours : 30.00
VH TD : 30.00
Pré-requis :
Statistiques et probabilités, Algèbre linéaire, Calcul numérique.

Ingénierie des Compétences

Familles de Compétences
  • CF6 : Concevoir des systèmes orientés données et/ou d'aide à la décision
Type de compétence: TEC : Technique, MET : Méthodologique, MOD : Modélisation, OPE : Opérationnel,
Niveau de compétence:
Base Intermédiaire Avancé


Famille de Compétence Compétence Elément de Compétence Type
CF6 C6.1: Ressortir l'information pertinente à partir d'une masse de données C61.1: Analyser les techniques de description multidimensionnelle (réduction, visualisation, clustering,…) MET
C61.2: Effectuer une modélisation statistique (régression, classification) sur une masse de données MOD
C6.3: Identifier les outils et technologies pour l'analyse de données C63.1: Mobiliser les outils pour traiter les données et interpréter les résultats TEC

Description du programme de la matière

Objectifs:

L’utilisation de l’analyse de données s’étend à des domaines très vastes, dont la reconnaissance de formes, Data mining, prédiction, marketing, biostatistique………
OBJECTIFS :
Présenter des techniques de descriptions multidimensionnelles (réduction, visualisation, clustering,…), de modélisation statistique (régression, classification) et on introduira la théorie de l’apprentissage utilisées en data mining nécessaire dans des champs d’applications très divers : industriels, marketing…. Le but est de ressortir l’information pertinente contenue dans une masse importante de données.
A l’issue de ce cours, les étudiants seront capables de mobiliser les outils pour traiter les données et interpréter les résultats des différentes mesures qu'ils rencontreront dans l'exercice de leur métier.

Contenu:

I. - Rappel (1h)
Algèbre linéaire, statistique descriptive, dérivation matricielle et optimisation de fonctions.
- Introduction au data mining.
- Définition, processus de data mining
II. Méthodes factorielles (Description, Réduction, Visualisation et Interprétation des données) (14h)
1. Analyse en composantes principales. 
2. Analyse factorielle des correspondances.
3. Analyse factorielle des correspondances multiples.
III. Fouille de données : Classification supervisée et non supervisée (15h)
1. Classification et Classement (Prédiction) de données
Introduction du principe d’apprentissage statistique
Analyse discriminante factorielle.
Classification automatique.
2. Modélisation et prévision
Régression simple et multiple.
ANOVA à 1 facteur et à 2 facteurs

Travail Personnel:

TD pour permettre à l’étudiant de manipuler les outils de l’analyse de données.
TPs sur des datasets et sur des données réels tels que ( le PV de délibération des étudiants) en utilisant des logiciels appropriés notamment R.

Bibliographie:

L. Lebart, A. Morineau, M. Piron, «  Statistique exploratoire multidimensionnelle », Dunod, 2006.
G. Saporta, « Probabilites Analyse des Données et Statistique », 3ème édition, Technip, 2011.
Ressources en ligne : http://www.math.univ-toulouse.fr/~besse/enseignement.html.
R. O. Duda, P.E. Hart, D.G. Stork, « Pattern classification », 2nd edition, Wiley and sons, 2001.
T. Hastie, R. Tibshirani, J. Friedman, «The elements of statistical learning. Data mining, inference and prediction », Springer, 2001.

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -