CONSERVATOIRE NATIONAL DES ARTS ET METIERS
PICARDIE

STA211 - Entreposage et fouille de données  [ 9 crédits ]

Public Concerné
être admis en M2 du master STIC, mention statistique ou être agréé : pour obtenir l'agrément, les auditeurs adresseront par courrier électronique à l'enseignant responsable : un CV détaillé et une lettre de motivation indiquant les raisons de la demande et le projet pédagogique dans lequel elle s'inscrit.
Niveau requis : NFA. 008 (bases de données) et STA. 101 (analyse des données, méthodes descriptives).

Organisation
9 Crédits 

Contenu de la formation
Modéles prévisionnels et systèmes de gestion de l'entreprise
- structures spécifiques des bases de données de Data warehouse (star schema)
- OLAP
Méthodologies générales
- Management basé sur les données : 6 sigma
- Normes de Data Mining : PMML (Prediction Modelling Markup Language), JDM (Java Data Mining), SQL-MM (multimedia)
- Méthodologies de Data Mining : SEMMA (SAS), CRISP-DM
Pré-traitement des données
- Analyses de la qualité des données,
- Techniques d'appréhension des valeurs manquantes ou aberrantes
- Techniques de construction de bases de travail (agrégations, etc. . . )
Données et techniques de fouille
Méthodes non supervisées :
- Cartes de Kohonen,
- Règles d'association et séquence mining
Méthodes supervisées :
- Rappels de théorie de l'apprentissage
- Arbres de décision,
- Réseaux de neurones
- Réseaux bayesiens
Méta-algorithmes :
- boosting, bagging
Fouille dans de nouveaux types de données et méthodes associées :
- Données textuelles
- Images et Multimedia
- Données symboliques
Outils :
- Environnements freeware : Weka, Xelopes, Tanagra, Sodas
- Outils spécifiques : SAS-EM, Kxen-Analytic, SPAD , DataLab
- OLAP : Business Objects, Cognoss, Hypérion Performance Suite
- Data Mining et bases de données : ODM (Oracle), DB2 Intelligent Miner (IBM), SQL Server 2000 Analysis Services (Microsoft)