|
|
STA211 - Entreposage et fouille de données [ 9 crédits ]
| Public Concerné |
être admis en M2 du master STIC, mention statistique ou être agréé : pour obtenir l'agrément, les auditeurs adresseront par courrier électronique à l'enseignant responsable : un CV détaillé et une lettre de motivation indiquant les raisons de la demande et le projet pédagogique dans lequel elle s'inscrit. Niveau requis : NFA. 008 (bases de données) et STA. 101 (analyse des données, méthodes descriptives).
|
Organisation |
| 9 Crédits |
Contenu de la formation |
Modéles prévisionnels et systèmes de gestion de l'entreprise - structures spécifiques des bases de données de Data warehouse (star schema) - OLAP Méthodologies générales - Management basé sur les données : 6 sigma - Normes de Data Mining : PMML (Prediction Modelling Markup Language), JDM (Java Data Mining), SQL-MM (multimedia) - Méthodologies de Data Mining : SEMMA (SAS), CRISP-DM Pré-traitement des données - Analyses de la qualité des données, - Techniques d'appréhension des valeurs manquantes ou aberrantes - Techniques de construction de bases de travail (agrégations, etc. . . ) Données et techniques de fouille Méthodes non supervisées : - Cartes de Kohonen, - Règles d'association et séquence mining Méthodes supervisées : - Rappels de théorie de l'apprentissage - Arbres de décision, - Réseaux de neurones - Réseaux bayesiens Méta-algorithmes : - boosting, bagging Fouille dans de nouveaux types de données et méthodes associées : - Données textuelles - Images et Multimedia - Données symboliques Outils : - Environnements freeware : Weka, Xelopes, Tanagra, Sodas - Outils spécifiques : SAS-EM, Kxen-Analytic, SPAD , DataLab - OLAP : Business Objects, Cognoss, Hypérion Performance Suite - Data Mining et bases de données : ODM (Oracle), DB2 Intelligent Miner (IBM), SQL Server 2000 Analysis Services (Microsoft) |
|
|
|