Techniques de fouille de données

Techniques de fouille de données

Responsable

Philippe LENCA

Co Responsable

Sorin MOGA
L'informatique décisionnelle (en anglais : DSS pour Decision Support System ou encore BI pour Business Intelligence) désigne les moyens, les outils et les méthodes qui permettent de collecter, consolider, modéliser, restituer et explorer les données recueillies ponctuellement ou accumulées au fil du temps au sein d'une organisation en vue d'offrir une aide à la décision.

Cette aide à la décision peut avoir différents d'objectifs, par exemple :
- l'identification d'une population particulière (des patients présentant une certaine pathologie)
- la segmentation d'une population (identifier les usages qui sont faits d'un service comme un site web, déterminer des profils d'investisseurs)
- la description de comportement (déterminer des règles du style " les gens achetant de la bière achètent également des chips ")
- la prévision par régression (prévoir la consommation d'électricité, le montant moyen des achats réalisés par un client) ou par classification (prévoir la classe de risque d'un emprunteur)

Des données à la décision, le chemin est long : la mise en place d'un projet d'informatique décisionnelle nécessite de respecter un processus découpé en plusieurs étapes (récupération et préparation des données, constitution d'un entrepôt de données, fouille des données, évaluation des résultats, etc). Cette UV permet de présenter les différentes approches et méthodes qui forment le socle théorique de l'informatique décisionnelle. Après avoir suivi l'UV, l'étudiant disposera d'une variété de méthodes et d'outils qui doivent lui permettre de résoudre la plupart des problèmes relevant de l'analyse de données et de l'informatique décisionnelle.
La discipline connaît depuis plusieurs années une forte expansion. Face aux besoins qualitatifs des entreprises, à la variété des méthodes disponibles, à la diversité des données (voix, image, etc.) et au rythme d'augmentation de leur volume, le domaine draine une large palette d'emplois allant de l'ingénieur d'études ou du chercheur en décisionnel (qui participe à la conception et au développement de systèmes décisionnels), du consultant décisionnel (qui participe aux différentes phases d'un projet : spécifications, conception, modélisation, alimentation, restitution et maintenance) jusqu'au manager (qui contrôle la mise en œuvre des projets). Les emplois sont nombreux et variés tant chez les SSII que chez les éditeurs et les grands comptes. Les compétences scientifiques recherchées sont variées et fortement liées au processus : analyse de données, apprentissage et bases de données, mais aussi les compétences métier du client final.

Les différentes étapes d'un projet décisionnel seront présentées. Un accent particulier sera porté sur l'étape d'exploration des données (la fouille des données) pour des objectifs de classification, de description, de prédiction et de régression. On s'intéressera également à la validité des résultats et aux méthodes de comparaisons des algorithmes.
Les travaux pratiques permettront aux étudiants de s'approprier les différentes méthodes d'analyse et solutions logicielles. En particulier on présentera la méthodologie CRISP-DM, la solution SAS Entreprise Miner et la méthodologie SEMMA associée.


Modalités d'évaluation
L'U.V. est évaluée par un projet avec remise d'un rapport et soutenance.

Langue

français

Campus

BREST

Compétences

  • Savoir appliquer ces techniques sur des problèmes réels à l'aide de logiciels de référence
  • Savoir concevoir une solution décisionnelle
  • Savoir proposer une solution argumentée
  • Connaître et comprendre les techniques de la fouille de données
  • Savoir évaluer, comparer et combiner ces techniques

ECTS

6

Modules