English Flag Deutsche Fahne Bandera española Bandeira brasileira Chinese flag

AgroParisTech

Le Vivant, notre vocation

Former, Chercher, Innover Pour l’avenir de l’agriculture, de l’alimentation et de la forêt.

Partager cette page imprimante Facebook Twitter

UC : Comment explorer le monde des données

Science des données, méthodes informatiques d’exploration et de visualisation de données

Contexte et objectifs

L’activité scientifique, marchande, sociale, de loisir, etc. génère désormais de très importants volumes de données. Une exploitation intelligente de ces données peut aider à mieux comprendre le monde, à aller vers une amélioration du fonctionnement des villes, des échanges, à une meilleure information des citoyens, à des services personnalisés plus performants, par exemple en médecine.
Cette exploitation des données requiert la mise en œuvre de compétences multiples : organisation des données, prétraitements, exploration, utilisation de techniques prédictives, utilisation de tests statistiques, etc.
Ce cours a pour but d’introduire les élèves aux techniques d’exploration des données par des méthodes multiples de visualisation, et par des techniques de recherche de régularités dites « non supervisées ».
À l’issue du cours, les élèves sauront mettre en forme une base de données afin qu’elle puisse être analysée par les outils de la sciences des données, sauront utiliser des techniques de visualisation adaptées à différents types de régularités, et sauront utiliser des techniques de clustering et de fouille de données pour faire ressortir des particularités des données.

Contenu et organisation

  • Introduction générale aux nouveaux problèmes des sciences des données
  • Exploration non supervisée des données : problèmes à résoudre
  • Nettoyage des données
  • Introduction aux techniques de visualisation des données
  • Algorithmes des k-moyennes et de clustering hiérarchique ascendant
  • Introduction à la fouille de données par recherche de motifs fréquents et de règles d’association
  • Réalisation d’un mini-projet

Pré-requis :
Le cours de "systèmes d’information" de tronc commun de 1A.

Projets

Les étudiants travailleront par groupes de 3 ou 4 et devront explorer des jeux de données réelles en vue d’en extraire des régularités permettant de mieux comprendre les phénomènes sous-jacents. Par exemple, ces données peuvent concerner des phénomènes climatiques, des productions agricoles dans certaines régions du monde sur plusieurs années, des diagnostics sur des chevaux, des productions de gaz à effet de serre dans des parcelles de la ferme expérimentale de Grignon, etc.

À l’issue de ce travail d’exploration, les étudiants devront présenter leurs résultats devant la classe, motiver leur méthodologie, évaluer les découvertes réalisées et proposer des perspectives sur ce qui pourrait être fait avec plus de données ou plus de temps et de moyens pour les analyser.

Sujet A
Sujet B
Sujet C
Sujet D
Sujet E
Sujet F
Sujet F_datas

Équipe pédagogique

E-mail : prénom.nom chez agroparistech.fr

Logiciels utilisés

AgroParisTech
16 rue Claude Bernard
F-75231 Paris Cedex 05
Tel: 33 (0) 1 44 08 18 43
Fax: 33 (0) 1 44 08 16 00
Localiser sur une carte

Se connecter
Intranet
Bureau virtuel
Annuaire, listes de diffusion
Cours en ligne AgroParisTech
Eduroam

Liens divers
Espace grand public
Actualités
Relations presse
Téléchargements
Adresses & plan d'accès
Contacts

Se repérer sur le site internet
Plan du site internet
Index des pages

Retrouvez nous sur
facebook ico twitter ico youtube ico daylimotion ico Suivre la vie du site


Logo Universite Paris Saclay Logo du Ministère de l'Alimentation, de l'Agriculture et de la Pêche Logo de ParisTech Logo de Agreenium


2007-2019 © AgroParisTech - Mentions légales