ProspectUS

Cette équipe est dédiée à l’étude de la méthodologie et au développement des systèmes pour la prospection des données. Le domaine de la prospection des données (Data Mining) est un domaine qui a connu des progrès phénoménaux dans les dix dernières années. À cause de la croissance grandissante des banques de données, le développement des méthodes automatiques pour l’analyse, la visualisation, l’extraction des patrons de connaissances, la classification et la prédiction est devenu indispensable dans de nombreux domaines tels que la finance, l’imagerie et les média, l’intelligence d’affaire, la recherche bio-médicale, la sécurité publique, le Web, etc.

Les intérêts de recherche de notre équipe portent sur la prospection des données de grande dimension et de données structurelles. Nous utilisons plusieurs approches : statistiques, structurelles, intelligence artificielle, apprentissage par machine, réseaux de neurones. Nous nous intéressons aux problématiques tels que l’analyse de faisceaux, la sélection des variable pertinentes ou prédictives, la classification, l’appariement de structures (chaines, arbres, graphes) et le regroupement de structures. Parmi des projets d’applications en cours, nous développons des systèmes pour rechercher et accéder à des informations de services géo-localisés directement à partir de l’Internet pour aider les conducteurs d’automobiles. Nous développons des méthodes pour analyser et classifier des données des clients de cartes de crédit pour prédire le risque de faillites. Nous développons également des algorithmes pour effectuer l’alignement multiple des séquences génomiques pour la recherche bio-médicale et l’appariement des schemas XML pour des applications Web.

Le laboratoire de prospection de données inclut actuellement trois professeurs : André Mayers, Ernest Monga et Shengrui Wang, et une dizaine d’étudiants au doctorat et à la maîtrise. Nous entretenons d’étroites collaborations avec d’autres équipes du Département d’informatique et avec le Département de mathématiques.

CLUSS: Clustering protein sequences based on a new similarity measure