 | Master d'Informatique M2-RADI Projets 2005-2006 |  |
|
SommaireSujets
libre
1. Mise en oeuvre de la caméra d'un robot et algorithme de vision.
Projet
Nous proposons un projet autour de la
robotique collective. Ce projet est autour de la planification de
tâches dans le domaine du pilotage d'une colonie de robots, en
utilisant les robots physiques KOALA. Les robots KOALA sont
équipés de capteurs et de caméras pour les problèmes de la
perception des robots.
Ce projet nous permettra, de mettre en oeuvre quelques scénarios de
la robotique collective, autonome, communicante avec des applications
réelles autour de la robotique domestique, exploratoire, de loisir
et de gestion de situation de crise. Le but de ce projet de mettre en
oeuvre le module de la vision des robots KOALA et de les évaluer
dans un exemple décrit en détail ci-dessous.
Exemple de scénario
Nous disposons d'un terrain rectangulaire en mélaminé blanc. Ce terrain
représente le monde dans le lequel les robots vont évoluer.
Ce monde est décomposé en six zones :
- La zone 1 est la base de départ des robots.
- La zone 2 est la zone d'activité. Elle est composées de deux zones :
- La zone 2a de chalandise
- La zone 2b de dépôt
- Les zones 4a et 4b sont les couloirs de retour
La zone 2 est physiquement représentée par un ensemble de trois
lignes noires sur le sol. La ligne verticale faisant la démarcation
entre la zone 1 et la zone 2, les lignes horizontales faisant la
démarcation entre la zone de chalandise et les couloirs de retour.
Dans la zone de départ (zone 1), aucun marquage au sol n'est
présents, les robots n'ont pas de zone de départ fixe. Dans
la zone de chalandise (zone 2a), il n'existe, là encore, aucun
marquage au sol. Les cubes sont placés à différents endroits au bon
vouloir d'expérimentateur. Dans la zone de dépôt (zone 2b), la
position finale des cubes est physiquement marquées sur le sol. Ce
marquage est formé par une tâche de la couleur du cube entourée par un
marquage noir.
Ce type de marquage permet de faire rapidement
la discrimination entre un marquage au sol (2D) et un objet physique
(3D) (ce problème est important car il ne faut pas oublier que lors du traitement
de l'image en provenance de la caméra, il est très difficile de faire la
différence entre un marquage et un objet. Cela permet ainsi de simplifier le
problème).
Situation initiale
Situation finale
Le déroulement du scénario est le suivant :
- La situation initiale S_i est définie par :
- Les robots sont alignés dans la zone de départ (zone 1).
- Les cubes sont placés dans la zone de chalandise (zone 2a).
- les zones 2b (dépôt), 4a et 4b sont dégagées.
- La situation finale S_f est définie par :
- Les robots sont dans la zone de départ (zone 1).
- Les cubes sont placés dans la zone de dépôt (zone 2b), chaque cube à sa place.
- les zones 2a (chalandise), 4a et 4b sont dégagées.
En cours d'exécution, les robots ne peuvent se déplacer que dans le sens
départ ==> dépôt, le retour (dépôt ==> base) s'effectuant
uniquement en empruntant les couloir prévu à cet effet.
Les seules connaissances des robots au départ sont :
- la reconnaissance des objets ;
- la reconnaissance des marquages au sol ;
- qu'il faut placer les cubes sur les zones marquées.
Les positions initiales des robots, des cubes ainsi que la
forme géométrique à réaliser ne sont pas connus à l'avance.
Objectifs du projet Reconnaître la forme des
différents objets perçus par la caméra du robot KOALA. À chaque
couleur correspond un cube d'un certain poids et d'une certaine
taille, il est ainsi possible d'établir un protocole d'étalonnage afin
de déterminer la distance séparant la caméra de l'objet.
- Démarrage de la caméra du robot Koala.
- Acquisition d'images.
- Analyse des images et détection d'objets recherchés.
- Embarquer l'outil sur le robot.
- Le robot doit se diriger vers les objets reconnus à partir de l'image.
Matériels disponibles
2. Étude d'une architecture reseau pour la résolution parallèle de problèmes décisionnels.
Les Processus Décisionnels de Markov (PDM) [ Puterman1994 ]
sont depuis quelques années communément utilisés dans la communauté de
l'Intelligence Artificielle pour modéliser et résoudre des problèmes
de décision séquentielle dans l'incertain. Leur capacité à prendre en
compte à la fois l'aspect dynamique et incertain des processus
modélisés les placent comme bon candidats pour modéliser et résoudre
des problèmes complexes (gestion de risques industriels et
environnementaux, robotiques, applications aérospatiales, ...). Cette
technique, très efficace pour modéliser les environnements dynamiques
et incertains, est largement utilisée pour une variété de problèmes de
décision stochastique et séquentielle. Des algorithmes permettant de
résoudre ces processus sont mis en oeuvre et ils permettent de
déterminer un comportement optimal. Mais, ces processus sont aussi
connus par leurs limites dont la plus importante est la grande taille
de l'espace d'états issue d'une description fine de
l'environnement. Cette limite réduit le champ d'application réelles de
cette technique.
Les objectifs du projet Ces processus de
décision sont en général représentés comme des arbres de décision,
plus au moins sophistiqués. Ces arbres de tailles trés grandes qui se
comptent en millions de noeuds. L'objectif de ce projet et de répartir
la résolution de cet arbre sur plusieurs processeurs où chaque
processeur est en charge de résoudre une partie de l'arbre et par
communications les processeurs s'échangent des informations pour
compléter la résolution de tout l'arbre. Cette technique qui
fonctionnent nécessite un grand nombre de messages échangés entre les
processeurs. Ce nombre de message doit être quantifié pour les
différents mécanismes de communication proposés.
Étapes du projet
- Se familiariser avec les arbres de décisions et plus particulièrement les processus décisionnels.
- Mettre en place un programme d'implémentation de l'approche centralisée et ses limites.
- Passage à l'approche distribuée décrite dans les articles ci-dessous cités.
Matériels disponibles
- "Towards a technique of solving in Parallel Very Large Markov Decision Processes".
- "Parallel and Distributed Computation : Numeric Methods", MIT Press, Chapitre 4.
3. Interface d'accès à l'information
géographique. Le groupe Infodoc travaille depuis
de nombreuses années sur la modélisation et l'accès à l'information
géographique. De nombreux travaux ont été réalisés pour permettre
d'accéder à différentes formes de l'information. Certains des travaux
visent à structurer l'information a priori [TURBOUT02, CHUFFART04],
d'autres a posteriori [MALANDAIN00, FAUROT04, GEOSEM]. D'autres
travaux visent à faciliter l'accès à l'information grâce à différentes interfaces :
- OhRAGE : permet d'accéder à l'information sous forme d'hypertexte dynamique [TURBOUT02].
- L'Anté-Serveur Géographique grâce à une interface bimodale texte-graphique [LIMAM03, DUMONCEL03].
- PLACIDES,
une interface java utilisant Openmap pour accéder à l'information grâce
à une représentation spatiale de l'information sur un espace
géographique sélectionné[TURBOUT02].
Travail à réaliser
Les
différents outils ayant évolué, il est désormais possible d'implémenter
PLACIDES, l'interface entièrement spécifiée dans [TURBOUT02]. Une
première réalisation a été réalisée par un projet de master pro en
2004-2005, elle a permis de spécifier l'interface de sélection des
différentes caractéristiques de l'information géographique souhaitée.
Le but du projet de cette année est d'intégrer ces différentes
réalisations pour aboutir à un outil utilisable. Le travail consiste à
: - Caractériser les différentes sources
d'informations disponibles (atlas électroniques, SGDB, fichiers XML,
entrepôt de données géographiques, etc.) et réaliser un modèle d'accès
à chacune des sources.
- Utiliser le web service de GEOSEM pour indexer
selon les critères spatiaux, temporels et thématiques les différentes
sources d'information et obtenir ainsi des index interogeables.
- Intégrer
l'interface de sélection multi-critères développée l'an passée dans une
palette de configuration d'Ompg, surcouche d'Openmap développée par le
laboratoire.
- Définir une nouvelle couche d'Ompg pour afficher la sélection réalisée.
- Visualiser les informations ainsi obtenues selon deux modes (méta-données et données).
Connaissances requises
La connaissance de Java est requise pour ce projet.
Bibliographie
- Openmap, et un schema UML décrivant l'extension ompg.
- [CHUFFART04],
Florent Chuffart, 204. « Analyse des processus de Reconstruction de
documents géographiques », stage de DEA, septembre 2004. Memo(géo)doc
- [DUMONCEL03],
Franck Dumoncel, Mohamed Ould Ahmed Limam, Mauro Gaio, 2003. «
Interaction avec feedback sémantique pour l'accés à l'information
géographique », IHM 2003 - 15e Conférence Francophone sur l'Interaction
Homme-Machine - Caen - France.
- [FAUROT04],
Antoine Widlöcher, Eric Faurot, Frédérik Bilhaut, 2004. « Multimodal
Indexation of Contrastive Structures in Geographical Documents ». In
Proceedings of RIAO 2004, pages 555-570, Avignon, France.
- GEOSEM : Traitements sémantiques pour l'Information géographique : textes, cartes, graphiques.
- [LIMAM03],
Mohamed Ould Ahmed Limam, 2003. « Interaction avec feedback sémantique
dans un environnement dédié à la recherche d'informations géographiques
», thèse de doctorat d'informatique, Université de Caen, septembre 2003.
- [MALANDAIN00],
Nicolas Malandain, « La relation Texte/Image, Essai de Modélisation
dans un Corpus Géographique », Thèse de doctorat, Université de Caen,
Décembre 2000.
- [TURBOUT01], Christophe Turbout,
Mauro Gaio et Jacques Madelaine, « PlACIDES : Plateforme d'Aide à la
Construction d'Information Dynamique électronique Spatialisée »,
H2PTM'01 : nouvelles écritures, nouveaux langages, Hermès Sciences,
Valenciennes, France, pages 17--30, octobre 2001.
- [TURBOUT02],
Christophe Turbout, « Construction d'hypertexte et recherche
d'informations hétérogènes : la spécificité de l'information
géographique », Thèse de doctorat d'informatique, Université de Caen,
juillet 2002.
4. Une application Web pour la mise en oeuvre d'un robot.
Ce projet consiste à capitaliser,
autour d'une application Web, quelques outils pour le développement de
programmes d'un robot. Ces outils se compose de trois modules : - Un module Interface programmeur : ce module
offre une interface qui permet au programmeur de définir un plan
d'actions du robot, qu'on appelle aussi mission sous un langage de
plans nommé PRUs développé en PERL. Ce module génère un fichier texte
qui soumis au deuxième module de contrôle.
- Module
Controle : qui a partir du fichier texte contenant une mission du robot
exprimée en PRUs envoyé par le module interface génère une politique de
comportement qui permet au robot de décider quoi faire et à quelle
moment. Ce module est programmé C/C++ qui a comme sortie un autre
fichier texte qui est envoyé au troisième module simulation.
- Simulateur reçoit un fichier du module
contrôle pour interpreter la politique (ou stratégie) afin d'obtenir
une simulation de la mission du robot. Ce simulateur utilise la
bibliotheque graphique Mesa.
Travail demandé
Le travail demandé est de revoir ces trois modules afin d'en faire une application Web :
- Améliorer la partie interface qui génèrerait des documents xml à la place du texte.
- Le module Contrôle restera une boîte noire alors que la simulation nécessite un lifting voir un re-dévelopement "From Scratch".
- L'application doit être accessible à tout utilisateur pour tester l'outil de simulation de scénario robotique.
libre
5. Primitives graphiques pour Musichall Picture.
Le Musichall Picture est un projet
artistique de génération automatique de musique à partir d'images. Dans
sa version actuelle, le logiciel analyse les pixels d'une image et
convertit les informations de couleur ou de luminosité en événement
MIDI (le MIDI est le standard de communication pour les instruments de
musique).
Travail demandé
Le projet consiste à étendre les primitives graphiques disponibles pour
élargir les possibilités de génération musicale. Quelques pistes :
- analyse d'une courbe tracée à la main ;
- analyse de l'écriture, du texte ;
- détection de contour.
Technologies
6. Outils de transformation de données.
Objectif L'objectif de ce projet est de réaliser
des outils de calcul pour des bases de données XML.
Dans un processus de
modélisation, le jeu de données est le coeur du
problème. Celui-ci doit être des plus rigoureux afin de
garantir la justesse du modèle. Or dans un tel processus, les
étapes de transformations sont étroitement liées aux types de
données possibles. La fusion de descripteurs en est une et consiste
en la combinaison de plusieurs descripteurs existant en un seul afin
d'exprimer une connaissance implicite du domaine (que l'expertise
garantit).
Exemple :
soit deux descripteurs textuel d'un enregistrement de la base, nous voulons pourvoir produire comme nouveaux
descripteurs :
- Le nombre de caractères commun à ces deux descripteurs
- La plus longue sous-chaîne commune
Travail demandé Ce projet a donc pour finalité une interface Internet
permettant de lire un XMLSchema, d'afficher les éléments de celui-ci et de
permettre à l'utilisateur la création de combinaisons de descipteurs
en prenant en compte ceux existant. Une fois les nouveaux descripteurs
identifiés et définis, l'interface doit être en mesure de générer
le nouveaux jeu de données en fonction des nouveaux descripteurs,
principe même d'une XSLT. L'étudiant devra surtout réflechir au
moyen de définir les opérateurs de transformation pour en permettre
une accessibilité et une utilisation des plus aisée.
7. Etude simulée des interactions entre humains et robots.
Objectif général On cherche à explorer de façon amusante
et pédagogique toutes les formes d'interaction possibles entre
des robots mobiles comme ceux de l'équipe Mad et entre ces robots et
des humains.
Ce projet utilisera le simulateur de robots pour éviter
les problèmes liés à l'interprétation des capteurs et à la précision
des effecteurs. On partira d'une étude des interactions entre les
humains pour voir celles qu'on pourra reproduire et celles qu'on ne
pourra pas reproduire : marcher au pas, chanter en choeur, applaudir,
se lancer une balle et la rattraper, dire bonjour, demander l'heure.
Bien sûr la reproduction demandée est très libre, on peut utiliser des
astuces comme dans les dessins animés.
8. Etude réelle des interactions entre humains et robots.
Objectif général On cherche à explorer de façon amusante
et pédagogique toutes les formes d'interaction possibles entre
des robots mobiles comme ceux de l'équipe Mad et entre ces robots et
des humains.
Ce sujet aura pour but de mettre en place des interactions avec les vrais robots donc :
- de spécifier les capteurs et effecteurs nécessaires pour certains buts,
- de voir s'il faut ajouter un ordinateur sur le robot pour utiliser son écran et son clavier,
- d'explorer la faisabilité dans des conditions concrètes de ces
interactions, par exemple, trouver dans quelles conditions les humains
qui voient un robot vont chercher à interagir avec lui (ajout d'un
dessin de visage sur le robot par exemple, ou bruits produits par le
robot au passage des humains), regarder si c'est plus facile quand il
y a deux robots en interaction, si la présence d'autres personnes est
facilitante.
Le but serait de pouvoir placer ces robots dans le couloir et qu'il se
passe des interactions intéressantes scientifiquement à
observer.
Matériels disponibles
libre
9. Cartographie de forums de discussion
Mots clés TAL, forums de discussion, cartographie thématique.
Cadre d'étude Dans le cadre de
recherche en Informatique et plus particulièrement en Traitement
Automatique (TAL), nous cherchons à mettre automatiquement en évidence
les sujets (ou thématiques) les plus fréquemment abordés dans les
messages postés sur un forum de discussion. En effet, certains forums
de discussion contiennent un très grand nombre de messages répartis en
plusieurs fils de discussion. Afin de retrouver une information
particulière parmi ces messages, un long travail de recherche est
souvent nécessaire à l'utilisateur. Afin d'améliorer cette phase de
recherche, nous proposons plusieurs outils permettant d'avoir une
vision globale des sujets abordés dans un forum de discussions :
- L'outil Bobinette
développé par Benjamin Huynh Kim Bang à l'ENS Cachan permettant d'avoir
une vue globale sur les fils de discussions d'un forum (cf. http://forumwhoareyou.free.fr/data/Tools/WebBobinette/bobinette.php)
Vue partielle des trois fils de discussion d'un forum avec l'outil Bobinette
-
La plate-forme de cartographie et de catégorisation de corpus ProxiDocs développée ici permettant de dresser des cartes représentant l'ensemble des messages échangés sur un forum de discussion (cf. http://www.info.unicaen.fr/~troy/proxidocs)
Cartographie d'un forum de discussion portant sur l'apprentissage de la programmation
Ces deux outils prennent en considération des thématiques définies par
l'utilisateur selon son point de vue et sa tâche, les résultats ainsi
produits par les logiciels seront ainsi personnalisés et ne mettront en
évidence sur les vues globales que les thèmes pertinents au yeux de
l'utilisateur.
Objectifs du projet Ce projet prend
place dans la suite des travaux sur la lecture rapide de forums
présentés ci-dessus. Deux nouveaux modules de la plate-forme ProxiDocs
devront être développés. Ces deux modules devront exploités les
nombreuses classes Java de la plate-forme ProxiDocs.
- Le premier module sera dédié à l'analyse du contenu et de la forme des messages d'un forum.
- Etude du contenu
: le module devra permettre à l'utilisateur d'observer les termes les
plus fréquents dans la totalité du forum, dans un même fil de
discussion, dans les messages d'un même auteur, etc.
- Etude de la forme
: le module devra également permettre de déterminer la longueur des
messages, le nombre de ponctuations et de sauts de lignes, la présence
d'énumérations, etc.
- Le second module
sera dédié à la construction de cartes du forum. A partir des valeurs
déterminées à l'aide du premier module, il sera possible de construire
par l'intermédiaire de ProxiDocs différentes cartes. Ces cartes
pourront par exemple représenter l'ensemble des messages du forum selon
leur contenu et / ou leur forme. Sur ces cartes, différentes
possibilités d'interaction devront être développées, telles la mise en
relief des messages d'un même fil de discussion ou d'un même auteur.
Une relation entre des cartes thématiques que nous possèdons et les
cartes construites durant ce projet sera également à étudier. De la
même manière, des interactions entre les cartes construites et l'outil Bobinette de visualisation de fils de discussion sera également à réaliser.
10. Mise en place de la mobilité IPV6 à l'Université de Caen.
IPV6 est une nouvelle version du protocole IP disponible depuis
quelques années. De nombreuses fonctionnalités ont été intégrées au
protocole pour faciliter la gestion d'un réseau. Si certaines de ces
fonctionnalités ne sont qu'une intégration au sein du protocole IPV6
de celles disponibles pour IPV4, il en est une qui est réellement
novatrice : la mobilité. Le but de se stage sera d'installer la
mobilité au sein l'Université de Caen en prenant deux sites pilotes,
le GREYC et le CIT, la solution pouvant être étendue à d'autres sites
dont notamment le campus III d'Ifs.
- Comprendre l'architecture IPV6 existante à l'Université.
- Etudier les mécanismes de mobilité IPV6 et en faire un état des lieux (implémentation, problématique, nouveaux services, etc.)
- Mettre en place la mobilité entre le site du CIT et le GREYC.
- Sélectionner certains applicatifs et identifer les changements apportées sur ces applicatifs par la mobilité.
Connaissances requises
Administration réseau Unix, une première expérience sur IPV6 serait un plus.
Localisation
Le stagiaire sera accueilli au CERTIC et aura à disposition le matériel nécessaire.
11. Intégration de GML dans la
modélisation d'Ompg surcouche d'Openmap. OMPG
est une extension d'OPENMAP développée depuis plusieurs années au sein
du GREYC.
Schéma de classes d'OMPG
Elle implémente une couche d'abstraction DataStorage
pour des sources de données différentes permettant ainsi un changement
souple de source d'information lors de la création d'une couche
d'information géographique. Deux DataStorage
sont
actuellement implémentés, XMLTableDataStorage et
PostgisDataStorage. Nous souhaitons rajouter d'autres sources
d'informations dont une capable de lire et d'écrire du GML, langage de
description d'information géographique promulgué par le consortium
OpenGIS et actuellement dans sa version 3.1.1.
Travail à réaliser
- Implémenter la classe GMLDataStorage de façon à permettre la lecture et l'écriture d'information géographique au format GML.
- Développer les GUI nécessaires à sa configuration et sa sauvegarde permanente.
- Intégrer le tout sur le serveur subversion du département d'informatique.
Connaissances requises
La connaissance de Java est requise pour ce projet.
12. Mise en place d'un service de Webcam pour collectivité locale
Contexte
La mise à disposition d'images en temps réel apporte une forte
valeur ajoutée à la communication des collectivités locales (mairie,
conseil général, conseil régional, secteur associatif). Elle permet au
voyageur potentiel ou à l'expatrié d'obtenir des renseignements
dynamiques sur les paysages, le climat, la fréquentation de site
touristiques.
Travail demandé
L'étudiant réalisera une étude de faisabilité pour l'implémentation de quatre webcams. Cette étude concerne :
- les aspects techniques relatifs à l'implémentation des capteurs et la diffusion du flux
- les aspects juridiques (gestion du droit à l'image)
- la mise à disposition des flux vidéo par un système CMS (ex. zope, spip)
La phase de validation nécessite la réalisation d'une maquette opérationnelle.
13. Analyse automatique de dialogues
Objectifs
Dans le cadre de l'analyse automatique de situation de dialogues à caractères
commerciaux nous proposons un projet relatif à la partie traitement de la
bande son. L'étudiant devra développer un prototype puis une bibliothèque
réalisant un phasage (prise de contact, identification des besoins, ...) de
l'entretient enregistré. Ce phasage passe par la détection des temps de
parole pour chacun des deux interlocuteurs, la mesure de ces temps puis le
monitoring de l'évolution de la répartition du temps de parole entre les deux
individus au cours du temps.
Dans une seconde phase du projet, l'étudiant s'interressera à la sémantique de
l'entretient. Il s'agira de chercher un certain nombre de mots clés
permettant d'identifier plus finement encore le type de dialogue en présence
(questionnent, affirmation, proposition tarifaire, etc).
L'ensemble des informations recueillies seront mises en formes de façon à
permettre une identification visuelle claire de l'évolution du dialogue au
cours du temps.
Travail demandé
Après un temps de prise en main du sujet (étude des données sources, tests de
traitement du son sous JAVA) l'étudiant devra :
- réaliser une bibliothèque en JAVA assurant les fonctionnalités de mesure des
temps de parole suivant les sources audio,
- implémenter un ensemble de méthodes permettant de phaser le dialogue en
fonction des temps mesurés,
- rechercher les bibliothèques existantes permettant de la
détection de mots clés et les intégrer au projet.
le développement d'une interface graphique de suivie des phases du dialogue
sera également envisagée.
Connaissances requises
Langage JAVA, une première expérience en matière de traitement de son serait
un plus.
14. Réalisation d'un analyseur textuel pour l'extraction d'information d'articles scientifiques portant sur le génome
Description
La fouille de données textuelles s'appuie généralement sur une approche
de "surface" dans la mesure où cette technique ne prend en compte que la
forme des mots du texte considéré alors comme un "sac de mots".
A contrario, certaines techniques du TAL (Traitement Automatique de la
Langue) s'intéressent à extraire de l'information dans les corpus de
manière locale et assez précise.
L'utilisation de telles techniques en amont de la fouille de données
devrait, en toute hypothèse, permettre d'en améliorer significativement
les résultats.
Le but de ce projet est d'appliquer des techniques d'extraction
d'information sur un corpus d'articles scientifiques portant sur le
génome. Les tâches demandées concernent la réalisation d'un analyseur
textuel sur ce type de corpus. Plus précisément, cet analyseur devra
permettre :
- l'identification des termes de type biologique (entités de type
gène, protéine ou enzyme),
- la résolution, selon des règles simples, des chaînes de coréférence :
reprise pronominale ("it"), ou syntagme coréférant à un syntagme
précédent ("this gene") ;
- l'annotation des entités ainsi reconnues par un marquage des
informations calculées (essentiellement le type et le nom de l'entité) ;
Selon l'avancement du projet et les résultats, on s'intéressera aussi
à détecter les relations d'hyperonymie (appartenance d'une entité à une
classe) marquées dans le corpus, comme dans "ASP belongs to a family of
LRR proteins". Plus complexe, l'extraction de fonctions biologiques
associées aux entités est également envisageable.
L'étudiant pourra utiliser LinguaStream, un atelier de TAL développé au
GREYC et permettant de développer à moindre coût une chaîne de
traitements textuels. L'étudiant pourra aussi s'appuyer sur une
grammaire en cours de constitution pour ce projet.
libre
15. Comparaison d'algorithmes de fouille de données et sur les graphes
Description
Il existe de nombreux liens entre les techniques d'algorithmique sur les
graphes et celles de fouille de données. Par exemple, il est établi que
l'extraction des motifs fermés conduit à l'obtention de bi-partition de
graphes (cf. ``A correspondence between maximal complete bipartite
subgraphs and closed patterns'', J. Li, H. Li, D. Soh and L. Wong, p.
146-156, PKDD'05). D'autre part, la construction de matrices symétriques
(i.e., les éléments sur les lignes correspondent à ceux des colonnes) est
un moyen de recherche de cliques.
Le but de ce projet est de comparer de façon fine les deux approches sur
différents jeux de données afin de mieux dégager leurs forces et
faiblesses.
Travail demandé
- Conception d'un protocole de comparaison des algorithmes (e.g.,
caractéristiques des jeux de données).
- Recherche des outils sur les graphes (les outils de fouille de
données seront disponibles).
- Bilan et synthèse des résultats.
16. Fouille de données relatives à une course à pied
Description
L'association "la Muse" organise chaque année une course à
pied qui rassemble environ 1500 coureurs. A partir de la version
électronique des résultats (disponible depuis 1999), le but de ce
projet est de mieux appréhender les caractéristiques de la course et
de ses participants.
Travail demandé
Vous devrez mettre en oeuvre une chaîne complète de traitement de fouille
de données : définition précise des objectifs, préparation des données,
utilisation d'outils de fouille, analyse des résultats, comparaison avec
des méthodes de statistiques. Quelques suggestions :
- analyse globale des données : bassin d'attraction, "fidélité" à la
course
- caractéristiques des "meilleurs coureurs" par rapport aux moins
bons (par rapport au classement général, aux catégories) par des
techniques d'arbres de décision, de motifs émergents
- comparaison de résultats de motifs locaux (par exemple, motifs
fréquents, motifs sous contraintes) avec des résultats plus globaux
provenant de méthodes de statistiques
- proposition d'utilisation de méthodes de fouille de données pour la
détection des erreurs de saisie (i.e., à partir de comptage de fréquence,
suggérer des erreurs de saisie)
- recherche et caractérisation de groupes homogènes de coureurs (mise
en évidence de clusters)
- recherche de règles temporelles conduisant à des scénarios d'évolution
possibles de la course
17. Conception de programme musical pour radio web
Description
La
conception de programme musical pour radio web est un problème complexe
analogue à l'allocation contrainte de ressources. Pour une radio
diffusant 24h/24h, certaines plages diffusent un programme musical
généré automatiquement en utilisant les morceaux présents dans une base
de données. Les contraintes sont par exemple : - laisser un minimum de temps entre deux morceaux d'un même artiste, d'un même genre ;
- respecter des quotas de diffusion (morceaux en langue française) ;
- identité musicale de la radio, de la plage horaire ;
- diffusion de jingles à heures fixes, longueur du programme musical.
Travail demandé
Ce
projet s'inscrit dans un projet plus global concernant la réalisation
d'un diffuseur de radio web en open source, découpé de la façon
suivante : - interface web pour la gestion de la base de données musicale (étudiant de master ingénierie de l'internet);
- génération de playlist avec contraintes (vous-même);
- diffusion sur un serveur icecast et génie logiciel du projet global (étudiant de master RADI).
18. Conception de programme musical pour la Machine à Danser
Description
La "Machine à Danser"
est un système de sonorisation qui se loue avec un programme musical
inclus. Ce programme est conçu en fonction des goûts des clients et de
ceux de leurs invités pour l'animation d'une soirée dansante. Les
clients remplissent un questionnaire décrivant le type de soirée, leurs
goûts musicaux, l'âge des participants. En fonction de ces
informations, un Disc-Jockey professionnel conçoit un programme de 7
heures.
Travail demandé
ous
étudierez les différentes aides à la décision possibles pour la
conception du programmme musical à partir du questionnaire. Pour
l'instant, le Disc-Jockey recherche parmi les associations
questionnaire-playlist celle dont le questionnaire est le plus proche
de ce qui est demandé. La playlist correspondante constitue sa base de
travail. Autres pistes : - utilisation d'une base de données répertoriant la discographie mondiale et les goûts d'utilisateurs,
- fusion de playlist existantes.
Ce projet peut éventuellement déboucher sur un stage en entreprise.
libre
19. Projet Segmentation et interface graphique
Descartes est
un logiciel de segmentation d'images semi-interactif : Le logiciel
permet à l'aide d' une série d'interactions avec l'utilisateur de
construire une partition d' une image en régions, chaque région
correspondant à un objet de l'image. Logiciel Descartes
Mise à jour de l'interface
Le
logiciel permet d'obtenir des agrandissements de régions de l'image. En
revanche l'image globale est représentée à sa résolution initiale et
l'utilisateur ne peut modifier celle-ci. Le premier objectif de ce
projet consistera à définir des agrandissements permettant de
visualiser l'image à différentes échelles. Ce travail i | |