Télécharger La thèse :

Titre: Programmation par contraintes appliquée pour la résolution des problèmes d'appariement d'objets discrets

Domaine: Mathématiques informatique (MI)

Filière: Informatique

Option: Ingénierie des données et des connaissances

Auteur: Kemmar Amina

Soutenu (e) le: 07/03/2017

Sous la direction de: Lebbah Yahia

Co-directeur:Loudni Samir

Le président du jury : Belalem Ghalem

Examinateur1: Atmani Baghdad

Examinateur2: Malki Mimoun

Examinateur3: Benatchba Karima

Examinateur4: Elberrichi Zakaria

Mention: Très Honorable

Résumé:

L’extraction de motifs fréquents est une problématique majeure en fouille de données. La programmation par contraintes (PPC), issue de l’intelligence artificielle et de la recherche opérationnelle, est un paradigme puissant pour résoudre des problèmes combinatoires modélisés sous forme de contraintes. L’objectif de cette thèse est de proposer des méthodes se basant sur la PPC afin de contribuer dans la résolution de deux problèmes : (1) l’extraction de motifs séquentiels dans une base de séquences ; (2) l’extraction de sous-graphes fréquents à partir d’une base de graphes. Nous proposons un modèle PPC pour l’extraction de motifs séquentiels avec wildcards. Deux types de contraintes ont été abordées : (1) des contraintes individuelles qui doivent être vérifiées par chaque motif ; (2) des contraintes globales, telles que les top-k et les sous-groupes pertinents, qui nécessitent une vérification par rapport à l’ensemble des motifs générés. Nous avons introduit une nouvelle contrainte globale, à savoir la contrainte globale Prefix-Projection qui encapsule la relation de sous-séquence et la contrainte de fréquence. Elle est basée sur le principe de projection préfixée et ne requiert aucune contrainte réifiée, ni des variables additionnelles. Nous avons proposé un algorithme efficace qui exploite notre contrainte globale Prefix-Projection afin d’extraire les top-k motifs séquentiels à partir d’une base de séquences. Nous avons étendu notre contrainte globale Prefix-Projection pour prendre en charge la contrainte de gap , en produisant notre deuxième nouvelle contrainte globale GAP-SEQ, qui repose sur le principe des extensions droites des motifs. Son algorithme de filtrage exploite la propriété de préfixe anti-monotonie de la contrainte de gap, afin de garantir un filtrage plus efficace de l’espace de recherche. En ce qui concerne la problématique de fouille de graphes, nous proposons une approche par intervalle qui exploite deux types d’encodages non-canoniques : un encodage inférieur et un encodage supérieur. Ces deux derniers permettent de borner l’ensemble complet des sous-graphes fréquents générés par un encodage canonique. Nos contributions ont été validées sur le plan théorique et sur le plan expérimental sur un ensemble de jeux de données réelles et synthétiques. Les résultats que nous avons obtenus ont montré l’efficacité de nos propositions.


Mots clefs: fouille de séquences, contraintes, programmation par contraintes, Contraintes globales, Motifs fréquents, Motifs sous contraintes, fouille de graphes, top-k, isomorphisme de graphes, isomorphisme de sous- graphes.


Publications associées à la thèse

Article 1:

Titre: PREFIX-PROJECTION Global Constraint and top- k Approach for Sequential Pattern Mining

Revue: Constraints

Référence: Constraints 22(2): 265-306 (2017)

Date: Février 2017

Publications associées à la thèse

Article 2:

Titre: A Constraint Programming Approach for Web Log Mining

Revue: International Journal of Information Technology and Web Engineering (IGI)

Référence: International Journal of Information Technology and Web Engineering 11(4): 24-42 (2016)

Date: 22 Juillet 2016

Publications associées à la thèse

Article 3:

Titre: Une contrainte globale pour l’extraction de motifs séquentiels

Revue: Revue d'intelligence artificielle (RIA)

Référence: Revue d'Intelligence Artificielle 30(6): 675-703 (2016)

Date: Décembre2016