Une étude vers la complétion de schéma et de jeux de données liées à l'aide de l'analyse relationnelle de concepts (ARC)

Seriai, Billel (2016). « Une étude vers la complétion de schéma et de jeux de données liées à l'aide de l'analyse relationnelle de concepts (ARC) » Mémoire. Montréal (Québec, Canada), Université du Québec à Montréal, Maîtrise en informatique.

Fichier(s) associé(s) à ce document :
[img]
Prévisualisation
PDF
Télécharger (7MB)

Résumé

Les dernières années, on constate une énorme augmentation des informations publiées sur le web en tant que données liées. Cette évolution rapide crée des difficultés pour l'évaluation de la qualité et l'exploration de ces données. Dans ce mémoire, nous proposons une nouvelle approche pour surmonter ces problèmes par la mise en œuvre d'un processus de découverte de connaissances. Les sources des données structurées sur le web sont décrites par Resources description Framework (RDF). Nous appliquons notre approche à une ontologie déjà existante, le Dbpedia, afin de l'étudier à travers ces instances. Cette étude pourra nous révéler des incohérences ou des manques dans les données de l'ontologie. Notre approche est semi-automatique et comporte quatre phases : 1- L'extraction des données est automatique en utilisant les requêtes SPARQL. 2- La transformation des descripteurs en modèle de données, la phase étant manuelle, elle crée des descripteurs par factorisation d'attributs communs. 3- L'utilisation des résultats de l'analyse relationnelle de concepts (RCA) pour extraire un modèle de classes. 4- La comparaison des résultats avec les classes de Dbpedia. Notre approche aide à fournir un assistant pour l'extraction de données et à enrichir l'ontologie Dbpedia avec les nouvelles classes découvertes. Elle offre aussi un assistant pour la collecte des données en suggérant des valeurs pour les propriétés qui manquent. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : RDF, Dbpedia, Analyse Relationnelle de Concepts, Données liées.

Type: Mémoire accepté
Informations complémentaires: Le mémoire a été numérisé tel que transmis par l'auteur.
Directeur de thèse: Valtchev, Petko
Mots-clés ou Sujets: Données liées / Exploration de données (Informatique) / Analyse mathématique / Théorie des treillis / RDF (Langage de balisage) / Ontologies (Recherche de l'information) / Dbpedia (Web sémantique) / Analyse relationnelle de concepts
Unité d'appartenance: Faculté des sciences > Département d'informatique
Déposé par: Service des bibliothèques
Date de dépôt: 21 juin 2016 19:42
Dernière modification: 21 juin 2016 19:42
Adresse URL : http://www.archipel.uqam.ca/id/eprint/8644

Statistiques

Voir les statistiques sur cinq ans...