Méthodes et plateformes bioinformatiques basées sur l'apprentissage automatique pour la classification efficace de séquences biologiques

Remita, Mohamed Amine (2017). « Méthodes et plateformes bioinformatiques basées sur l'apprentissage automatique pour la classification efficace de séquences biologiques » Mémoire. Montréal (Québec, Canada), Université du Québec à Montréal, Maîtrise en informatique.

Fichier(s) associé(s) à ce document :
[img]
Prévisualisation
PDF
Télécharger (18MB)

Résumé

Les récentes avancées des technologies de séquençage des biomolécules ont contribué à la génération de quantités colossales de séquences et de données biologiques. La classification de ces séquences est importante dans les différentes analyses de séquences telles que l'identification des éléments génomiques, la prédiction de leurs caractéristiques et fonctions, et l'inférence de leurs relations phylogénétiques et taxonomiques. Les méthodes de classification assignent une nouvelle séquence à un ensemble de séquences de référence qui partagent des propriétés et des traits similaires. Ces méthodes appartiennent à plusieurs catégories d'approches qui sont basées sur l'alignement de séquences ou la phylogénie, ou indépendantes de l'alignement de séquences. Plusieurs méthodes de classification sont généralement spécifiques à un type d'organisme et ne sont pas adaptées à un volume énorme de séquences. Dans ce mémoire, nous abordons deux problématiques de classification des séquences nucléotidiques, la classification des séquences virales en rangs taxonomiques et l'identification des microARNs à partir d'un lot de séquences de petits ARNs. Nous avons développé des méthodes de classification intégratives, indépendantes de l'alignement de séquences et basées sur l'apprentissage automatique. Ces nouvelles méthodes sont génériques, adaptées à plusieurs types d'organismes, et peuvent traiter des grandes quantités de données de nature hétérogène. Les méthodes développées sont efficaces, rapides et ont des performances comparables à celles des méthodes existantes. Finalement, elles sont implémentées dans des plateformes web publiques facilitant la réutilisation et la reproductibilité des expériences de classification par la communauté. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Classification des séquences nucléotidiques, apprentissage automatique, prédiction, classification des séquences virales, identification des rnicroARNs, plateformes intégratives.

Type: Mémoire accepté
Informations complémentaires: Le mémoire a été numérisé tel que transmis par l'auteur.
Directeur de thèse: Diallo, Abdoulaye Baniré
Mots-clés ou Sujets: Bio-informatique / Apprentissage automatique / Séquence nucléotidique -- Classification / Génomes viraux / MicroARN / Plateformes
Unité d'appartenance: Faculté des sciences > Département d'informatique
Déposé par: Service des bibliothèques
Date de dépôt: 01 sept. 2017 13:41
Dernière modification: 01 sept. 2017 13:41
Adresse URL : http://www.archipel.uqam.ca/id/eprint/9851

Statistiques

Voir les statistiques sur cinq ans...