Des algorithmes bioinformatiques pour la recherche des régions génomiques responsables d'une maladie

Badescu, Dunarel (2009). « Des algorithmes bioinformatiques pour la recherche des régions génomiques responsables d'une maladie » Mémoire. Montréal (Québec, Canada), Université du Québec à Montréal, Maîtrise en informatique.

Fichier(s) associé(s) à ce document :
[img]
Prévisualisation
PDF
Télécharger (4MB)

Résumé

L'évolution des espèces est régie par les modifications stochastiques qui ont eu lieu au niveau du code génétique -l'ADN -composé d'une suite de petites molécules (les nucléotides). Selon l'ampleur de ces évènements, il y a d'abord des modifications à petite échelle, impliquant quelques nucléotides -les insertions, délétions et substitutions. Due à l'impossibilité actuelle de différencier les insertions des délétions, on les appelle communément indels. D'un autre coté, il ya des modifications à grande échelle -impliquant parfois des grandes régions génomiques ou des chromosomes. Les modifications à grande échelle les plus fréquentes sont: les duplications, translocations, inversions et délétions. Au cours de ce projet, nous avons développé une méthode de génomique comparée, capable de relier l'information épidémiologique, comme la carcinogenicité et l'invasivité des souches, aux séquences génomiques. Cette méthode permet de détecter des régions statistiquement significatives à analyser plus en détail par des biologistes, tout en étant capable de discriminer ce seuil à l'aide du calcul des p-values. Nous avons utilisé cette méthode dans l'étude du virus du papillome humain et de la bactérie Neisseria Meningitidis, bactérie responsable de la méningite. Pour le virus du papillome humain, notre méthode a été capable de détecter le domaine PDZ, une région du gène E6, qui est une condition sine qua non de la carcinogenicité du produit de ce gène. Au cours des analyses phylogénétiques de cette famille nous avons trouvé une corrélation statistiquement significative entre les événements à petite échelle et les données épidémiologiques. Par la suite nous avons proposé une séquence de tests pour orienter l'analyse statistique de cette corrélation. Nous avons également remarqué que la carcinogenicité est généralement monophylétique, donc issue d'un ancêtre commun. L'arbre phylogénétique inféré est le premier basé sur les génomes entiers, ce qui a permis d'étudier la variabilité des topologies de gènes par rapport à celle du génome. Pour la bactérie Neisseria Meningitidis nous avons montré qu'il est possible de syntoniser les fonctions de discrimination, pour établir la différence entre les régions responsables du maximum d'invasivité et celles qui ont un rôle structural dans ce processus, détection des structures moléculaires connues (i.e. les anses extra cellulaires, dans notre cas). Les résultats de nos travaux ont permis la mise à la disposition de la communauté internationale de deux bases de données, pour le VPH et le Neisseria, respectivement. Ces bases contiennent des régions candidates à être analysées en laboratoire par des biologistes. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Algorithme pour la détection des régions carcinogènes, Événements évolutionnaires, Analyse de redondance, Arbre phylogénétique, Conception de vaccin, Mutations, Invasivité, Neisseria Meningitidis, Virus du papillome humain.

Type: Mémoire accepté
Informations complémentaires: Le mémoire a été numérisé tel que transmis par l'auteur.
Directeur de thèse: Makarenkov, Vladimir
Mots-clés ou Sujets: Bio-informatique, Génomique, Papillomavirus, Génome, Cancérogénicité, Méningocoque, Arbre phylogénétique, Algorithme
Unité d'appartenance: Faculté des sciences > Département d'informatique
Déposé par: RB Service des bibliothèques
Date de dépôt: 02 févr. 2010 18:51
Dernière modification: 01 nov. 2014 02:12
Adresse URL : http://archipel.uqam.ca/id/eprint/2558

Statistiques

Voir les statistiques sur cinq ans...