Une adaptation de l'approche des moindres carrés partiels multidimensionnelle aux études d'association génétique

Magnifo Kahou, Florence Laure (2018). « Une adaptation de l'approche des moindres carrés partiels multidimensionnelle aux études d'association génétique » Mémoire. Montréal (Québec, Canada), Université du Québec à Montréal, Maîtrise en mathématiques.

Fichier(s) associé(s) à ce document :
[img]
Prévisualisation
PDF
Télécharger (10MB)

Résumé

Nous décrivons une approche multidimensionnelle qui permet de tester l'association entre des variants génétiques et des traits quantitatifs. Cette approche utilise la théorie des valeurs extrêmes, GPD (de l'anglais Generalized Pareto Distribution), pour approximer la distribution de la statistique du test d'association sous l'hypothèse nulle (Knijnenburg et al., 2009). Nous généralisons donc au cas multidimensionnel, l'approche donnée dans Xu et Greenwood (2013), en ce qui concerne l'approche PLS (de l'anglais Partial Least Squares regression). Nous adaptons ainsi la méthode PLS comme technique de réduction de la dimension des données, pour l'étude d'association entre des variants génétiques (covariables) et les traits d'une maladie complexe (variables réponses). À partir des données, généralement corrélées, on va extraire des composantes scores (cotes) et des composantes loadings (charges), à condition que la corrélation entre les nouvelles composantes (scores, loagings) demeure maximale. Ces nouvelles variables (les scores) peuvent donc être utilisées pour des études d'association génétique afin d'augmenter la puissance du test. Ne sachant pas la distribution de la statistique de test sous l'hypothèse nulle, nous l'avons approximée à l'aide des permutations. Nous constatons que cette approche contrôle bien l'inflation de l'erreur de type I. Une étude de simulation nous permet de comparer plusieurs approches existantes à la nôtre. Nous validons aussi notre approche par une analyse d'un jeu de données réelles sur des patients atteints de la maladie de l'Alzheimer. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Régression, Single Nucleotide, GWAS, Tests d'associations génétiques, Composantes latentes, loadings.

Type: Mémoire accepté
Informations complémentaires: Le mémoire a été numérisé tel que transmis par l'auteur.
Directeur de thèse: Oualkacha, Karim
Mots-clés ou Sujets: Études d'associations génétiques / AAP / Moindres carrés / Théorie des valeurs extrêmes / Analyse de régression / Maladie d'Alzheimer
Unité d'appartenance: Faculté des sciences > Département de mathématiques
Déposé par: Service des bibliothèques
Date de dépôt: 17 déc. 2018 09:35
Dernière modification: 17 déc. 2018 09:35
Adresse URL : http://archipel.uqam.ca/id/eprint/11981

Statistiques

Voir les statistiques sur cinq ans...