Information, ondelettes, réseaux de neurones, méthodes numériques, et modélisation et prédiction des séries temporelles boursières : une étude comparative

Lahmiri, Salim (2014). « Information, ondelettes, réseaux de neurones, méthodes numériques, et modélisation et prédiction des séries temporelles boursières : une étude comparative » Thèse. Montréal (Québec, Canada), Université du Québec à Montréal, Doctorat en informatique cognitive.

Fichier(s) associé(s) à ce document :
[img]
Prévisualisation
PDF
Télécharger (15MB)

Résumé

L'intelligence artificielle connexionniste est devenue un outil de modélisation attrayant dans le contexte de la prédiction des séries temporelles boursières, grâce à la capacité des réseaux de neurones artificiels (RNA) de modéliser des séries temporelles bruitées ou incomplètes sans pour autant émettre des hypothèses fortes sur leurs distributions et la relation entre variables d'entrée et de sortie, contrairement aux modèles statistiques conventionnels. Par ailleurs, différentes catégories d'information peuvent servir d'entrées au système de prédiction. Ainsi plusieurs travaux empiriques montrent la possibilité de prévoir le marché boursier à partir d'information économique, technique ou historique (retards) tirée de séries temporelles boursières, ou de l'information extraite de l'analyse par ondelettes discrète (AOD). Pour réaliser la descente du gradient lors de l'entrainement du RNA, l'algorithme d'optimisation que l'on retrouve le plus souvent dans littérature sur la prédiction boursière est celui de Levenberg-Marquardt (L-M). Mais, il existe d'autres techniques d'optimisation plus avancées comme le Quasi-Netwon, l'algorithme du gradient conjugué de type Polak-Ribiére, Powell-Beale ou Fletcher-Reeves, et autres, et il n'a pas encore été établi quel l'algorithme donne les meilleures résultats. L'objectif de la thèse vise à répondre aux questions suivantes : Question l : Quel type d'information d'entrée peut mener aux meilleures prédictions? Question 2 : Une combinaison des différents types d'information peut-elle améliorer la qualité des prédictions ? Question 3 : Quel algorithme d'approximation numérique permet le meilleur apprentissage du RNA à retro-propagation d'erreur, et donc de donner les meilleurs résultats de prédiction? Question 4 : Peut-on améliorer les résultats des variables prédictives traditionnelles en introduisant une dimension de traitement temps-fréquence obtenue par l'analyse multi-résolution; en l'occurrence l'analyse par paquets d'ondelettes (APO)? L'indice boursier américain S&P500, le plus utilisé par les investisseurs américains et internationaux, est retenu pour effectuer différentes simulations. L'objectif est de prédire ses hausses et baisses, et les mesures de performance considérées sont le taux de classification (prédiction) correcte, la sensibilité et la sensibilité. Les machines à support de vecteurs (SVM) sont retenues pour être le modèle de référence vue leur capacité prédictive prouvée dans la littérature. Les simulations ont montré les résultats suivants : (a) parmi les catégories d'informations classiques, les informations historiques et les informations sur l'état psychologique du marché sont les plus pertinentes pour la prédiction des tendances futures; (b) la combinaison des différentes catégories d'informations classiques (économique, technique, historique, sentiment) n'améliore par la précision de la prédiction; (c) les différences entre les performances obtenues par différents algorithmes numériques pour l'entrainement du RNA sont minimes; cependant l'algorithme de Polak-Ribière semble être en général plus performant; (d) dans certains cas, l'algorithme L-M qui est le plus utilisé dans la littérature performe moins bien que les autres algorithmes considérés dans nos simulations; (e) contrairement à ce que l'on retrouve dans la littérature, le RNA performe mieux que le SVM; (f) l'information fréquentielle extraite par l'analyse multi-résolution par paquet d'ondelettes (APO) permet d'améliorer grandement la performance prédictive des RNA par rapport aux autres catégories d'information traditionnellement utilisées dans la littérature, et ce quelque soit l'algorithme numérique utilisé pour l'entraînement; (g) Finalement, l'usage de l'information extraite par APO permet d'obtenir une meilleure prédiction de la tendance future du marché S&P500 que l'information extraite par AOD utilisée dans la littérature. De ce fait, l'approche par l'APO est beaucoup plus simple à utiliser, contrairement aux approches traditionnelles qui requièrent beaucoup de prétraitements statistiques. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : réseaux de neurones, algorithmes numériques, machines à supports de vecteurs, information, ondelette, prédiction.

Type: Thèse ou essai doctoral accepté ()
Informations complémentaires: La thèse a été numérisée telle que transmise par l'auteur.
Directeur de thèse: Boukadoum, Mounir
Mots-clés ou Sujets: Algorithme, Bourse, Information, Machine à vecteurs de support, Modèle prédictif, Ondelette (Mathématiques), Prévision, Réseau neuronal (Informatique), Série chronologique, Simulation par ordinateur
Unité d'appartenance: Faculté des sciences > Département d'informatique
Déposé par: Service des bibliothèques
Date de dépôt: 03 déc. 2014 21:01
Dernière modification: 03 déc. 2014 21:01
Adresse URL : http://www.archipel.uqam.ca/id/eprint/6396

Statistiques

Voir les statistiques sur cinq ans...