Contents

Statsmodels est un module Python dont la vocation est d’explorer des données, d’estimer des modèles et d’élaborer des tests statistiques. Une liste exhaustive de statistiques descriptives, de tests statistiques, de fonctions de traçage et de statistiques de résultats y est fournie pour différents types de données et pour chaque estimateur. Ce paquet fait figure de supplément au module ad-hoc de la librairie SciPy.
Statsmodels figure parmi les librairies scientifiques du langage Python orientée vers l’analyse de données, la science des données (ou encore Data Science) et les statistiques. Statsmodels est construit au-dessus des bibliothèques NumPy et SciPy, se sert de Pandas pour la gestion et stockage des données, et fait appel à Patsy pour décrire les modèles par des formules à l’image du logiciel R. Les fonctions graphiques s’appuient sur la bibliothèque Matplotlib.
Statsmodels est un outil libre disponible sous la licence BSD modifiée. La documentation numérique officielle est disponible sur statsmodels.org.
Ce travail s’inscrit dans le sillage des mini-projets exigibles au cours de la formation en ingénierie des données au sein de l’institut national des postes & télécommunications (INPT), et consiste en la prise en main de la librairie Statsmodels du langage Python, et un aperçu sur ses différents outils et leurs cas d’usage. Il marque le dénouement du cours Python pour la Data Science assuré par Mr. KAMAL IDRISSI Hamza à qui nous témoignons une profonde déférence, et à l’honorable examen duquel nous laissons cet ouvrage en souhaitant qu’il réponde à ses propres souhaits, ainsi qu’aux espérances et à l’attente de ses lecteurs.
La progression de ce travail se déclinera comme suit :
Installation & Prérequis
Modèles Linéaires & Régression
- Introduction
- Régression Linéaire
- Attributs & Statistiques Résultantes
- Exemple de Régression par les Moindres Carrés (OLS)
- Exemple de Régression par les Moindres Carrés Pondérés (WLS)
- Exemple de Régression par les Moindres Carrés Généralisés (GLS)
- Modèles Linéaires Généralisés
- Ajustement d’un Modèle Linéaire Généralisé
Analyse des Séries Temporelles
Outils Statistiques