Hors Série

Méthodologie Nowcast

22/02/2023
PDF

Les modèles de prévision du PIB en quasi-temps réel (« nowcast »), aussi appelés « modèles de prévision du PIB par approche directe », sont communément utilisés par les conjoncturistes qui suivent au quotidien les évolutions de la croissance du PIB avant la publication des comptes nationaux trimestriels.

Ces modèles permettent une estimation de la croissance du PIB sur la base des indicateurs déjà publiés au moment de la prévision. Ils présentent l’intérêt d’offrir, en amont de la publication des comptes nationaux trimestriels, l’image la plus fiable possible du dynamisme de l’activité pour le trimestre en cours. Le degré de sophistication de ces modèles a crû significativement, et les données utilisées se sont enrichies avec, en particulier, l’intégration des requêtes formulées sur Google, les articles parus dans différents médias, des images satellites, des données des dépenses par cartes bancaires, etc.

Nos propres travaux de modélisation portent sur la zone euro et la France. La prévision qui en résulte est une moyenne des différents modèles développés, leurs performances étant très proches. L’ensemble de nos modèles sont calibrés (T1 2000 – T4 2016) et testés (T1 2017 – T4 2022) sur les mêmes périodes. Nous avons travaillé sur deux familles de modèles : l’une à dimensions non réduites et l’autre à dimensions réduites (approche multi-fréquentielle à facteurs).

Modèles à dimensions non réduites

S’agissant de la première famille (modèles à dimensions non réduites), la sélection des données se fait par une régression dite Stepwise[1]. Cette famille est composée de cinq modèles distincts :

1) modèle MCO contenant 12 variables : régression linéaire non-parcimonieuse ;

2) modèle MCO contenant 7 variables : régression linéaire parcimonieuse ;

3) modèle lasso contenant 10 variables : régression linéaire avec une contrainte linéaire sur les coefficients de la régression de façon à éviter la surpondération de certains régresseurs par rapport à d’autres ;

4) modèle ridge contenant 10 variables : régression linéaire avec une contrainte quadratique sur les coefficients de la régression de façon à éviter la surpondération de certains régresseurs par rapport à d’autres ;

5) modèle de forêts aléatoires contenant l’ensemble des variables.

La prévision du PIB émanant de ces différents modèles est ensuite agrégée à l’aide d’un coefficient relatif à leur performance en prévision (l’inverse du RMSFE) calculé sur l’échantillon de test.

Modèles à dimensions réduites

Pour la seconde famille de modèles (approche multi-fréquentielle à facteurs), les données d’activité et d’enquêtes sont enrichies de données financières et internationales. Ces dernières sont sélectionnées, comme dans la première famille de modèle, par une régression Stepwise qui permet de conserver les régresseurs ayant le plus grand pouvoir prédictif. La sélection des variables retenues est ensuite réduite grâce à une analyse en composantes principales (ACP). Cette technique statistique permet d’estimer, par combinaison linéaire des variables initiales, un facteur mensuel qui représente la dynamique commune. Dans un second temps, nous utilisons ce facteur commun mensuel pour expliquer la croissance trimestrielle à l’aide d’une régression linéaire à fréquences mixtes (MIDAS[2]).

Une estimation à différents moments du trimestre

Un modèle de nowcasting offre une estimation de la croissance du PIB à différents moments dans le trimestre. Il en existe quatre dans un trimestre : mois 0, mois 1, mois 2, mois 3. Ces moments sont dictés par le rythme de publication des indicateurs. Lors d’une estimation réalisée au mois 0, aucune donnée d’activité (dite donnée dure) pour le trimestre estimé n’est publiée mais les enquêtes pour le premier mois du trimestre en cours sont disponibles. De la même manière, une estimation réalisée au mois 1 signifie que l’on dispose du premier mois de données dures et des deux premiers mois d’enquêtes, et ainsi de suite.

Le moment où l’estimation est effectuée est essentiel : la qualité de l’estimation s’améliore considérablement à mesure que les données dures sont publiées et intégrées. Une estimation faite, par exemple, au mois 1 est donc entourée d’un plus grand degré d’incertitude que l’estimation réalisée au mois 3, la plus solide et a priori la meilleure. L’erreur de prévision diminue à mesure que l’on avance dans le trimestre.

[1] Processus de sélection itératif vérifiant que l’ajout d’une nouvelle variable ne provoque pas la suppression d’une variable déjà sélectionnée. Les régresseurs les mieux corrélés à la variable d’intérêt (ici le PIB) sont retenus. Le processus d’ajout de régresseurs supplémentaires s’interrompt lorsque la variable n+1 n’apporte plus d’information additionnelle suffisante.

[2] Le modèle MIDAS permet d’estimer une variable à basse fréquence (trimestrielle dans notre cas) par des variables à haute fréquence (mensuelle).

Variables utilisés pour la France


Variables utilisés pour la zone euro

LES ÉCONOMISTES AYANT PARTICIPÉ À CET ARTICLE