Eco Conjoncture

Classification des banques européennes selon leur modèle d’activité : une approche objective

27/07/2020
PDF

Les taux d’intérêt durablement bas, la faible croissance économique et l’augmentation des exigences réglementaires affectent tant les revenus des banques que la structure de leur bilan, selon des modalités qui dépendent, notamment, de leur modèle d’activité. L’analyse de ce dernier peut ainsi contribuer à l’identification des risques auxquels est exposée une banque et, par extension, à l’estimation des effets qu’elle subirait en cas de choc économique ou d’augmentation des exigences réglementaires, par exemple. Selon l’Autorité bancaire européenne (EBA, European Banking Authority), cette approche permet d’estimer la viabilité du modèle d’activité des banques ainsi que la pérennité de leur stratégie. Dans cette perspective, l’analyse du modèle d’activité des banques constitue l’un des quatre piliers1 du processus de révision et d’évaluation de la surveillance (SREP, Supervisory Review and Evaluation Process2) dont les résultats contribuent à la fixation des exigences réglementaires individualisées au titre du pilier 2 (processus de surveillance prudentiel) de la directive européenne CRD IV3.

L’analyse du modèle d’activité d’une banque, revient à identifier celui-ci, d’une part, et à affecter chaque banque à une classe unique et relativement homogène, d’autre part. Or, les banques, prisent dans leur ensemble, exercent une large gamme d’activités dans des proportions variables. De ce fait, aucune définition harmonisée et communément admise des différents modèles d’activité des banques n’existe (Cernov et Urbano, 20184). Le classement des banques selon leur modèle économique peut ainsi reposer sur une dose notable de jugement dit « expert ». Cette approche, qui se fonde sur l’appréciation personnelle des auteurs, présente l’intérêt d’être facilement applicable mais son caractère plus ou moins arbitraire la rend discutable. La littérature propose, de ce fait, différentes méthodes d’identification objective du modèle d’activité des banques.

Récemment, l’approche privilégiée dans la littérature réside sur les méthodes de classifications automatiques (clustering), et plus particulièrement à celle dite « hiérarchique ascendante ». Fondée sur les données, la classification hiérarchique ascendante est un processus itératif qui agrège successivement les banques selon leurs caractéristiques communes. À l’issue de l’agrégation, chaque établissement est affecté à une classe homogène bien distincte des autres.

Cette approche quantitative objective algorithmiquement la classification des banques selon leur modèle d’activité ce qui la rend plus robuste qu’une approche par jugement expert. Elle présente, en outre, l’avantage de ne pas poser d’hypothèse sur le nombre optimal de classe qui est déterminé a posteriori.

Les variables bilancielles (actif total, part des dépôts dans le total de bilan, ratio de levier, etc.) constituent, dans la littérature, les variables déterminantes sur lesquelles repose la classification automatique des banques selon leur modèle d’activité. De nombreux éléments ne figurent toutefois pas au bilan tandis que certaines activités, qui produisent une partie conséquente des revenus bancaires, n’impliquent pas une détention importante d’actifs. Une telle approche conduit les auteurs à poser implicitement l’hypothèse que le modèle d’activité d’une banque serait principalement reflété par la structure de son bilan qui représenterait lui-même de manière satisfaisante ses différentes sources de revenus. Pourtant, dans leurs rapports financiers, les banques présentent souvent la ventilation de leurs sources de revenus afin d’illustrer leur modèle d’activité.

Nous proposons donc une classification des banques européennes5 selon leur modèle d’activité en donnant, en sus des traditionnelles variables bilancielles, une plus grande importance aux différentes sources de revenus qui composent leur produit net bancaire. Nous ajoutons également les actifs sous gestion afin de rendre compte, dans une certaine mesure, de l’importance des activités de hors-bilan, lesquelles sont souvent ignorées dans la littérature. Par ailleurs, nous introduisons deux innovations techniques : d’une part, nous retenons trois composantes principales, contre deux généralement. Cela nous permet de conserver plus d’information et d’améliorer la qualité de notre classification. D’autre part, nous utilisons une méthode de classification hiérarchique descendante, et non ascendante, qui produit, selon un test statistique, de meilleurs résultats.

Finalement, notre estimons à cinq le nombre optimal de modèles d’activité pour les banques européennes. Nous les nommons en fonction des caractéristiques moyennes de chaque classe ainsi qu’en nous inspirant de la littérature : banques de détail pures, banques commerciales orientées détail, banques commerciales, banques universelles et banques d’investissement et assimilées.

Les variables relatives au produit net bancaire ainsi que la variable des actifs sous gestion se révèlent particulièrement pertinentes pour l’identification des modèles d’activité. Nos résultats demeurent cohérents avec ceux obtenus par la littérature.

Préparation des données et choix du modèle

Notre étude a pour objet d’établir une classification objective des banques européennes afin, par exemple, de classer ultérieurement, dans le cadre que nous aurons établi, de nouvelles banques européennes issues du rapprochement entre plusieurs établissements. Notre méthode pourrait également être transposée à d’autres zones géographiques, pays ou systèmes bancaires à des fins de comparaisons internationales. Il serait également possible d’observer l’évolution du modèle d’activité d’une banque particulière en comparant sa classification à différentes périodes. Enfin, une analyse de la sensibilité de chaque modèle d’activité à l’évolution des taux d’intérêt ou de la réglementation prudentielle, par exemple, est naturellement envisageable. Dans la mesure du possible, nous appliquons un protocole dans le cadre duquel chacun de nos choix est guidé par les meilleures pratiques en la matière.

Garantir la transposabilité des résultats par un échantillon large

Sélectionner correctement l’échantillon dans le cadre des méthodes de classifications automatiques est essentiel car les banques sont classifiées les unes par rapport aux autres ; un biais d’échantillonnage est donc de nature à affecter les résultats. En outre, l’échantillon doit être suffisamment large pour couvrir, dans la mesure du possible, le plus grand nombre de variantes de modèles d’activité au risque de ne pas être suffisamment représentatif pour pouvoir transposer les résultats. Une approche trop générale peut également produire des résultats insuffisamment précis, voire aberrants. En l’occurrence, cela peut conduire certaines banques réputées universelles à être classifiées à tort avec celles d’investissement, simplement parce que les établissements du reste de l’échantillon ne pratiqueraient pas d’activités de marché alors qu’il s’agirait d’un critère de différenciation fort.

Dans la limite des données exploitables dans SNL, 2 946 banques sont initialement retenues. Les banques ultraspécialisées (crédits automobiles uniquement, cartes de crédit, prêts sur gage, etc.) sont exclues de l’échantillon pour les raisons évoquées préalablement. Par ailleurs, leur modèle d’activité est déjà clairement identifié et leur exclusion devrait permettre de distinguer plus efficacement celui, moins évident, des banques qui composent l’échantillon. Les données retenues couvrent tous les groupes bancaires de l’Espace économique européen6 à leur plus haut niveau de consolidation puisqu’il s’agit généralement du niveau auquel s’appliquent les exigences réglementaires. L’exclusion des filiales permet d’éviter la redondance d’information qui pourrait conduire à une surreprésentation de certains modèles d’activité particuliers.

Enfin, la segmentation des activités par filiale est potentiellement une composante de la stratégie globale d’un groupe.

L’algorithme de classification automatique est sensible aux données manquantes ou aberrantes. Elles sont donc vérifiées et corrigées, dans la mesure du possible sinon la banque est éliminée de l’échantillon initial, le réduisant ainsi de 759 banques. De même pour les valeurs extrêmes7. Cela nous conduit à éliminer 62 banques supplémentaires qui sont identifiées comme présentant des valeurs extrêmes par un algorithme dédié8.

Les données sont normalisées afin de faciliter leur comparaison. Leur moyenne sur trois années (2016, 2017 et 2018) a préalablement été calculée afin de lisser les fluctuations conjoncturelles qui pourraient conduire à classifier de manière erronée une banque en surinterprétant des évolutions ponctuelles. Une période sensiblement plus longue pourrait conduire à ignorer l’évolution d’un modèle d’activité. Les données pour l’année 2019, trop souvent manquantes, ne sont pas retenues. Dans le cas contraire, l’échantillon serait divisé par plus de deux et serait essentiellement composé des plus grands établissements bancaires tandis que les petites banques allemandes et italiennes, plus particulièrement, en seraient éliminées.

La réduction de dimension permet de conserver le plus d’information possible

Sur la base des variables traditionnellement utilisées dans la littérature consacrée à l’identification du modèle d’activité des banques et d’une sélection pas à pas grâce, notamment, à une analyse de corrélation entre variables, un total de treize variables est finalement retenu (cf. tableau 1) :

  • huit variables de bilan traditionnellement présentes dans la littérature,
  • quatre variables couvrant les principales lignes du produit net bancaire selon la nature des revenus : intérêts nets, commissions nettes, plus ou moins-values9 ainsi que les autres revenus courants et,
  • une variable liée aux actifs sous gestion.

Les méthodes de classification automatiques deviennent toutefois moins efficaces à mesure que le nombre de variables retenues augmente, selon Han et Al. (2012). Les auteurs évoquent alors comme solution de réduire la dimension des données au moyen d’une analyse en composantes principales, ce que font, par exemple, Farnè et Vouldis (2017)10. Les treize variables que nous retenons initialement sont ainsi combinées linéairement en plusieurs composantes principales selon une procédure applicable à des échantillons de données de faible et de grande dimensions, et dont la précision des résultats n’est pas altérée par les valeurs extrêmes11. Contrairement à la littérature, nous prenons le parti de ne pas appliquer le critère de Kaiser12 lors du choix du nombre de composantes principales à retenir car il n’apparaît plus réellement adapté aux possibilités de la recherche actuelle13.

L’application de ce critère heuristique nous aurait conduits à ne retenir que les deux composantes principales dont la variance (ou la valeur propre/eigenvalue) est supérieure à 1 (cf. tableau 2), comme cela est généralement le cas dans la littérature. Nous retenons finalement trois composantes principales afin de conserver 79,21% de l’information contenue dans les données initiales (il s’agit, plus précisément, de la variance multivariée).

VARIABLES RETENUES
CHOIX DU NOMBRE DE COMPOSANTES PRINCIPALES À RETENIR

Méthode DIANA et méthode AGNES

Traditionnellement, la littérature utilise une méthode de classification hiérarchique ascendante (Agglomerative nesting clustering – AGNES). Cette méthode « bottom-up » se fonde sur un algorithme qui classifie les banques par agrégations successives selon la proximité de leurs caractéristiques. À chaque étape de ce processus itératif, les deux banque(s) et/ou classe(s) de banques dont la distance, mesurée par une combinaison des valeurs numériques prises par les variables les caractérisant, est la plus courte, sont agrégées en une nouvelle classe. Initialement, chaque banque est considérée comme constitutive de sa propre classe, un singleton, puis, l’échantillon total est progressivement reconstitué par agrégations successives (cf. graphique 1).

La méthode de classification automatique que nous retenons, en raison des meilleurs résultats qu’elle produit, est dite hiérarchique descendante (top-down) ou divisive (Divisive analysis clustering, DIANA). Cette méthode également itérative traite initialement l’échantillon comme une classe unique qu’elle divise ensuite en deux. À chaque (n-1) étapes, la classe la plus hétérogène (pour laquelle la variance est la plus importante) est scindée en deux en maximisant la distance14 entre les deux nouveaux groupes créés (« splinter group » et « old party »). À l’issue du processus, chaque banque se retrouve affectée à une classe unique, un singleton, qui correspond à son modèle d’activité15.

La méthode DIANA classifie les banques européennes selon cinq modèles d’activité

Notre classification produit des résultats statistiquement satisfaisants. Ces derniers tendent à valider tant l’ajout des variables relatives au produit net bancaire et aux actifs sous gestion que l’approche selon trois composantes principales. Nous identifions un nombre optimal de cinq modèles d’activité que nous désignons en nous inspirant de la littérature.

Le nombre optimal de modèles d’activité est de cinq

À l’issue du processus de classification hiérarchique (ascendant ou descendant), l’identification objective du nombre optimal de classes, terme qui n’implique aucune hiérarchie entre banques, est possible grâce à un algorithme dédié qui teste plus de trente indices différents16 dont le plus courant, l’indice de Calinski et Harabsz17. Il s’agit d’un des principaux avantages des méthodes de classifications hiérarchiques : elles ne nécessitent pas de poser, a priori, d’hypothèse sur le bon nombre de classes dans lesquelles classer les banques.

Dans le cas présent, les banques européennes de notre échantillon sont classifiées selon leur modèle d’activité en cinq classes différentes.

Dendrogramme et représentation 3D

Le résultat des divisions (ou agrégations) successives peut être représenté par un arbre de classification ou dendrogramme18 (cf. graphique 2). La hauteur des branches (ou distance cophénétique) indique la distance entre deux banques et/ou classes de banques. Plus la branche est longue, plus les deux banques/classes de banques sont différentes. Finalement, un coefficient de corrélation cophénétique peut être calculé afin d’estimer la qualité de la classification. Plus le coefficient s’approche de 1, meilleure est la classification. C’est notamment ce critère qui nous incite à utiliser la méthode DIANA plutôt que la méthode AGNES dont les coefficients s’établissent, respectivement, à 0,72 contre 0,5519. En outre, Kassambara (201720) estime que la méthode DIANA est plus adaptée que la méthode AGNES pour la classification des grands échantillons. Enfin, Roux (201821) démontre que les algorithmes descendants sont plus performants que leurs équivalents ascendants.

Les résultats de la classification peuvent être également représentés en trois dimensions, chacun des trois axes représentant une composante principale (cf. graphiques 3 à 6). Cela permet de donner une autre vision de la proximité entre les banques prisent individuellement, d’une part, et entre les classes de banques, d’autre part. Il apparaît ainsi plus clairement que les banques appartenant à la classe 2 présentent des caractéristiques comparables, tandis les caractéristiques des banques des modèles 4 et 5 sont plus hétérogènes.

De la banque de détail pure à la banque d’investissement (et assimilée)

Nous désignons les cinq modèles d’activité bancaires identifiés en nous appuyant sur la moyenne des variables observées pour chaque classe (cf. graphiques 7 à 9) ainsi qu’en reprenant les intitulés communément admis dans la littérature :

  • le modèle de la banque de détail pure regroupe les 310 banques de la classe 1 dont, en moyenne22, les prêts nets à la clientèle constituent 83% de l’actif total, les dépôts de la clientèle 74% du total de bilan et les revenus nets d’intérêts 83% du produit net bancaire,
  • le modèle de la banque commerciale orientée détail englobe les 1 491 banques de la classe 2. Les prêts nets à la clientèle constituent, en moyenne, 60% de l’actif total des banques appartenant à cette catégorie, les titres financiers 22%, les revenus nets d’intérêts et les commissions nettes, respectivement, 68% et 24% du produit net bancaire,
  • le modèle de la banque commerciale est celui des 148 banques de la classe 3. Les prêts nets à la clientèle constituent, en moyenne, 72% de l’actif total, la dette émise 26% du total de bilan tandis que les actifs sous gestion représentent 11% de l’actif total23. La répartition des revenus par source est comparable à celle des banques commerciales orientées détail,
  • le modèle de la banque d’investissement et assimilée associe les 94 banques de la classe 4. Les prêts nets à la clientèle constituent, en moyenne, 31% de l’actif total, les dépôts de la clientèle 67% du total de bilan et les commissions nettes 64% du produit net bancaire et,
  • le modèle de la banque universelle rassemble les 82 banques de la classe 5. Les prêts nets à la clientèle représentent, en moyenne, 39% de l’actif total, les actifs sous gestion 29% de l’actif total, les dépôts de la clientèle 41% du total de bilan, les revenus nets d’intérêts et les commissions nettes constituent respectivement 38% et 31% du produit net bancaire.

Les banques de détail pures sont facilement identifiables tant par la structure de leur bilan, largement orienté vers la collecte de dépôts auprès de la clientèle, que par la nature de leurs revenus essentiellement constitués d’intérêts perçus. Les banques d’investissement et assimilées se distinguent aussi très nettement des autres modèles d’activité par la prépondérance des commissions nettes au sein leur produit net bancaire. Les banques universelles se caractérisent par l’équilibre de leurs sources de revenus, au regard des banques appartenant aux autres classes pour lesquelles un type de revenus prédomine. En outre, la structure des ressources des banques universelles est très différente de celle des banques d’investissement et assimilées. De nettes dissemblances sont également observables dans la structure des ressources des deux classes de banques commerciales. La littérature distingue ainsi parfois certains de ces établissements en les qualifiant de « banques commerciales à ressources diversifiées ».

À l’instar de la littérature, nos résultats illustrent l’importance des variables bilancielles des banques pour l’identification de leur modèle d’activité. La ventilation du produit net bancaire et les actifs sous gestion s’avèrent être également pertinents. Enfin, les vingt plus grands groupes bancaires européens en termes de fonds propres CET1 semblent correctement classifiés selon leur modèle d’activité lorsque nous appliquons notre propre jugement expert (cf. tableau 3). La surreprésentation des banques universelles dans ce sous-échantillon met en exergue la corrélation entre taille de l’établissement et diversification de ses activités.

MÉTHODE DIANA ET MÉTHODE AGNES
ARBRE DE CLASSIFICATION DES BANQUES EUROPÉENNES AVEC LA MÉTHODE DIANA

REPRÉSENTATION EN TROIS DIMENSIONS DE LA CLASSIFICATION DES BANQUES AVEC LA MÉTHODE DIANA

Classification alternative avec la méthode AGNES

Dans le cadre de notre classification des banques européennes selon leur modèle d’activité, la méthode DIANA apparaît, nous l’avons dit, plus performante que la méthode AGNES. En outre, les résultats obtenus avec cette première méthode nous semblent meilleurs, au-delà des seuls critères statistiques ; les différents modèles d’activité sont plus nettement différenciables, notamment pour ce qui est des banques commerciales. Pourtant, la classification hiérarchique ascendante est souvent préférée à l’approche descendante dans la littérature24. Nous appliquons donc également cette méthode à notre échantillon à des fins de comparaison.

La méthode AGNES nécessite de poser une hypothèse supplémentaire

Comparativement à la méthode DIANA, la méthode AGNES nécessite de poser une hypothèse supplémentaire. En effet, si le calcul de la distance entre chaque banque est commun aux deux approches, la méthode AGNES nécessite de choisir entre plusieurs options afin de calculer la distance entre deux classes, sachant la distance qui a été calculée précédemment entre chaque couple de banques de ces deux classes.

La mesure d’agrégation la plus fréquemment utilisée est celle dite « de Ward ». Elle tient compte du poids relatif de chaque classe et utilise son centre de gravité comme référence pour le calcul de la distance25. La mesure d’agrégation de Ward minimise la variance totale (distance) entre les banques d’une même classe et agrège les banques ou classe(s) de banques dont la variance (distance) est également la plus faible à chaque étape. Les banques sont ainsi agrégées jusqu’à former des classes homogènes (minimisation de la distance intraclasse), les plus distinctes possibles les unes des autres (maximisation de la distance interclasse). À l’instar des résultats obtenus avec la méthode DIANA, les résultats obtenus avec la méthode AGNES peuvent être représentés par un dendrogramme (cf. graphique 10) ainsi qu’en utilisant les trois composantes principales comme axes (cf. graphiques 11 à 14). Le nombre optimal de classe est, comme avec la méthode DIANA, de cinq puisque déterminé grâce aux mêmes trente indices.

RÉPARTITION DES SOURCES DE REVENUS BANCAIRES PAR MODÈLE ÉCONOMIQUE – MÉTHODE DIANA
ÉLÉMENTS AU BILAN ET HORS-BILAN PAR MODÈLE D’ACTIVITÉ – MÉTHODE DIANA
RÉPARTITION DES SOURCES DE FINANCEMENT DE L’ACTIVITÉ BANCAIRE PAR MODÈLE D’ACTIVITÉ – MÉTHODE DIANA
ARBRE DE CLASSIFICATION DES BANQUES EUROPÉENNES AVEC LA MÉTHODE AGNES
REPRÉSENTATION EN TROIS DIMENSIONS DE LA CLASSIFICATION DES BANQUES AVEC LA MÉTHODE AGNES

La méthode AGNES rend la désignation des modèles d’activité plus délicate

Nous appliquons avec la méthode AGNES la même procédure qu’avec la méthode DIANA afin de nommer les cinq modèles d’activité identifiés. Les moyennes des variables de chaque groupe présentent des différences substantielles d’une méthode à l’autre. Aussi, les résultats sont imparfaitement comparables et nous conduisent parfois à nommer différemment la classe considérée :

  • le modèle de la banque de détail pure regroupe les 212 banques de la classe 1 dont, en moyenne, les prêts nets à la clientèle constituent 84% de l’actif total, les dépôts de la clientèle 77% du total de bilan et les revenus nets d’intérêts 86% du produit net bancaire,
  • le modèle de la banque commerciale englobe les 517 banques de la classe 2. Les prêts nets à la clientèle constituent, en moyenne, 50% de l’actif total des banques appartenant à cette catégorie, les titres financiers 34%, les revenus nets d’intérêts et les commissions nettes, respectivement, 69% et 23% du produit net bancaire,
  • le modèle de la banque commerciale orientée détail est celui des 821 banques de la classe 3. Les prêts nets à la clientèle constituent, en moyenne, 66% de l’actif total, la dette émise 1% du total de bilan, tandis les actifs sous gestion représentent 0% de l’actif total. La répartition des revenus par source demeure quasiment identique à celle des banques commerciales,
  • le modèle de la banque commerciale à ressources diversifiées associe les 380 de la classe 4. Les prêts nets à la clientèle constituent, en moyenne, 72% de l’actif total, les dépôts de la clientèle 59% du total de bilan et les commissions nettes 22% du produit net bancaire et,
  • le modèle de la banque universelle rassemble les 195 banques de la classe 5. Les prêts nets à la clientèle représentent, en moyenne, 33% de l’actif total, les actifs sous gestion 13% de l’actif total, les dépôts de la clientèle 57% du total de bilan, les revenus nets d’intérêts et les commissions nettes constituent respectivement, 33% et 45% du produit net bancaire.

Désigner le modèle d’activité des banques qui composent la classe 1 est relativement aisé. Par ailleurs, les caractéristiques moyennes des banques qui composent cette classe sont relativement similaires quelle que soit la méthode de classification hiérarchique utilisée (AGNES ou DIANA). Les banques de la classe 5 sont toujours assimilables à des banques universelles mais, au regard de la classification obtenue dans le cadre de la méthode DIANA, la classe des banques universelles au sens de la méthode AGNES englobe des banques d’investissement et assimilées au sens de la méthode DIANA. Sous réserve de retenir un nombre optimal de cinq classes, la méthode AGNES échoue donc à identifier les banques d’investissement et assimilées. Trouver des intitulés représentatifs des modèles d’activité des banques qui composent les classes 2, 3 et 4 s’avère plus délicat avec la méthode AGNES qu’avec la méthode DIANA, tant les valeurs moyennes prises par les variables qui les caractérisent sont proches (cf. graphiques 14 à 16). Plus particulièrement, les différentes sources de revenus des banques présentent une répartition extrêmement voisine pour les classes 2, 3 et 4. Cela pourrait contribuer à expliquer le recours modéré aux différentes sources de revenus bancaires dans la littérature qui utilise la classification hiérarchique ascendante. Par ailleurs, la taille relative des classes est plus homogène avec la méthode AGNES qu’avec la méthode DIANA. Cela semble plutôt contre-intuitif au regard de la surreprésentation naturelle, au sein de l’échantillon des Sparkassen allemandes ou des petites banques italiennes dont les modèles d’activité sont susceptibles d’afficher une relative similitude dans leurs activités. À cet égard, la méthode DIANA apparaît, de nouveau, plus adaptée à notre échantillon de banques européennes que la méthode AGNES. Finalement, les regroupements obtenus avec les deux méthodes de classifications hiérarchiques n’étant pas parfaitement comparables, la classification d’une banque individuelle n’a de sens qu’au regard de la classification des autres banques avec la même méthode.

RÉPARTITION DES SOURCES DE REVENUS BANCAIRES PAR MODÈLE D’ACTIVITÉ – MÉTHODE AGNES
ÉLÉMENTS AU BILAN ET HORS-BILAN PAR MODÈLE D’ACTIVITÉ – MÉTHODE AGNES
RÉPARTITION DES SOURCES DE FINANCEMENT DE L’ACTIVITÉ BANCAIRE PAR MODÈLE D’ACTIVITÉ – MÉTHODE AGNES

***

L’identification du modèle d’activité des banques présente des enjeux pour les dirigeants, les investisseurs, le régulateur, le superviseur ou encore les autorités monétaires. La sensibilité des résultats d’une banque aux évolutions conjoncturelles et financières, ses pertes maximales dans un contexte donné ou, dans un autre registre, sa capacité à transmettre la politique monétaire et à financer l’économie en phase de retournement conjoncturel dépendent, dans une large mesure, de son modèle d’activité. Pourtant, aucune définition harmonisée n’existe et le recours au jugement dit « expert » est fréquent en dépit de son caractère relativement arbitraire.

Nous proposons ainsi de classifier de manière objective les banques européennes en appliquant, dans la mesure du possible, la méthode la plus adaptée selon un ensemble de critères statistiques. Nous identifions ainsi cinq modèles d’activité - des banques de détail pures aux banques d’investissement et assimilées - qui couvrent l’ensemble des activités exercées par les banques européennes, à l’exception des établissements ultraspécialisés. Les indicateurs statistiques nous conduisent à préférer une classification hiérarchique descendante, par opposition aux méthodes ascendantes, le plus couramment utilisées dans la littérature. Notre approche repose sur trois composantes principales afin de préserver plus d’information, les auteurs en retenant généralement deux seulement. Nous soulignons également l’importance de la répartition des différentes sources de revenus des banques pour l’identification de leur modèle d’activité, outre les traditionnelles variables bilancielles.

Finalement, notre étude ouvre la voie à de nombreuses applications ultérieures. Il en va ainsi de la classification de nouvelles banques dans le cadre que nous avons établi. Il est, en outre, possible de suivre la classification d’une banque ou d’un groupe de banques au cours du temps afin d’observer les stratégies et les éventuelles transformations à l’œuvre. Répliquer l’analyse à d’autres zones géographiques contribuerait, par exemple, à en expliquer les différences de performances au niveau agrégé, au delta des différences de normes comptables. Enfin, estimer la sensibilité d’un modèle d’activité ou d’un système bancaire à la politique monétaire est également envisageable.

1 Avec l’évaluation de la gouvernance et de la gestion des risques, l’évaluation des risques portant sur les fonds propres et l’évaluation des risques de liquidité et de financement.

2 European Banking Authority, 2018, Guidelines on common procedures and methodologies for the supervisory review and evaluation process (SREP) and supervisory stress testing – Consolidated version

3 Directive 2013/36/EU du Parlement européen et du Conseil du 26 juin 2013

4 Pour une revue de la littérature, cf. notamment Cernov et Urbano, 2018, Identification of EU bank business models – A novel approach to classifying banks in the UE regulatory framework, EBA Staff Paper series, n°2 – june

5 Après nettoyage de la base de données, 2 125 groupes bancaires consolidés des 28 pays membres de l’Union européenne, plus les norvégiens et les suisses. Les groupes islandais et liechtensteinois ne sont pas retenus dans l’échantillon final faute de données suffisantes.

6 Moins les groupes bancaires islandais et liechtensteinois par manque de données.

7 Han, J., Kamber, M. & Pei, J., 2012, Data mining: concepts and techniques – 3rd ed., Morgan Kaufmann publications

8 Breunig, M., Kriegel, H., Ng, R., & Sander, J., 2000, LOF: identifying density-based local outliers. In ACM International Conference on Management of Data, pp. 93-104

9 Depuis la mise en œuvre le 1er janvier 2018 de la norme comptable IFRS 9 dans l’Union européenne, les banques sont tenues de classer leurs actifs financiers en trois catégories : les actifs évalués à leur coût amorti, les actifs évalués à leur juste valeur par le biais du résultat net et les actifs évalués à leur juste valeur par le « biais des autres éléments du résultat global » (par les fonds propres). Préalablement, les actifs financiers étaient classés, sous IAS 39, en quatre catégories : les actifs financiers à la juste valeur par le biais du compte de résultat, les placements détenus jusqu’à leur échéance, les prêts et créances et les actifs financiers disponibles à la vente.

10 Farnè, M. et Vouldis, A., 2017, Business models of the banks in the euro area, Working Paper Series, No 2070, European Central Bank

11 Hubert, M., Rousseeuw, P. & Vanden Branden, K., 2005, ROBPCA: A new approach to robust principal component analysis, Technometrics, Vol. 47, No. 1, pp.64-79

12 Kaiser, H. F., 1960, The application of electronic computers to factor analysis, Educational and Psychological Measurement, 20(1), pp. 141–151

13 Cf. notamment, Preacher, K. & MacCallum, R., 2003, Repairing Tom Swift’s electric factor analysis machine, Understanding Statistics, 2 (1), pp. 13 – 43

14 Plus précisément, la distance euclidienne

15 Pour une formalisation mathématique voir notamment Struyf, A., Hubert, M. & Rousseeuw, P., 1997, Clustering in an object-oriented environment, Journal of Statistical Software, 1(4), pp.1 – 30.

16 Charrad, M., Ghazzali, N., Boiteau, V. & Niknafs, A., 2014, NbClust: An R package for determining the relevant number of clusters in a data set, Journal of Statistical Software, 61(6), pp.1-36

17 Calinski, T. & Harabasz, J., 1974, A dendrite method for cluster analysis, Communications in Statistics, 3, pp.1-27

18 Etymologiquement : « dessin en forme d’arbre »

19 Dans le cadre d’une analyse avec seulement deux composantes principales et dans le respect du critère de Kaiser, le coefficient de corrélation cophénétique s’établit à 0,69 pour la méthode DIANA et 0,52 pour la méthode AGNES.

20 Kassambara, A., 2017, Practical guide to cluster analysis in R – Unsupervised machine learning, STHDA

21 Roux, M., 2018, A comparative study of divisive and agglomerative hierarchical clustering algorithms, Journal of Classification, 35(2), pp.345-366

22 Les valeurs en médiane sont naturellement du même ordre de grandeur.

23 Les actifs sous gestion, qui ne figurent évidemment pas au bilan, sont néanmoins rapportés à l’actif total des banques afin faciliter les comparaisons.

24 Nakache, J.-P. & Confais, J., 2004, Approche pragmatique de la classification - Arbres hiérarchiques, Partitionnements, Technip, pp. 246

25 D’autres méthodes d’agrégation utilisent généralement la distance minimale ou maximale entre deux éléments d’une classe.

LES ÉCONOMISTES AYANT PARTICIPÉ À CET ARTICLE