Version à imprimer bilingue Version à imprimer unilingue

Question écrite n° 5-6949

de Alexander De Croo (Open Vld) du 29 aôut 2012

au vice-premier ministre et ministre des Finances et du Développement durable, chargé de la Fonction publique

BNB - Utilisation de données de Google en tant qu'indicateurs économiques - Prévisions conjoncturelles

banque centrale
Internet
moteur de recherche
prévision économique
indicateur économique
intelligence économique
analyse économique

Chronologie

29/8/2012 Envoi question
28/9/2012 Réponse

Aussi posée à : question écrite 5-6950

Question n° 5-6949 du 29 aôut 2012 : (Question posée en néerlandais)

Les banques centrales du monde entier ont de plus en plus souvent recours à Google pour prévoir des tendances économiques telles que le chômage, la demande de biens de consommation et les bulles immobilières.

Les indicateurs économiques traditionnels tels que le produit intérieur brut et les ventes immobilières sont liés au passé. Or, les économistes établissent des prévisions à partir de ces données. Pour le professeur Erik Brynjofsson, c'est comme s'ils « regardaient dans le rétroviseur ».

Les recherches Google, en revanche, sont plutôt axées sur le futur et auraient dès lors une valeur prospective supérieure. Cela fait déjà un an que la Banque centrale israélienne se sert de ces données. Depuis lors, les banques américaine, britannique, italienne, espagnole, turque et chilienne utilisent elles aussi Google. La Banque israélienne a constaté, dans sa propre enquête, que les données de Google pouvaient permettre de prévoir les récessions.

Si les banques centrales savent mieux prédire la santé de l'économie, elles sont également mieux placées pour agir de manière correcte et proactive. L'une des raisons de l'attrait pour Google en tant qu'indicateur économique est la rapidité avec laquelle l'information est mise en ligne. Aux États-Unis, les statistiques officielles sont confectionnées sur une base mensuelle avec un retard de deux semaines. Google a besoin de trois jours tout au plus.

Ce piètre résultat m'amène à poser au ministre les questions suivantes :

1) Reconnaissez-vous le potentiel que présentent les termes de recherche sur internet, tant sur le plan économique qu'en tant qu'instrument politique permettant de suivre de près la conjoncture ?

2) La Banque nationale de Belgique (BNB) utilise-t-elle d'ores et déjà les données de moteurs de recherche tels que Google et/ou des médias sociaux pour découvrir plus rapidement les nouvelles tendances ? Dans l'affirmative, pouvez-vous fournir une explication concrète et les données sont-elles payées ? Dans la négative, pourquoi pas et pourrait-elle éventuellement y avoir recours dans le futur ?

2) Votre cellule stratégique et/ou vos services d'appui utilisent-ils les données des moteurs de recherche tels que Google et/ou des médias sociaux ? Dans l'affirmative, quelle est la finalité de ces données ? Dans la négative, pourquoi ?

Réponse reçue le 28 septembre 2012 :

1.Les statistiques économiques sont généralement publiées quelques semaines à quelques mois après l'activité qu'elles mesurent. Afin de pouvoir prendre les meilleures décisions possibles en matière de politique économique, il est nécessaire de disposer d'informations rapides et fiables.

L'intensification de l'usage d'internet permet de fournir une information rapide sur le comportement des consommateurs, et donc sur certaines variables économiques, avant que les données quantitatives ne soient publiées. Des outils comme par exemple Google Insight Search (GIS) permettent de comparer la popularité des recherches relatives à certains mots/phrases dans la totalité des recherches et ce, par zone géographique et période.

Les données GIS sont, en autres, utilisées dans le domaine économique. L'idée est, en gros, la suivante. On détermine tout d'abord le modèle économétrique le plus performant sur base des statistiques économiques. On introduit ensuite l'index GIS comme variable explicative additionnelle et on regarde si la qualité de l'estimation augmente.

La littérature indique que, pour certaines variables économiques comme les ventes au détail, les ventes de voitures et le chômage, l'inclusion des requêtes Google comme variable explicative permet d'augmenter le pouvoir explicatif des modèles. En d'autres termes, les données GIS apporte une information utile, non disponible dans les autres variables explicatives. Pour d'autres variables d'intérêt, les données GIS n'améliorent pas les estimations. Dans certains cas, les résultats sont robustes au travers de différentes spécifications de modèle et différentes périodes. Dans d'autres cas, les résultats sont sensibles au type de spécification retenu.

Les résultats des recherches réalisées jusqu'à présent montrent, que les données sur les requêtes Google possèdent un potentiel d'analyse. Elles peuvent s'avérer utiles pour tirer des inférences sur l'état actuel de l'économie. Les données GIS ont l'avantage de la rapidité, de la gratuité, de la fréquence élevée. Elles peuvent être intéressantes en cas de chocs non répétitifs, lorsque les valeurs passées des variables économiques perdent leur pouvoir prédictif.

Les données sur les requêtes Google présentent toutefois certaines faiblesses en matière d'exploitation et d'interprétation, ce qui requiert une utilisation prudente.

Du point de vue méthodologique :

Chaque fois que GIS génère des données, il sélectionne un nouvel échantillon aléatoire. Ce nouvel échantillon est stocké dans les serveurs Google pour une durée d'un jour, ce qui implique que l'index peut varier d'un jour à l'autre. Cet élément introduit une volatilité dans les résultats, ce qui nécessite un traitement particulier.

Du point de vue statistique :

Les données GIS peuvent présenter un biais. L'usage d'internet est corrélé avec des facteurs démographiques comme l'âge, le niveau d'éducation et le revenu, de sorte que l'échantillon peut ne pas être représentatif de la population. Or, les données GIS ne sont pas corrigées pour la sous-représentation de certaines catégories.

L'utilisation des données GIS n'est pas généralisable à l'ensemble des variables économiques étant donné que, pour certaines d'entre elles, les études montrent que les données GIS n'apportent pas de pouvoir explicatif supérieur aux modèles conventionnels. De plus, certaines activités économiques n'impliquent pas nécessairement une recherche préalable sur internet, par exemple les décisions de firmes en matière d'investissements. Dans ce cas, aucune information n'est disponible.

Certains internautes jugent qu'il est plus efficace d'obtenir une réponse rapide via des réseaux sociaux qui utilisent la connaissance de ses utilisateurs, que d'extraire des informations de websites et de passer via des hyperliens.

Du point de vue sémantique:

Il est important de vérifier que l'index de GIS porte bien sur l'information souhaitée. Plusieurs erreurs peuvent, en effet, apparaître. Par exemple, une recherche sur le terme « jobs » prend également en compte le mot « Steve Jobs ». Cet outil ne peut donc pas être utilisé de manière purement routinière mais demande, à chaque fois, une analyse préliminaire afin d'éliminer les recherches non pertinentes.

En outre, différents utilisateurs intéressés dans le même sujet peuvent rentrer des requêtes totalement divergentes. De la même manière, des utilisateurs avec des intentions totalement différentes peuvent introduire des requêtes fort similaires. Cet élément peut introduire du bruit (noise) dans les données.

En conclusion, les informations GIS doivent être considérées comme un outil supplémentaire dans l'analyse de la situation économique.

2. A l'heure actuelle, la Banque nationale de Belgique n'utilise pas les données des requêtes sur Google.

Vu le potentiel de croissance de ces données et leur pouvoir explicatif rapporté par certaines études pour certaines variables, il n'est pas exclu que la Banque nationale de Belgique exploite ces informations. Néanmoins, comme décrit à la question précédente, il reste des faiblesses dans l'exploitation et l'interprétation de ces données qui doivent être solutionnées.

3. La cellule politique et les services de soutien ne font pas leurs propres projections économiques, mais utilisent les informations provenant du budget économique de l'ICN, ainsi que le prescrit la loi. Par conséquent, aucune donnée provenant de google ou d'autres médias sociaux n’est utilisée dans cette optique.