Tweetalige printerversie Eentalige printerversie

Schriftelijke vraag nr. 5-6949

van Alexander De Croo (Open Vld) d.d. 29 augustus 2012

aan de vice-eersteminister en minister van Financiën en Duurzame Ontwikkeling, belast met Ambtenarenzaken

NBB - Gebruik data van Google als economische indicatoren - Voorspellen van conjuctuur

centrale bank
internet
zoekmachine
economische prognose
economische indicator
economische informatievergaring
economische analyse

Chronologie

29/8/2012Verzending vraag
28/9/2012Antwoord

Ook gesteld aan : schriftelijke vraag 5-6950

Vraag nr. 5-6949 d.d. 29 augustus 2012 : (Vraag gesteld in het Nederlands)

De centrale banken van de wereld doen in toenemende mate een beroep op Google om economische trends te voorspellen, waaronder werkloosheid, de vraag naar consumptiegoederen en vastgoedbubbels.

Traditionele economische indicatoren als bruto binnenlands product en vastgoedverkopen houden verband met het verleden. Economen maken dan voorspellingen op basis van zulke data, een gebruik dat MIT-professor Erik Brynjofsson 'in de achteruitkijkspiegel kijken' noemt.

Google-zoekopdrachten daarentegen zijn eerder naar de toekomst gericht en zouden dan ook hogere voorspellende waarde hebben. De Israëlische centrale bank gebruikt deze data al jaren lang en ook de Amerikaanse, Britse, Italiaanse, Spaanse, Turkse en Chileense banken gebruiken Google inmiddels. De Bank van Israël stelde in zijn eigen onderzoek vast dat recessies kunnen worden voorspeld op basis van Googledata.

Als centrale banken de gezondheid van de economie beter kunnen voorspellen, zijn ze ook in een betere positie om correct en proactief te handelen. Één van de redenen waarom Google zo aantrekkelijk is als economische indicator is de snelheid waarmee de informatie online wordt gezet. Officiële statistieken worden in de VS op maandelijkse basis opgesteld met een vertraging van twee weken. Google heeft maximaal drie dagen nodig.

Ik had naar aanleiding van dit slechte resultaat dan ook volgende vragen voor de minister:

1) Onderschrijft u het potentieel van zoektermen op het internet in economisch verband alsook als beleidsinstrument om de vinger aan de pols te houden wat betreft de conjunctuur?

2) Maakt de Nationale Bank van België (NBB) heden reeds gebruik van de data van zoekmachines zoals Google en/of sociale media om bepaalde trends sneller te ontdekken? Zo ja, kan dit concreet worden toegelicht en wordt er voor de data betaald? Zo neen, waarom niet en zouden zij hiervan eventueel gebruik maken naar de toekomst toe?

2) Maakt uw beleidscel en/of uw ondersteunende diensten gebruik van de data van zoekmachines op het internet zoals Google en/of sociale media? Zo ja, waarvoor worden deze data gebruikt? Zo neen, waarom niet?

Antwoord ontvangen op 28 september 2012 :

1.De economische statistieken worden over het algemeen enkele weken tot enkele maanden na de gemeten activiteit gepubliceerd. Om inzake economisch beleid de best mogelijke beslissingen te kunnen nemen, is het noodzakelijk om snel over betrouwbare informatie te beschikken.

Op basis van een doorgedreven gebruik van het internet kan snel informatie worden verstrekt over het gedrag van de consumenten en dus over bepaalde economische variabelen, vóór de publicatie van de kwantitatieve gegevens. Met tools zoals bijvoorbeeld Google Insight Search (GIS), kan de populariteit van de opzoekingen met betrekking tot bepaalde woorden/zinnen in het geheel van de opzoekingen worden opgespoord en dit per geografische zone en periode.

De GIS-gegevens worden onder andere op het gebied van de economie gebruikt. Het achterliggende idee is in grote lijnen het volgende. Vooreerst wordt op basis van economische statistieken het meest performante econometrische model opgesteld. Vervolgens wordt de GIS-index als een bijkomende verklarende variabele ingevoerd en wordt er nagegaan of de kwaliteit van de raming verbetert.

De literatuur geeft aan dat, voor bepaalde economische variabelen zoals de kleinhandelsverkopen, de autoverkoop en de werkloosheid, het opnemen van de opzoekingen in Google als verklarende variabele tot een verbetering leidt van de verklarende kracht van de modellen. Met andere woorden, de GIS-gegevens zijn nuttige informatie die in de andere verklarende variabelen niet te vinden zijn. Voor andere belangrijke variabelen verbeteren de GIS-gegevens de ramingen niet. In bepaalde gevallen zijn er sterke resultaten doorheen de verschillende modelspecificaties en de verschillende periodes. In andere gevallen zijn de resultaten gevoelig voor het specificatietype dat in aanmerking wordt genomen.

De resultaten van het tot op heden uitgevoerde onderzoek tonen aan dat de gegevens over de opzoekingen in Google een analysepotentieel vertonen. Ze kunnen nuttig zijn om gevolgtrekkingen te maken over de huidige toestand van de economie. De GIS-gegevens hebben het voordeel dat ze snel, gratis en frequent beschikbaar zijn. Ze kunnen interessant zijn in geval van niet-repetitieve schokken, wanneer de waarden uit het verleden van de economische variabelen hun voorspellende kracht verliezen.

De gegevens over de opzoekingen in Google vertonen niettemin ook enkele zwakten inzake exploitatie en interpretatie, waardoor een voorzichtig gebruik ervan nodig is.

Vanuit methodologisch oogpunt:

Telkens GIS gegevens genereert, selecteert het een nieuwe willekeurige steekproef. Deze nieuwe steekproef wordt in de Google-servers opgeslagen voor de duur van één dag, wat tot gevolg heeft dat de index van dag tot dag kan variëren. Dit gegeven zorgt voor volatiliteit in de resultaten en daarom is een bijzondere verwerking nodig.

Vanuit statistisch oogpunt:

De GIS-gegevens kunnen een systematische fout vertonen. Het gebruik van internet hangt samen met demografische factoren zoals leeftijd, scholingsgraad en inkomen, zodat het mogelijk is dat de steekproef niet representatief is voor de hele bevolking. Welnu, de GIS-gegevens worden niet gecorrigeerd voor de ondervertegenwoordiging van bepaalde categorieën.

Het gebruik van de GIS-gegevens is niet veralgemeenbaar tot alle economische variabelen, aangezien, voor sommige daarvan, studies aantonen dat de GIS-gegevens de verklarende kracht van de conventionele modellen niet verbeteren. Bovendien impliceren niet alle economische activiteiten noodzakelijkerwijs een voorafgaande opzoeking op het internet, bijvoorbeeld de investeringsbeslissingen van ondernemingen. In dat geval zijn er geen inlichtingen beschikbaar.

Bepaalde internauten zijn van oordeel dat het doeltreffender is om snel een antwoord te krijgen via de sociale netwerken, die gebruikmaken van de kennis van de gebruikers ervan, dan inlichtingen te halen uit websites en via hyperlinks te gaan.

Vanuit semantisch oogpunt:

Het is belangrijk om na te gaan of de GIS-index wel degelijk op de gewenste informatie slaat. Verscheidene fouten kunnen inderdaad aan het licht komen. Bijvoorbeeld, een opzoeking op de term “jobs” slaat ook op het woord “Steve Jobs”. Dit instrument mag dus niet louter routinematig worden aangewend. Er is telkens een voorafgaande analyse nodig om niet-relevante opzoekingen uit te sluiten.

Bovendien kunnen verschillende gebruikers die zich voor hetzelfde onderwerp interesseren totaal uiteenlopende opzoekingen uitvoeren. Zo ook kunnen gebruikers die totaal verschillende intenties hebben zeer gelijkaardige opzoekingen uitvoeren. Dit element kan voor ruis zorgen in de gegevens.

Tot besluit kan worden gesteld dat de GIS-inlichtingen als een bijkomend instrument in de analyse van de economische toestand moeten worden aangemerkt.

2. Momenteel maakt de Nationale Bank van België geen gebruik van de opzoekingen in Google. Gelet op het groeipotentieel van deze gegevens en op de verklarende kracht ervan die in sommige studies voor bepaalde variabelen wordt gerapporteerd, is het niet uitgesloten dat de NBB deze inlichtingen zou gebruiken. Zoals hiervoor werd beschreven, vertoont de exploitatie en de interpretatie van deze gegevens zwakten waarvoor een oplossing moet worden gevonden.

3. De beleidscel en de ondersteunende diensten maken geen eigen economische projecties maar gebruiken de informatie afkomstig van de economische begroting van het INR zoals voorgeschreven door de wet. Bijgevolg worden ook geen data van google of andere sociale media gebruikt in dit kader.