SÉNAT DE BELGIQUE BELGISCHE SENAAT
________________
Session 2017-2018 Zitting 2017-2018
________________
28 juin 2018 28 juni 2018
________________
Question écrite n° 6-1918 Schriftelijke vraag nr. 6-1918

de Rik Daems (Open Vld)

van Rik Daems (Open Vld)

au vice-premier ministre et ministre de l'Emploi, de l'Economie et des Consommateurs, chargé du Commerce extérieur

aan de vice-eersteminister en minister van Werk, Economie en Consumenten, belast met Buitenlandse Handel
________________
Indice des prix à la consommation -Plateformes de vente en ligne - Prix inférieurs - Impact - Adaptation de l'indice des prix Indexcijfer van de consumptieprijzen - Online verkoopplatformen - Lagere prijzen - Impact - Aanpassing van het indexcijfer 
________________
indice des prix
coût de la vie
commerce électronique
mégadonnées
prijsindex
kosten van levensonderhoud
elektronische handel
big data
________ ________
28/6/2018Verzending vraag
(Einde van de antwoordtermijn: 2/8/2018)
26/7/2018Antwoord
28/6/2018Verzending vraag
(Einde van de antwoordtermijn: 2/8/2018)
26/7/2018Antwoord
________ ________
Aussi posée à : question écrite 6-1919 Aussi posée à : question écrite 6-1919
________ ________
Question n° 6-1918 du 28 juin 2018 : (Question posée en néerlandais) Vraag nr. 6-1918 d.d. 28 juni 2018 : (Vraag gesteld in het Nederlands)

L'indice des prix à la consommation traduit l'évolution du niveau des prix d'un ensemble de biens et services représentatif des dépenses des ménages.

L'indice des prix à la consommation mesure l'évolution du prix des produits et services que les ménages consomment. Cet indice est établi mensuellement sur la base de la valeur d'un panier contenant les principaux produits de consommation et services. L'évolution de l'indice des prix montre l'évolution du coût de la vie pour les ménages.

Un autre indice est calculé à partir de l'indice des prix à la consommation qui tient compte de l'évolution du prix de tous les produits et services : l'indice santé. Celui-ci ne tient pas compte du prix des produits du tabac, des boissons alcoolisées, de l'essence et du diesel.

L'indice santé est utilisé pour calculer l'indexation des loyers, qu'il s'agisse ou non de biens immobiliers utilisés comme habitation ou à des fins commerciales.

L'indice des prix à la consommation (IPC) ayant pour année de référence 2013=100, qui est entré en vigueur en janvier 2014, est actualisé annuellement en janvier. Les actualisations annuelles doivent maintenir la représentativité de l'indice au fil du temps et faire en sorte que l'inflation mesurée ne soit pas biaisée à mesure que l'indice vieillit. Ces actualisations peuvent se faire par le biais d'une actualisation du panier de produits, d'un ajustement des méthodes de calcul, de l'intégration de nouvelles sources de prix et de la représentativité de l'échantillon de magasins. La Commission de l'indice est composée, de manière paritaire, des organisations patronales et syndicales et de représentants du monde universitaire.

La Commission bénéficie du soutien de statisticiens de Statbel (Direction générale Statistique - Statistics Belgium). Cette Commission conseille le ministre de l'Économie sur l'ensemble des questions relatives à l'indice des prix à la consommation et émet chaque mois un avis sur l'indice calculé par Statbel.

Plusieurs économistes indiquent que l'indice classique des prix à la consommation doit être remplacé, car il ne tient pas suffisamment compte de la forte baisse des prix en ligne. Le commerce en ligne se développe en effet de plus en plus, dans tous les secteurs. Et les consommateurs dépensent de plus en plus d'argent en ligne. Récemment encore, il est apparu que les supermarchés, malgré les prix cassés qu'ils pratiquent habituellement, ne pouvaient concurrencer plusieurs produits de consommation proposés en ligne. Des études montrent que l'inflation en ligne est inférieure de 200 points de base à celle indiquée par l'indice officiel des prix. Les différences concernent principalement les télévisions, les ordinateurs et les articles de sport.

La Région flamande, la Région de Bruxelles Capitale et la Région wallonne sont compétentes pour l'économie, le logement et l'emploi, mais le pouvoir fédéral a en charge un des instruments principaux ayant un impact direct via l'indice salarial et l'indice des loyers. Il s'agit d'une compétence transversale avec les Communautés.

D'où mes questions :

1) Que pensez vous des divers rapports dont l'" Internet Trends Report " indiquant que la méthode actuelle de calcul de l'indice des prix à la consommation est dépassée étant donné qu'elle ne tient pratiquement pas compte des prix inférieurs de nombreux produits de consommation vendus en ligne, et que l'inflation actuelle est dès lors de 200 points de base trop élevée ?

2) Êtes-vous disposé à faire examiner si la méthode de calcul de l'indice des prix à la consommation ne doit pas tenir compte davantage des prix habituellement pratiqués en ligne pour les produits du panier ? Dans la négative, pourquoi et pouvez vous développer ? Dans l'affirmative, pouvez vous me communiquer le calendrier et le contenu ? Cette étude pourrait elle être confiée à la Banque nationale de Belgique ou pensez vous à une autre institution ?

3) Pouvez vous préciser si, et dans l'affirmative dans quelle mesure, l'indice actuel des prix à la consommation tient déjà compte des prix couramment pratiqués sur les plateformes de commerce en ligne ? Pouvez vous fournir des explications détaillées et des chiffres ?

4) Êtes vous disposé à demander à la Commission de l'indice d'examiner comment on peut mieux prendre en compte les prix pratiqués par les plateformes de vente en ligne pour les produits qui font partie de l'indice ? Dans la négative, pourquoi, et pouvez vous fournir des précisions ? Dans l'affirmative, pouvez vous me communiquer le calendrier et le contenu ?

 

Het indexcijfer van de consumptieprijzen geeft het verloop weer van het prijspeil van een goederen en dienstenpakket dat representatief is voor de uitgaven van de gezinnen.

Het indexcijfer van de consumptieprijzen - beter gekend als " de index " - meet de prijsevolutie van de goederen en diensten die de gezinnen consumeren. Dit indexcijfer wordt maandelijks bepaald aan de hand van de waarde van een " korf " met de belangrijkste consumptiegoederen en diensten. Het verloop van de indexcijfers toont de evolutie van de levensduurte voor de gezinnen.

Uit het indexcijfer van de consumptieprijzen, dat rekening houdt met het prijsverloop van alle goederen en diensten, wordt nog een ander indexcijfer afgeleid : het zogenaamde gezondheidsindexcijfer. Dit cijfer houdt geen rekening met de prijs van tabaksproducten, alcoholhoudende dranken, benzine en diesel.

Het gezondheidsindexcijfer wordt gebruikt om de indexering van de huurprijzen te berekenen, ongeacht of het gaat om onroerende goederen die gebruikt worden als woning of voor commerciële doeleinden.

De consumptieprijsindex (CPI) met referentiejaar 2013 = 100, die van start ging in januari 2014, wordt jaarlijks in januari geactualiseerd. De jaarlijkse actualiseringen moeten ervoor zorgen dat het indexcijfer representatief blijft doorheen de tijd en de gemeten inflatie niet vertekend wordt naarmate de index veroudert. Dit kan onder andere door het actueel houden van de productenkorf, het aanpassen van berekeningsmethoden, het integreren van nieuwe prijzenbronnen en het representatief houden van het winkelstaal. De Indexcommissie is een paritair samengestelde commissie, bestaande uit academici en werknemers en werkgeversorganisaties.

De commissie wordt ondersteund door statistici van de Statbel (algemene directie Statistiek - Statistics Belgium). Deze commissie geeft advies aan de minister van Economie over alle vraagstukken rond de consumptieprijsindex en geeft ook maandelijks advies over het door Statbel berekende indexcijfer.

Diverse economisten wijzen erop dat de klassieke consumentenindex aan vervanging toe is. Dit cijfer houdt immers onvoldoende rekening met de sterke online prijsdalingen. Online handel wint immers steeds meer aan belang en dit in alle sectoren. Een steeds groter deel van de consumentenuitgaven geschiedt online. Onlangs nog bleek dat de traditionele prijsbreker van de supermarkten niet opkan tegen de prijzen van diverse consumptiegoederen die online worden aangeboden. Onderzoek toont aan dat de online inflatie 200 basispunten lager ligt dan wat de officiële prijzenindex aangeeft. De verschillen zijn het grootst voor televisies, computers en sportartikelen.

Het Vlaams Gewest, het Brussels Hoofdstedelijk Gewest en het Waals Gewest zijn bevoegd voor economie, wonen en werkgelegenheid, maar één van de belangrijkste instrumenten die een rechtstreekse impact heeft via de loonindex en de huurindex is een federale bevoegdheid. Het betreft een transversale aangelegenheid met de Gewesten.

Ik had volgende vragen :

1) Hoe reageert u op diverse rapporten waaronder het " Internet Trends Report " dat aangeeft dat de huidige berekeningsmethode van het indexcijfer van de consumptieprijzen achterhaald is gezien er amper rekening wordt gehouden met de lagere online prijzen van veel consumptiegoederen en het huidige inflatiecijfer aldus 200 basispunten te hoog ligt ?

2) Bent u bereid te laten onderzoeken of de berekeningsmethode van het indexcijfer van de consumptieprijzen niet meer rekening moet houden met de prijzen die gangbaar zijn voor de goederen binnen deze korf die gelden bij e commerce ? Zo neen, waarom niet en kunt u dit uitvoerig toelichten ? Zo ja, wat zijn het tijdschema en de inhoud? Is dit iets voor de Belgische Nationale Bank of hebt u een andere instelling voor ogen ?

3) Kunt u toelichten of, en zo ja, in welke mate het huidige indexcijfer reeds rekening houdt met de prijzen die gangbaar zijn op de e commerce platformen ? Kunt u dit uitvoerig toelichten en cijfermatig illustreren ?

4) Bent u bereid te vragen aan de Indexcommissie om te onderzoeken hoe er meer rekening kan worden gehouden met de prijzen die gangbaar zijn voor de online verkoop platformen voor de goederen die deel uitmaken van de index ? Zo neen, waarom niet en kunt u dit toelichten ? Zo ja, wat zijn het tijdschema en de inhoud ?

 
Réponse reçue le 26 juillet 2018 : Antwoord ontvangen op 26 juli 2018 :

1) L' « Internet Trends Report » (Meeker (2018)) est basé sur un article de Goolsbee & Klenow (NBER Working Paper no 24649 (2018)). Les recherches de ces deux professeurs américains ont été effectuées à partir de données d'Adobe. Cette société américaine de logiciels dispose de données de vente en ligne (anonymisées) d'un certain nombre de détaillants américains. Les deux professeurs ont développé pour Adobe le « Digital Price Index » (DPI) (indice des prix numériques) à partir de ces données. Cet indice est disponible gratuitement sur le site internet d'Adobe.

Dans leur article, Goolsbee & Klenow arrivent à la conclusion qu'aux États-Unis, pour un certain nombre de groupes de produits, l’« inflation en ligne » est en moyenne inférieure d'environ 1 % à l'inflation de l'indice des prix à la consommation officiel américain (l'IPC, qui comprend les prix hors ligne et en ligne). Pour obtenir ce chiffre, ils s'appuient sur un certain nombre de groupes de produits du DPI d'Adobe pour lesquels ils comparent l'évolution des prix sur une période de trois ans avec l'indice officiel américain. Les résultats ne peuvent pas être extrapolés à l'indice des prix à la consommation américain complet parce qu'ils ne concernent qu'un échantillon restreint de biens de consommation rapide (pas de services, de loyer ou d'énergie, par exemple) et l'IPC américain se doit d'être représentatif de l'évolution des prix de tous les achats (y compris les achats hors ligne). L'extrapolation à d'autres pays est encore plus problématique puisqu'il s'agit d'une comparaison purement américaine et que les conditions du marché et les habitudes de dépenses des ménages, sur lesquelles le panier de l'indice des prix à la consommation est basé, peuvent diverger d'un pays à l'autre. Adobe lui-même ne prétend pas non plus que le DPI est un substitut à l'inflation telle qu'elle est mesurée par l'IPC américain. Sur son site internet, Adobe stipule lui-même : « It is intended as an addition to existing economic-data sources not a replacement. And while the Project’s indices incorporate billions of data points, that information represents only one very specific slice of the economy: digital transactions. »

Le Billion Prices Project du Massachusetts Institute of Technology est un autre projet américain de mesure l'inflation en ligne. Contrairement au DPI d'Adobe, il tente de mesurer l'ensemble du panier de l'indice en ligne. L'évolution de l'indice ainsi obtenue dans le cadre de ce projet est similaire à l'IPC officiel américain.

L'une des raisons de la différence que Goolsbee & Klenow observent entre l'inflation hors ligne et en ligne est probablement due à l'utilisation de codes de produits uniques qui identifient les produits dans le DPI d'Adobe. Il est désormais bien connu dans les statistiques européennes sur les prix – qui, dans la pratique, utilisent davantage de sources de « big data » pour les indices des prix à la consommation que les États-Unis – qu'un niveau aussi détaillé d'identification des produits peut conduire à une sous-estimation de l'inflation. Par exemple, les prix des fins de série sont inclus dans les calculs de l'indice et les relances de produits ne sont pas prises en compte (voir Eurostat (2017), Chessa (2016) et Van Loon & Roels (2018)). Plus la rotation des produits est élevée, plus l'effet est important. Les segments sur lesquels Goolsbee & Klenow s'appuient sont des segments de produits présentant une forte rotation de produits. La littérature et les recherches sur les indices indiquent clairement qu'il faut éviter d'intégrer les prix des fins de séries dans le calcul des indices des prix à la consommation, car cela conduit à une dérive négative. Pour cette raison, Eurostat ne permet, par exemple, pas d'inclure ces prix dans l'indice des prix à la consommation harmonisé.

2) Pour l'élaboration de l'indice des prix à la consommation et de l'indice des prix à la consommation harmonisé (selon les règles et la méthodologie d'Eurostat), les informations (prix et caractéristiques des produits) sont collectées de différentes manières :

– relevés de prix « classiques » dans les points de vente locaux ;

– prix recherchés de manière centralisée (catalogues de prix, en ligne, listes de prix, etc.) ;

– bases de données administratives ;

scanner data ou données du scanning à la caisse des supermarchés (données de vente agrégées (spécifications des produits, chiffre d'affaires et informations sur les prix) au niveau du produit individuel) ;

webscraping (collecte automatisée des prix sur les sites Internet des boutiques en ligne).

Les scanner data prennent en compte toutes les données de vente, qu'il s'agisse des produits achetés sur place dans le magasin ou des produits achetés par le consommateur sur la plateforme de vente en ligne du magasin (de la chaîne de magasins).

Le webscraping est entièrement basé sur les informations de prix relevées en ligne. Il s'agit d'une technique qui extrait des données automatiquement et à intervalles réguliers sur des sites Internet. Les échantillons et la fréquence de la collecte des données sont ainsi démultipliés par rapport à ce que les méthodes traditionnelles.

Ces deux « nouvelles » techniques de collecte des prix, associées à des informations recherchées manuellement en ligne, permettent d'ores déjà d'intégrer les prix en ligne à grande échelle dans l'indice. En effet, pour certains segments de consommation tels que les multimédias, les billets d'avion ou les produits électroniques grand public, seuls les prix en ligne sont utilisés dans le calcul de l'indice.

Statbel (direction générale Statistique – Statistics Belgium), qui est responsable du calcul et de l'élaboration des méthodologies de l'indice des prix à la consommation (IPC) et de l'indice des prix à la consommation harmonisé (IPCH), est ainsi l'un des précurseurs au niveau mondial en ce qui concerne l'utilisation des sources de « big data » pour le calcul des indices des prix à la consommation. Les activités de Statbel (recherches et mises en œuvre) entrent également dans le cadre des projets d'Eurostat.

Les scientifiques spécialisés en données de Statbel participent à des groupes d'experts d'Eurostat et des Nations unies, où sont élaborées des recommandations sur la meilleure méthode pour traiter les informations en ligne sur les prix dans les indices des prix à la consommation.

Les principaux segments pour lesquels le webscraping est actuellement examiné ou déjà appliqué sont les vêtements, les chaussures, les hôtels, les billets d'avion, les billets de train internationaux, les voitures d'occasion, la droguerie, les livres, les multimédias, les produits électroniques grand public, la location de chambres d'étudiants, etc.

Les résultats de quelques études de Statbel concernant le webscraping, qui comparent également les prix en ligne et hors ligne de certains segments, sont accessibles au public via les textes suivants : « Le webscraping, la collecte et le traitement de données en ligne pour l'indice des prix à la consommation » et « Integrating big data in the Belgian CPI ». Les études montrent que l'évolution des prix mesurée entre les prix en ligne et hors ligne est assez similaire (ce qui s'inscrit donc dans la lignée des constatations du MIT pour les États-Unis dans le cadre de son Billion Prices Project). Cette mesure identique de l'inflation est d'ailleurs l'une des raisons principales pour lesquelles il est prévu d'utiliser à court terme le webscraping dans l'indice des prix à la consommation pour certains segments, tels que les chaussures, de façon à ne plus devoir effectuer de collecte manuelle de données dans les magasins « physiques ».

Il n'est pas nécessaire de réaliser une étude supplémentaire sachant que Statbel effectue des recherches sur l'utilisation des données en ligne pour l'indice des prix à la consommation depuis plusieurs années déjà et communique à ce sujet et que Statbel participe à l'élaboration de méthodologies à divers niveaux internationaux.

3) Comme déjà mentionné dans la réponse à la question précédente, l'indice des prix à la consommation tient déjà compte, dans une large mesure, des ventes en ligne de biens et de services via plusieurs méthodes de collecte des prix (webscraping, scanner data et relevés manuels de prix en ligne).

Les scanner data sont déjà en grande partie utilisées pour environ 23 % du poids du panier de l'indice. Pour l'instant, les scanner data de ces groupes de produits sont encore complétées par des relevés de prix classiques dans les magasins spécialisés et chez les discounters. À l'avenir, les scanner data des discounters seront également intégrées. La collecte automatisée et manuelle des prix en ligne représente actuellement environ 8 % en poids du panier de l'indice et cette proportion passera à environ 15 % du poids à court terme. Cela signifie qu'en quelques années, près de 40 % du poids du panier seront suivis au travers de scanner data, du webscraping ou de prix en ligne. Il s'agit d'un pourcentage très élevé, si l'on garde à l'esprit que ces méthodes de collecte des prix ne sont pas utilisables pour une part importante du panier (par exemple, les services médicaux, les loyers, le prix des carburants à la pompe, les frais d'entretien des voitures, l'horeca, etc.). Le panier de l'indice doit être représentatif de toutes les dépenses de consommation des ménages en biens et services et ne peut donc se limiter aux seuls achats en ligne.

4) La représentativité du panier de l'indice ainsi que le suivi des projets concernant les prix en ligne, les scanner data, le webscraping, etc., sont inclus dans les programmes de travail annuels de la Commission de l’indice. Il n'est donc pas nécessaire de poser une question spécifique à la Commission de l’indice, étant donné que cela figure déjà explicitement dans son programme de travail.

1) Het « Internet Trends Report » (Meeker (2018)) is gebaseerd op een paper van Goolsbee & Klenow (NBER Working Paper nr. 24649 (2018)). Het onderzoek van deze twee Amerikaanse professoren is uitgevoerd op basis van gegevens van Adobe. Dit Amerikaans softwarebedrijf beschikt over (geanonimiseerde) online verkoopgegevens van een aantal Amerikaanse retailers. Beide professoren ontwikkelden voor Adobe op basis van die gegevens de « Digital Price Index » (DPI). Deze index is vrij beschikbaar op de website van Adobe.

Goolsbee & Klenow komen in hun paper tot de conclusie dat in de Verenigde Staten voor een aantal productgroepen de « online inflatie » gemiddeld ongeveer 1 % lager is dan de inflatie in de Amerikaanse officiële consumptieprijsindex (CPI, die offline en online prijzen omvat). Om dit cijfer te bekomen baseren ze zich op een aantal productgroepen uit de Adobe DPI waarvoor ze de prijsevolutie over een periode van drie jaar vergelijken met de Amerikaanse officiële index. De resultaten kunnen niet geëxtrapoleerd worden naar de volledige Amerikaanse consumptieprijsindex omdat het slechts om een beperkte steekproef van « fast moving consumer goods » gaat (bijvoorbeeld geen diensten, huur of energie) en de Amerikaanse CPI ook representatief dient te zijn voor de prijsevolutie van alle aankopen (inclusief offline). Extrapolatie naar andere landen is nog problematischer omdat het hier puur om een Amerikaanse vergelijking gaat en de marktomstandigheden alsook de bestedingspatronen van de huishoudens, waarop de indexkorf in de consumptieprijsindices is gebaseerd, kunnen verschillen van land tot land. Adobe pretendeert zelf ook niet dat de DPI een vervanging is van de inflatie zoals die gemeten wordt in de Amerikaanse CPI. Op haar website stelt Adobe zelf : « It is intended as an addition to existing economic-data sources not a replacement. And while the Project’s indices incorporate billions of data points, that information represents only one very specific slice of the economy: digital transactions. »

Een ander Amerikaans project waarbij online inflatie gemeten wordt, is het Billion Prices Project van het Massachusetts Institute of Technology. In tegenstelling tot de Adobe DPI tracht deze de volledige indexkorf online te meten. De resulterende indexevolutie die in dit project bekomen wordt, is gelijkaardig aan de officiële Amerikaanse CPI.

Eén van de redenen voor het verschil dat Goolsbee & Klenow vinden tussen de offline en online inflatie is waarschijnlijk te wijten aan het gebruik van unieke productcodes waarmee producten geïdentificeerd worden in de Adobe DPI. Het is ondertussen welbekend in Europese prijsstatistiek – waar in praktijk meer « big data » bronnen gebruikt worden voor de consumptieprijsindices dan in de Verenigde Staten – dat zulk een te gedetailleerd niveau van productidentificatie tot een onderschatting van inflatie kan leiden. Zo komen immers eindereeksprijzen in de indexberekeningen en worden herlanceringen van producten gemist (zie Eurostat (2017), Chessa (2016) en Van Loon & Roels (2018)). Hoe groter het verloop van producten hoe groter dit effect is. De segmenten waarop Goolsbee & Klenow zich baseren, zijn productsegmenten met een groot verloop aan producten. Indexliteratuur en onderzoek stellen duidelijk dat moet vermeden worden om eindereeksprijzen op te nemen in de berekening van consumptieprijsindices, aangezien dit leidt tot neerwaartse drift. Daarom is het bijvoorbeeld door Eurostat ook niet toegestaan om die prijzen op te nemen in de geharmoniseerde consumptieprijsindex.

2) Bij de opmaak van de consumptieprijsindex en de geharmoniseerde consumptieprijsindex (conform Eurostat-regels en -methodologie) wordt informatie (prijzen en productkenmerken) ingezameld op meerdere manieren :

– « klassieke » prijsopnames in plaatselijke verkooppunten ;

– centraal opgezochte prijzen (prijscatalogi, online, tarieflijsten, enz.) ;

– administratieve databanken ;

scannerdata of kassascangegevens van supermarkten (geaggregeerde verkoop-gegevens (productspecificaties, omzet en prijsinformatie) op individueel product-niveau) ;

webscraping (geautomatiseerde prijsinzameling van websites van online winkels).

Scannerdata houden rekening met alle verkoopgegevens, zowel van producten die ter plaatse in de winkel gekocht worden, als deze die de consument via het online verkoopplatform van de winkel(keten) aanschaft.

Webscraping is volledig gebaseerd op online prijsinformatie. Het is een techniek waarbij gegevens op automatische wijze van websites worden gehaald en dit op regelmatige tijdstippen. Steekproeven en de frequentie van gegevensinzameling kunnen hiermee worden uitgebreid tot een veelvoud van hetgeen haalbaar is met klassieke methodes.

Deze twee « nieuwe » prijsinzamelings-technieken, samen met manueel opgezochte online informatie, zorgen er nu reeds voor dat op ruime schaal online prijzen verwerkt worden in de index. Voor bepaalde consumptiesegmenten zoals bijvoorbeeld multimedia, vliegtuigtickets of consumentenelektronica worden zelfs uitsluitend online prijzen gebruikt in de indexberekening.

Statbel (algemene directie Statistiek – Statistics Belgium), dat verantwoordelijk is voor de berekening en methodologische uitwerking van zowel de consumptieprijsindex (CPI) als de geharmoniseerde consumptieprijsindex (HICP), is hiermee trouwens één van de voorlopers wereldwijd met betrekking tot het gebruiken van « big data » bronnen voor de berekening van consumptieprijsindices. De werkzaamheden (onderzoeken en implementaties) van Statbel kaderen ook in projecten van Eurostat. De datawetenschappers van Statbel zijn betrokken bij expertgroepen van Eurostat en de Verenigde Naties, waar aanbevelingen worden uitgewerkt over hoe het best online prijsinformatie methodologisch verwerkt kan worden in consumptieprijsindices.

De belangrijkste segmenten waarvoor webscraping momenteel wordt onderzocht of reeds toegepast, zijn kleding, schoenen, hotels, vliegtickets, internationale treintickets, tweedehandswagens, drogisterij, boeken, multimedia, consumentenelektronica, huur van studentenkamers, enz.

De resultaten van enkele studies van Statbel rond webscraping, waarin ook de vergelijking tussen offline en online prijzen voor een aantal segmenten wordt beschreven, zijn publiek beschikbaar in volgende teksten : « Webscraping, de verzameling en verwerking van online data voor de consumptieprijsindex » en « Integrating big data in the Belgian CPI ». De onderzoeken tonen aan dat de gemeten prijsevolutie tussen online en offline prijsevolutie vrij gelijkaardig is (en dus in lijn met wat het Billion Prices Project van MIT constateert voor de Verenigde Staten). Die gelijkaardig gemeten inflatie is trouwens één van de hoofdredenen van het plan om op korte termijn voor bepaalde segmenten zoals schoenen, volledig over te gaan naar het gebruik van webscraping in de consumptieprijsindex zodat er geen manuele gegevensinzameling in « fysieke » winkels meer zal plaatsvinden.

Gelet op dit alles en op het feit dat Statbel reeds enkele jaren het gebruik van online gegevens voor de consumptieprijsindex onderzoekt en hierover communiceert, en Statbel betrokken is bij de methodologische uitwerking op verschillende internationale niveaus, is het niet nodig om een bijkomend onderzoek uit te voeren.

3) Zoals reeds aangehaald in het antwoord op de vorige vraag, houdt de consumptie-prijsindex reeds in ruime mate rekening met online verkopen van goederen en diensten via meerdere prijsinzamelingsmethoden (webscraping, scannerdata en manueel online opgezochte prijzen).

Voor circa 23 % van het gewicht van de indexkorf maakt men nu reeds grotendeels gebruik van scannerdata. De scannerdata voor die productgroepen worden voorlopig nog aangevuld met klassieke prijsopnames in speciaalzaken en discounters. In de toekomst worden ook nog scannerdata van de discounters geïntegreerd. Geautomatiseerde en manuele inzameling van online-prijzen zijn momenteel samen goed voor circa 8 % van het gewicht van de indexkorf en hun belang zal op korte termijn toenemen tot circa 15 % van het gewicht. Dit betekent dat op enkele jaren tijd bijna 40 % van het gewicht van de korf via scannerdata, webscraping of online-prijzen zal worden opgevolgd. Dat is een zeer hoog percentage, indien men in het achterhoofd houdt dat een ruim deel van de korf niet in aanmerking komt voor deze prijsinzamelingsmethodes (bijvoorbeeld medische diensten, woninghuur, prijs aan de pomp voor brandstoffen, onderhoudskosten van wagens, café en restaurant, enz.). De indexkorf dient representatief te zijn voor alle bestedingen van huishoudens aan consumptieve goederen en diensten en kan dan ook niet enkel beperkt worden tot onlineaankopen.

4) De representativiteit van de indexkorf alsook het opvolgen van projecten rond online prijzen, scannerdata, webscraping, enz., zijn opgenomen in de jaarlijkse werkprogramma’s van de Indexcommissie. Een specifieke vraag dient dus niet meer gesteld te worden aan de Indexcommissie gezien dit reeds expliciet deel uitmaakt van haar werkprogramma.