maandag 17 oktober 2016

Wat doet big data bij u in de buurt?

Het gebruik van big data is tegenwoordig in opmars. En als er in Nederland één partij is die daarmee elke tegel kan lichten, dan is het toch wel het Centraal Bureau voor de Statistiek. Inderdaad, dit instituut komt overal, ook bij u in de buurt.

 
In “9 Slimme diensten met dank aan big data” schreef ik over big data in relatie tot Brightlands Smart Services Campus in Heerlen. In die stad is ook het Centraal Bureau voor de Statistiek gevestigd. Deze twee organisaties gaan samenwerken in een nieuw initiatief van het CBS: het Center for Big Data Statistics.

Center for Big Data Statistics
Binnen het Center for Big Data Statistics (CBDS) gaan nationale en internationale partijen uit overheid, bedrijfsleven, wetenschap en onderwijs samenwerken op het gebied van big data-technologie en big data-methoden voor de productie van officiële statistieken.

Dit moet leiden tot een statistiekvoorziening die sneller, beter en gedetailleerder is, met minder kosten en minder administratieve lasten. Daarbij moet je denken aan statistieken voor economische groei, veiligheid, gezondheid, arbeidsmarkt en sustainable development goals.
Alleen al het in kaart brengen van dat laatste onderwerp – sustainable development goals – vergt honderden statistische indicatoren. Maar dat is de moeite waard, want er zijn veel partijen die belangstelling hebben, zoals de Verenigde Naties en de Wereldbank.

Een van de internationale partijen is het Zuid-Koreaanse statistiekbureau KoStat.
Verder hebben zich gerenommeerde partijen bij het CBS aangesloten: De Nederlandsche Bank, TNO, Wereldbank, Ministerie van Economische Zaken, Microsoft, KPN, enkele andere ICT-bedrijven, APG, Provincie Limburg, Universiteit Maastricht, Open Universiteit, enkele andere (ook buitenlandse) universiteiten, Zuyd Hogeschool, Fontys Hogeschool, Eurostat, de statistiekbureaus van diverse Europese landen en – zoals gezegd – Brightlands Smart Services Campus.

Studenten, wetenschappers, startups en overige bedrijven en instellingen op Brightlands Smart Services Campus staan klaar om een bijdrage te leveren aan het Center for Big Data Statistics.

Big data bij u in de buurt
Dankzij nieuwe technieken en methoden worden statistieken ongetwijfeld beter, maar ook nu al is er een schat aan gegevens beschikbaar. Ook openbaar, voor iedereen online opvraagbaar.

Ik geef drie voorbeelden:
  • In “Honkvast” vind je een analyse van de migratie van de Nederlandse bevolking op basis van onderzoek van het Meertens Instituut
  • Kun je overal plezierig wonen?” gaat over een analyse van het woongenot in Nederland, uitgevoerd door NRC Handelsblad op basis van verschillende bronnen, waaronder het CBS.

CBSinuwbuurt
Het derde voorbeeld betreft CBSinuwbuurt. Het CBS stelt een groot aantal gegevens per gemeente, per wijk, per buurt en soms nog verfijnder beschikbaar.
Ik ben gaan kijken op www.CBSinuwbuurt.nl.

Via CBSinuwbuurt levert het CBS een waslijst aan gegevens, a big data list. Bekijk de aspecten hieronder, verdeeld over negen thema’s, of lees verder vanaf het kopje ‘Vier gemeenten vergeleken’.

1. Bevolking:
  • Aantal inwoners
  • Aantal mannen
  • Aantal vrouwen
  • Leeftijdsverdeling in procenten: 0 tot 15 jaar, 15 tot 25 jaar, 25 tot 45 jaar, 45 tot 65 jaar en 65 jaar en ouder
  • Huwelijkse staat in procenten: ongehuwd, gehuwd, gescheiden en verweduwd
  • Totaal aantal geboortes
  • Aantal geboorte per 1 000 inwoners
  • Sterfte, totaal aantal
  • Sterfte per 1 000 inwoners
  • Bevolkingsdichtheid (aantal inwoners per km2)
  • Totaal aantal particuliere huishoudens
  • Onderverdeling particuliere huishoudens in procenten: eenpersoonshuishoudens, meerpersoons huishoudens zonder kinderen, huishoudens met kinderen
  • Gemiddelde huishoudensgrootte (aantal personen)
  • Allochtonen in procenten van de totale bevolking: Westers allochtoon (totaal), niet-westers allochtoon (totaal), uit Marokko, Nederlandse Antillen en Aruba, Suriname, uit Turkije resp. overig niet-westers.
2. Bedrijven
  • Totaal aantal bedrijfsvestigingen
  • Aantal bedrijven in landbouw, bosbouw en visserij
  • Aantal bedrijven In nijverheid en energie
  • Aantal bedrijven in handel en horeca
  • Aantal bedrijven in vervoer, informatie en communicatie
  • Aantal bedrijven in financiële diensten, onroerend goed
  • Aantal bedrijven in zakelijke dienstverlening
  • Aantal bedrijven in cultuur, recreatie, overige diensten.
3. Wonen
  • Woningvoorraad (aantal woningen)
  • Gemiddelde woningwaarde (WOZ-waarde x 1.000 euro)
  • Verdeling woningvoorraad in procenten: eengezinswoningen vs. meergezinswoningen; koopwoningen, huurwoningen en eigendom onbekend
  • Verdeling woningvoorraad in procenten: bouwjaarklasse vanaf 2000 vs. bouwjaarklasse tot 2000.
4. Energieverbruik particuliere woningen
  • Gemiddeld aardgas- en elektriciteitsverbruik (m3 resp. kWh)
  • Gebruik naar woningtype (m3 resp. kWh): appartement, tussenwoning, hoekwoning, twee-onder-één-kap-woning en vrijstaande woning
  • Gebruik naar eigendom (m3 resp. kWh): huurwoning vs. koopwoning
  • Percentage woningen met stadsverwarming.
5. Inkomen
  • Aantal inkomensontvangers in particuliere huishoudens
  • Gemiddeld inkomen per inkomensontvanger (x 1 000 euro)
  • Gemiddeld inkomen per inwoner op basis van de totale bevolking in particuliere huishoudens (x 1.000 euro)
  • Verdeling personen in particuliere huishoudens in procenten: personen met laagste inkomen en personen met hoogste inkomen
  • Verdeling van particuliere huishoudens in procenten: huishoudens met laagste inkomen en huishoudens met hoogste inkomen
  • Percentage huishoudens onder of rond sociaal minimum
  • Percentage actieven 15–75 jaar.
6. Sociale zekerheid
  • Aantal algemene bijstandsuitkeringen
  • Aantal personen met een AOW-uitkering
  • Aantal arbeidsongeschiktheidsuitkeringen
  • Aantal WW-uitkeringen.
7. Motorvoertuigen
  • Aantal personenauto’s
  • Aantal personenauto’s per huishouden
  • Autodichtheid (aantal personenauto’s per km2)
  • Aantal bedrijfsmotorvoertuigen
  • Aantal motortweewielers
  • Verdeling personenauto’s: jonger dan 6 jaar vs. 6 jaar en ouder; brandstof benzine vs. overige brandstof.
8. Oppervlakte
  • Totale oppervlakte (ha)
  • Oppervlakte land (ha)
  • Oppervlakte water (ha).
9. Voorzieningen
  • Afstand tot huisartsenpraktijk
  • Aantal huisartsenpraktijken binnen 1, 3 resp. 5 km
  • Afstand tot apotheek
  • Afstand tot ziekenhuis exclusief resp. inclusief buitenpolikliniek 
  • Aantal ziekenhuizen exclusief resp. inclusief buitenpolikliniek binnen 5, 10 resp. 20 km
  • Afstand tot grote supermarkt
  • Aantal grote supermarkten binnen 1, 3 resp. 5 km
  • Afstand tot overige dagelijkse levensmiddelen
  • Aantal winkels voor overige dagelijkse levensmiddelen binnen 1, 3 resp. 5 km
  • Afstand tot warenhuis
  • Aantal warenhuizen binnen 5, 10 resp. 20 km
  • Afstand tot café
  • Aantal cafés binnen 1, 3 resp. 5 km
  • Afstand tot cafetaria
  • Aantal cafetaria’s binnen 1, 3 rep. 5 km
  • Afstand tot restaurant
  • Aantal restaurants binnen 1, 3 resp. 5 km
  • Afstand tot hotel
  • Aantal hotels binnen 5, 10 resp. 20 km
  • Afstand tot kinderdagverblijf
  • Aantal kinderdagverblijven binnen 1, 3 resp. 5 km
  • Afstand tot buitenschoolse opvang
  • Aantal buitenschoolse opvang binnen 1, 3 resp. 5 km
  • Afstand tot basisschool
  • Aantal basisscholen binnen 1, 3 resp. 5 km
  • Afstand tot voortgezet onderwijs
  • Aantal scholen voortgezet onderwijs binnen 3, 5 resp. 10 km
  • Afstand tot vmbo-scholen
  • Aantal vmbo-scholen binnen 3, 5 resp. 10 km
  • Afstand tot havo/vwo-scholen
  • Aantal havo/vwo-scholen binnen 3, 5 resp. 10 km
  • Afstand tot oprit hoofdverkeersweg
  • Afstand tot treinstation
  • Afstand tot belangrijk overstapstation
  • Afstand tot bibliotheek
  • Afstand tot zwembad
  • Afstand tot kunstijsbaan
  • Afstand tot podiumkunsten
  • Aantal podiumkunsten binnen 5, 10 resp. 20 km
  • Afstand tot poppodium 
  • Afstand tot bioscoop
  • Aantal bioscopen binnen 5, 10 resp. 20 km
  • Afstand tot sauna
  • Afstand tot zonnebank
  • Afstand tot attractie (pretpark, dierentuin of binnenspeeltuin)
  • Aantal attracties binnen 10, 20 resp. 50 km
  • Afstand tot brandweerkazerne.

Vier gemeenten vergeleken
Ontwerpbureau BuroSTUB gebruikte dit type gegevens bij opstellen van het rapport “Je zal er maar wonen: ontwerpend onderzoek naar huisvesting van kenniswerkers in een krimpregio”, waarover je meer kunt lezen in “Hoe je inspeelt op de woonwensen van kenniswerkers”.

Evenals in “Kun je overal plezierig wonen?” maak ik op basis van CBSinuwbuurt een vergelijking tussen vier gemeenten:
  • Sittard-Geleen, waar ik woon (80,53 km2, 94.000 inwoners, 1.186 inwoners per km2)
  • Midden-Drenthe, waar ik ben geboren (345,87 km2, 33.000 inwoners, 98 inwoners per km2)
  • Amsterdam, waar mijn echtgenote is geboren (219,32 km2, 821.000 inwoners, 4.954 inwoners per km2)
  • Maastricht, de provinciehoofdstad (60,03 km2, 122.000 inwoners, 2.162 inwoners per km2).
Ik geef hieronder de uitkomsten voor de thema’s bevolking, sociale zekerheid, motorvoertuigen en oppervlakte.




Stedelijkheid bepalend
Het laatste aspect – stedelijkheid – vat de verschillen tussen de gemeenten goed samen:
  • Bij sterke stedelijkheid zien we een grotere bevolking en een grotere bevolkingsdichtheid, meer personen tot 45 jaar en meer ongehuwde personen, meer eenpersoonshuishoudens en meer niet-westerse allochtonen.
    Dit gaat vooral op voor Amsterdam en in mindere mate voor Maastricht.
  • Bij zwakke stedelijkheid zien we meer personen van 45 jaar en ouder en meer gehuwde personen, meer meerpersoonshuishoudens, meer personen met een AOW-uitkering en meer personenauto’s per huishouden.
    Dit gaat vooral op voor Midden-Drenthe en in mindere mate voor Sittard-Geleen.
We zien enkele afwijkingen van die stelregels:
  • Het relatief grote aantal Westerse allochtonen in Maastricht. Dit zijn waarschijnlijk buitenlandse studenten, te oordelen naar het relatief grote aantal personen van 15 tot 25 jaar.
  • Het relatief grote aantal personen met een bijstandsuitkering en een arbeidsongeschiktheidsuitkering in Sittard-Geleen.
Het relatief grote oppervlak water in Amsterdam houdt naar mijn inschatting geen verband met de stedelijkheid en de andere statistische kengetallen.

Tenslotte
In al dit big data-geweld moeten we de privacy van de ‘gewone man’ niet uit het oog verliezen. Het is geruststellend dat CBS beschikt over het zogenaamde Privacy Audit Proof Certificate. Dit certificaat werd uitgereikt door Price Waterhouse Coopers (PwC) na een audit op basis van de normen van de Autoriteit Persoonsgegevens.
Ik hoop maar dat andere verzamelaars van big data even consciëntieus met de gegevens omgaan als het CBS.

Volg de ontwikkelingen rond het Center for Big Data Statistics op https://www.cbs.nl/nl-nl/onze-diensten/innovatie.