Tag Archives: Big Data

Een oceaan aan Big Data…

Vandaag, dinsdag 31 oktober 2017, wordt het muziekstuk ‘Music by Oceans’ uitgevoerd in Gasthuis Leeuwenbergh tijdens een symposium over oceanografie van de Universiteit Utrecht. De componist Stef Veldhuis maakte voor deze compositie gebruik van de data van de meer dan drieduizend drijvende boeien (ankers) die sinds 2007 in onze oceanen dobberen en die door middel van sondes enorme hoeveelheden data verzamelen over het zoutgehalte, de temperatuur, de stroming etc.. Op basis van al deze data kunnen wetenschappers dan weer analyses maken en voorspellingen doen over het weer en het klimaat.

Met diezelfde data kan je dus nog meer doen, zoals blijkt uit uit dit initiatief deze data via een algoritme op basis van muzikale elementen zoals ritme, toonhoogte, duur en dynamiek om te zetten in muziek waardoor we in staat worden gesteld naar oceanen te luisteren om te ervaren of er patronen te onderscheiden zijn. Traditioneel worden bij dit soort analyses gebruik gemaakt van statistische methoden en calculaties en worden de uitkomsten grafisch weergegeven om een en ander inzichtelijk te maken. Door deze data nu ook om te zetten in geluid hopen de onderzoekers ingewikkelde patronen herkenbaar te maken, aldus oceanograaf Erik van Sebille vandaag in een artikel in de Volkskrant.

Voor het symposium in Utrecht zijn 8 composities gemaakt, elk gebaseerd op een andere sonde, en via de website  musicbyoceans.org kan men zelf ook aan de slag om een eigen compositie van oceaanmuziek te maken. Het resultaat levert soms totale chaos maar ook verstilling op, afhankelijk van de plek in de oceaan.

Een interessant experiment, zeker omdat het een enorme uitdaging aan het worden is uit al die grote hoeveelheid data die we ter beschikking hebben zinnige informatie te halen. De huidige digitale analyse technieken zijn niet meer voldoende om aan de toegenomen behoefte aan analyses te voldoen. Het meer dan tien jaar opslaan van al deze data vanuit 3.000+ meetpunten levert enorme hoeveelheden data op.  Een behoorlijke uitdaging maar natuurlijk niets vergeleken bij de hoeveelheden data die tegenwoordig overal verzameld worden nu de combinatie van datacenters en het internet of things de komende jaren de hoeveelheid big data explosief zullen doen groeien.

De kernvraag daarbij is dan hoe je in een oceaan aan big data de ankers moet plaatsen op basis waarvan je meet. Als je uitgaat van oude ankers loop je de kans dat je onderliggende structuren over het hoofd ziet en dan kan het handig zijn kunstenaars van buiten de IT met een eigen visie te hulp te roepen. Dit kan leiden tot nieuwe inzichten waar dan weer op voortgeborduurd kan worden.

Werk van de Chinese kunstenaar Qiu Zhijie onlangs te zien in het Van Abbe museum in Eindhoven.

Kunstenaars zijn vaak degenen die nieuwe ontwikkelingen vroegtijdig herkennen en het kan interessant zijn deze voor dit soort projecten te gebruiken. Naast muziek kan je ook denken aan andere kunstvormen om big data inzichtelijk te maken zoals bijvoorbeeld een choreografie, een schilderij of een film. Het lijkt me interessant een choreografie te zien van de consumptie van alcohol of een schilderij over je social media netwerk. Wellicht zien we dan verbanden waarvan we ons nu nog niet bewust zijn en gaan we ons andere vragen stellen…

Arbeidsmarkt innovatie en de opkomst van de Task Marketplace

Onlangs sprak ik tijdens een wandeling met familie een neef en tijdens het gesprek kwamen we op het onderwerp “Werk”. Mijn neef is 30 en werkt momenteel als Product Manager bij een groot bedrijf, zijn vrouw is ZZP’er en beide hebben sinds een half jaar een zoon. Toen ik hem vroeg hoe het ging op zijn werk vertelde hij mij dat het hem opviel dat in zijn werkomgeving niemand meer rondliep van boven de 45. “Waar zijn al die oudere mensen gebleven?”, vroeg hij zich af. Nu hij zelf vader was geworden is hij gaan nadenken over zijn toekomst en het feit dat zijn zoon over 15 jaar gaan studeren vroeg zich af of hij dan wel nog een baan had.

De arbeidsmarkt is om allerlei redenen ontzettend veranderd de afgelopen decennia. Waar ik opgegroeid ben vanuit de zekerheid dat je na je studie een vaste baan zou krijgen en daar waarschijnlijk de rest van je carrière zou blijven werken tenzij je zelf besloot ergens anders te gaan werken. Dat is nu compleet anders. Vaste banen zijn er minder en ook al heb je er een dan heb je nog geen baanzekerheid. Als je nu aan het begin van je carrière staat heb je de keuze tussen baan, ZZP’er worden of een eigen bedrijf cq. startup oprichten. En tijdens je carrière heb je de keuze, of soms zelfs de noodzaak, van het een naar het andere model te switchen waardoor het noodzakelijk wordt jezelf steeds weer te scholen, te innoveren en nieuwe skills aan te leren.Het arbeidsmarktbeleid van de overheid loopt behoorlijk achter de ontwikkelingen op de arbeidsmarkt aan, de recente wijzigingen van het ontslagrecht en de flexwet dragen niet echt bij aan een soepelere werking hiervan. Kijk maar naar de positie van ZZP’ers en startups die als ondernemer risico nemen en geen vangnet hebben als het mis gaat. Toch ben ik er positief over de arbeidsmarkt, volgens mij zitten we momenteel midden in een periode van arbeidsmarktinnovatie waarbij niet de overheid, werknemers en werkgevers de motor van innovaties zijn maar een aantal structurele innovaties die werking van de arbeidsmarkt sterk verbeteren. En deze innovaties zijn niet gepland maar ontstonden zomaar vanuit particuliere initiatieven, blijken te werken en zijn, zonder dat we het in de gaten hadden, onmisbaar geworden… (zoals zovele innovaties overigens ongepland zijn…).

De meeste van deze innovaties hebben te maken met de digitalisering van onze samenleving en nieuwe IT oplossingen die zorgen voor allerlei nieuwe diensten en een betere werking van de arbeidsmarkt:

  1. Het ontstaan van websites als LinkedIn en Indeed waardoor de matching tussen vraag en aanbod aan banen sterk is verbeterd, er meer transparantie is en je rechtstreeks via je netwerk met potentiële nieuwe opdrachtgevers kunt communiceren, vroeger had je alleen de krant en de Intermediair, nu zijn er legio websites;
  2. Websites als Marktplaats, E-Bay, Alibaba, AirB&B en Uber maar ook lokale burenhulp en ruil apps waar kopers en verkopers hun producten en hun diensten aanbieden en er een schaduw economie ontstaat waar burgers extra inkomsten kunnen genereren;
  3. Het ontstaan van steeds weer nieuwe contractvormen naast de vaste baan of ZZP’er en flexwerker zijn waarbij je wordt betaald per verrichting, taak, per stuk, uur, aantal hits, verkocht product of verleende service;
  4. Het ontstaan van de zgn. ‘Task Marketplace’, erg populier in de VS en een manier waarop vraag en aanbod van talent en techniek op elkaar afgestemd worden op taak niveau zonder dat er een formele arbeidscontract aan ten grondslag ligt. Uitgangspunt is dat werkenden 40% van hun tijd besteden aan taken die routinematig zijn en ook door anderen zouden kunnen worden verricht, via steeds meer websites wordt dit soort werk extern aangeboden en iedereen kan zich daar op inschrijven zonder dat er sprake is van een contract;
  5. Tevens wordt er veel werk gedaan op basis van ruil of als vrijwilliger, er lopen in Nederland 7 miljoen vrijwilligers rond die een economische waarde vertegenwoordigen van zo’n 35 miljard euro. Veel van dit werk werd overigens vroeger door witte werknemers werden gedaan en is dus overgeheveld van wit naar grijs waardoor onze economie is gekrompen;

Officieel rapporteren we onze economie via de belastingdienst maar er is ook een zwarte economie (9% BNP dus zo’n 70 miljard Euro van de 663 m Euro) en een grijze die door de komst van deze internet sites flink aan het groeien is. De omvang van de grijze economie is moeilijk in te schatten omdat veel bedrijven die hier op actief zijn niet op hun transactievolume rapporteren. Alleen Marktplaats Nederland is al goed voor 9 miljard transactie omzet en deze sector groeit op jaarbasis behoorlijk. Het zou dus zomaar kunnen zijn dat door al deze ontwikkelingen de formele economie, op basis waarvan de belastingdienst rapporteert,  qua volume maar beperkt stijgt terwijl de schaduw economie sterk aan het groeien is waardoor we als samenleving in zijn totaliteit beter presteren. Niet voor niks doet de belastingdienst dan ook via Big Data onderzoek hoe deze grijze markt beter in kaart te brengen (zie mijn eerdere blog over de Belastingdienst en Big Data).

Door de toegenomen flexibiliteit is de traditionele scheiding tussen ‘werkgevers’ en ‘werknemers’ aan het wegvallen terwijl de overheid en de SER dit nog steeds als leidend principe hanteren. De trend is juist dat je op het ene moment werk aanneemt en op het volgende moment werk te vergeven hebt waardoor iedereen potentieel ondernemer is geworden en moet inspelen op nieuwe ontwikkelingen en zijn risico’s zelf moet managen. Ik denk dat er in de toekomst een verschuiving zal plaats vinden van werk op basis van een contract naar werk op basis van activiteiten die toegevoegde waarde creëren. Om dit succesvol te kunnen doen zal je de juiste skills moeten hebben deze activiteiten uit te voeren en ben je verantwoordelijk voor het up to dat houden van je eigen vaardigheden zodat je aantrekkelijk blijft voor de arbeidsmarkt. 

Veel positieve ontwikkelingen dus op de arbeidsmarkt met name door nieuwe IT oplossingen waardoor de arbeidsmarkt transparanter is geworden en nieuwe werkvormen die vraag en aanbod beter op elkaar doen aansluiten. Maar ook een toegenomen onzekerheid onder werkers over hun toekomst en of ze op termijn nog wel werk hebben waardoor je als werker continu alert moet zijn op nieuwe ontwikkelingen en daarop moet kunnen participeren. Wat dat betreft hadden wij babyboomers het destijds makkelijker maar wellicht ziet de nieuwe generatie dat anders!

De Belastingdienst en Big Data

De ICT-sector is altijd op zoek naar nieuwe aansprekende Buzz woorden waarmee ze hun proposities op de markt kunnen brengen en hun klanten nieuwe producten en services kunnen verkopen, dit onder het mom van: ‘Als je voorop wilt lopen als bedrijf moet je hiermee aan de slag gaan’  en ‘Je kunt het beste met ons in zee gaan want wij weten daar alles vanaf!’. Momenteel gaat het vooral over ‘The Cloud’, ‘The Internet of Things’ en ‘Big Data’, allemaal begrippen die niet staan voor iets nieuws maar een nieuw label zijn voor technieken en ontwikkelingen die al langer aan de gang zijn en door de commercie slim op de markt worden gezet.Online-Marketing-Expanding-Value-In-Advertising-WorldNeem Big Data, een term die staat voor het feit dat tegenwoordig ontzettend veel digitale data beschikbaar zijn omdat zowat alle transacties tegenwoordig digitaal worden vastlegd en je met moderne analyse tools verbanden en trends kunt ontdekken die een bedrijf of organisatie in staat stellen hun klanten beter te kunnen begrijpen en dus bedienen. Daarbij gaat het niet alleen om wat er in systemen vast ligt maar ook om telefoondata, zoekgedrag en gebruik van websites en sociale media. Nog niet zo lang geleden, toen al deze data nog niet beschikbaar waren, werd er ook al veel marktonderzoek gedaan door bedrijven en gespecialiseerde onderzoeksbureaus naar wat er in de omgeving van bedrijven gebeurde. Daarbij werd meestal gebruik gemaakt van eigen beschikbare data aangevuld met kwantitatief en kwalitatief onderzoek, vaak gebaseerd op steekproeven.

Het grappige is dat door de opkomst van nieuwe informatie technologie deze oude tools van marktonderzoek nu soms geen relevante resultaten meer opleveren. Zo konden bij de laatste UK verkiezingen de opiniepijlers geen goede forecast van de einduitslag doen. Als gevolg daarvan ging de discussie in de media steeds over de noodzaak van een drie partijen coalitie. Bij de definitieve einduitslag bleek dat de Torries wonnen met en absolute meerderheid. Als reden voor de slechte prognoses werd opgegeven dat het systeem van steekproeven gebaseerd op het telefoonboek nu niet meer werkt omdat 1) niet iedereen meer een vast telefoonummer heeft en 2) soms zelfs meerdere mobiele nummers heeft of 3) belt via Skype of WhatsApp. Blijkbaar biedt Big Data, als alternatief voor het doen van ouderwetse prognoses, geen uitkomst, Big Data als instrument is dus nog niet volwassen genoeg om zoiets simpels als ‘op wie ga je stemmen’ te voorspellen.

Iedereen is het er over eens dat Big Data veel potentie heeft en een belofte voor de toekomst is. Er moet echter nog heel wat gebeuren voordat bedrijven er echt wat mee kunnen. Een van de grootste problemen is natuurlijk dat er wel heel veel data opgeslagen worden maar dat dit nog niet wil zeggen dat je er dan ook toegang toe hebt. En daar waar men wel toegang heeft tot al deze data staan er wetten en regels in de weg die bepalen of je deze deze data ook daadwerkelijk mag gebruiken. Natuurlijk heeft Google toegang tot onze zoekgegevens en weet Facebook ook allemachtig veel van mijn vrienden maar dat wil nog niet zeggen dat deze bedrijven bij elkaar in de databases kunnen of mogen kijken: er spelen natuurlijk ook commerciële belangen hierbij: voor wat hoort wat!big dataDaar hebben de overheden minder last van. Vandaar dat het interresant was vorige week in De Correpondent een interview van Martijn Maurits met de algemeen directeur van de Belastingdienst Hans Blokpoel tegen te komen. In het interview ‘Baas Belastingdienst over Big Data: ‘Mijn missie is gedragsverandering’ geeft hij inzicht in de  in de case Belastingdienst die vanuit een wettelijke basis de power heeft beschikbare overheidsinformatie te gebruiken om de aanslag en het innen van belastingen te verbeteren. De Belastingdienst heeft net een mislukt project achter de rug om een nieuw informatiesysteem te implementeren, dit project heeft ruim 10 jaar geduurd en 203 miljoen euro gekost en is in 2014 gestaakt. Nu zoekt de belastingdienst de oplossing in het geautomatiseerd koppelen van alle bestaande systemen, sommige al 50 jaar oud. Hierin zijn ze nu wel succesvol en het gebruik van Big Data technieken is een essentieel onderdeel, zo niet de kern, geworden van hun nieuwe strategie ( en die ook mooie nieuwe kansen geeft voor ICT bedrijven).imageUit het interview met Hans Blokpoel, voor deze nieuwe strategie verantwoordelijk, blijkt dat hij voor openheid en transparantie is, een goede zaak! Geruststellend is ook dat de Belastingdienst alleen gebruik maakt van de eigen gekoppelde overheids data die de overheid al in huis heeft – een beetje smalle definitie van Big Data omdat alleen de beschikbare overheidsgegevens gebruikt worden. Maar daarbij gaat het wel om heel veel data en in heel veel bestanden zoals onlangs bleek uit een brief aan de Tweede Kamer van de Minister van Veiligheid en Justitie. In de bijlage bij deze brief van 24 maart 2015 staat een overzicht van de 92 koppelingen van de Belastingdienst met andere overheidsinstanties exclusief de koppelingen met de lagere overheden, die na de recente decentralisaties waarschijnlijk alleen maar zijn uitgebreid. Volgens de Rekenkamer werkt de Belastingdienst met 1.200 applicaties. Vanuit Informatie Management oogpunt een hele uitdaging voor de data analisten van de Belastingdienst om zinvolle informatie uit deze gigantische dataset van 10 miljoen belastingplichtigen en 1,2 miljoen bedrijven te halen!

Logisch dus dat er volgens Hans Blokpoel nog heel wat te halen valt uit het koppelen van deze bestanden om de efficientie van de aanslag en inning van belastinggeld te verbeteren en daar slim het label Big Data op plakt. Zo blijkt dat de Belastingdienst een eigen database heeft voor wanbetalers en in de gaten houdt of wanbetalers economische activiteiten uitvoeren die geld opleveren voor de fiscus: ‘Dynamisch Monitoren’ noemen ze dat. Gebruik maken van in andere overheidsregistraties beschikbare data lijkt me in dat geval meer dan terecht.

Waar ik wel vragen bij stel is de ‘Profiling’ van belastingbetalers die de belastingdienst aan het opzetten is. Er is een nieuw samengesteld team bezig met ‘Profiling’ van ons waarbij gekeken wordt wat de risico’s zijn met betrekking tot de aangifte en de inning. Doelstelling is in een vroegtijdig stadium doelgroepen te identificeren die een risico kunnen vormen met betrekking tot de inning van belastinggeld. Volgens Blokpoel moet daarbij gedacht worden een bijv. echtscheiding maar je kan natuurlijk ook denken aan mensen die ZZP’er worden, werkloos of ziek. Gegevens hierover zijn bij andere overheidsbestanden bekend en door koppeling kunnen deze groepen worden geïdentificeerd en door de belastingaangifte vroegtijdig benaderd, waardoor correcties achteraf van fouten worden voorkomen.

Je kan je afvragen of de overheid met deze ‘Profiling’ niet een stap te ver gaat, tot nu is het uitgangspunt dat alle burgers geacht worden de wet te kennen en belastingaangifte en betaling een verantwoordlijkheid is van de indivuduele burger die zich kan laten bijstaan door onafhankelijke belastingadviseurs. Door ‘Profiling’ en het pro-actief benaderen van burgers krijgt de overheid de rol van Big Brother en loop je het gevaar van stigmatisering als andere overheidsdiensten ook gebruik gaan maken van deze labels. Op zijn minst zou er een onafhankelijke toezichthouder moeten komen die dit soort activiteiten in de gaten houdt, toetst aan de wet en moet deze werkwijze openbaar zijn voor de burger. Nu is het niet meer dan een, welliswaar goed bedoeld, iniftiatief van de Belastingdienst niet gebaseerd op wetgeving. Handelen op Marrtkplaats Hans Blokpoel ontkent ambities te hebben ten aanzien van het gebruik van andere beschikbare online data en dat de Belastingdienst alleen de reeds in de overheidsbestanden beschikbare fiscale data gebruikt. Toch denk ik dat de Belastingsdienst vroeg of laat er niet onderuit zal komen ook externe bronnen bij de aangiftes te gaan betrekken, zie bijv. de Markplaats case hierboven. Er worden steeds meer van dit soort economische activiteiten buiten de formele economie in de schaduw economie uitgevoerd die nu fiscaal onbelast blijven (9,1% volgens schatting 2012). Het gaat hierbij dus om best grote bedragen zoals ook blijkt uit de CBS cijfers die door de EU gebruikt worden voor de afdracht aan Brussel, de handel via het internet speelt daarbij een steeds belangrijkere rol. Wij dragen als Nederland geld af op basis van fiscale gegevens plus de schatting van de schaduw economie door het CBS aan de EU terwijl we daarover zelf geen belasting innen waardoor de belasting geheel voor rekening van de belastinbetaler komt die ter goeder trouw is. Het ligt voor de hand ook economische activiteiten op Marktplaats, Uber, Airbnb, Ebay, Croqqer etc. als bron van inkomsten voor de belasting aan te boren: deze gegevens zouden via Big Data technieken aan de bestaande databronnen kunnen worden toegevoegd. Het zou goed zijn als dit punt ook op de agenda van de Belastingdienst komt en jammer dat Hans Blokpoel deze discussie in het artikel niet aankaart…

image Aanvulling 20 mei 2015: Een dag na het publiceren van bovenstaande blog kwam het nieuws naar buiten dat de Belastingdienst de komende jaren een transitie door gaat maken om bovenstaande ontwikkeling verder uit te bouwen (zie artikel in De Volkskrant van 20 mei 2015 hierboven).  Eerst zullen er 1.500 hoogopgeleide inspecteurs worden aangenomen die in staat zijn met de verbeterde informatievoorziening op basis van Big Data extra inkomsten te genereren, naar verwachting 750 miljoen tot 2 miljard per jaar. Tegelijkertijd zullen er 5.000 lager betaalde banen vervallen, hierbij gaat het om functies die nog steeds op de ouderwetse manier informatie verzamelen. Per saldo gaan er de komende jaren dus 3.500 banen weg, wordt de gemiddelde leeftijd van het personeelsbestand lager (nu 53 jaar gemiddeld) en de relatie tussen de burger en de Belastingdienst waarschijnlijk een stuk formeler… image Aanvulling 21 mei 2015: Weer een dag later is het verantwoordingsdag in de Tweede Kamer en komt Saskia Stuiveling met haar laatste rapport van de Rekenkamer waarin drie grote rsisico’s worden benoemd voor de overheid: 1) Defensie, materieel en ICT 2) Belastingdienst, verouderd ICT landschap en 3) Rijksbezuiningen die wel ingeboekt zijn maar niet gerealiseerd. De Belastingdienst herbergt volgens de Rekenkamer het grootste probleem door het gebruik van 1.200 deels verouderde applicaties die zorgen voor kwetsbaarheid voor zelfs de kleinste verandering.

Blockley

imageArrived in Blockley in the Cottswolds for a long weekend with friends in cottage Courtyard House. Always interesting to be in a country when 1) the country is waiting for a new royal baby 2) it’s Bank Holiday on Monday 4th and lots of things to do this weekend and 3) general elections are planned for Thursday May 7th: all elements to enjoy the English culture en look how the English are doing!

image

When we woke up on Saterday, with above view at our garden, the BBC reported that Kate Middleton had gone into labour and arrived at the hospital at 6:00. Great news for David Cameron and well planned the weekend just before the elections: a new Royal baby always impacts English National feelings and this is good for the Tories! Cameron was interviewed by the BBC at 8:10 and he already congratulated Kate, William and George.

The elections are important for the UK for two reasons: 1) both on the left (SNP) and right (UKIP) parties are challenging the old tory, labour and liberals landscape and these parties can for the first time make a difference and can infleunce government policies and 2) they are also important for Europe: there is are a lot of anti Europe sentiments in the UK and the outcome of this elections will also infleunce the UK policies regarding the EU.

image

Later on Saterday we heard from our friend Els B. in the Netherlands through WhatsApp that the new Princess was already born at 8:43 that morning so at the moment of the Cameron interview. As we were walking and shopping in Stratford upon Avon, just like William Shakespeare used to do, nobody was realy interested and aware of this news which surprised us! The birth of the new Princess is news but not breaking news, see also below advertisement in the Daily Telegraph they day after: ‘To us every baby is a Prince or a Princess’.

image

On Sunday we visited Blenheim Palace which I had already visted some years before. At this moment there is an exhibition on Winston Churchill’s life which was very interesting and because of that I bought in the museum the book Boris Johnson wrote on him ‘The Churchill Factor – How one man made history’. I started reading it and writing a blog about him.

On the elections we did not hear much while we were in the UK, the only thing we saw along the road were billboards for all parties in a small format, not as much as in the Netherlands. The campaign in UK is a media campaign just like everywhere else and looks to be a close call for both Conservatives and Labour, around 10 seats are expected to make the difference on election day. And the winner will need also a third party to form a coalition, both on the left as on the right. A lot of speculation on potential coalitions in the media and politicians who don’t want to tell who they want to work with after the election (although they probably already know…).

Before the elections I predicted David Cameron would win win but without enough votes to form a coalition, this was partly true: he won but with with an overall majority! and Boris Johnsson was elected as MP so in a good position now to run as a candidate when Cameron stops is five years. Strange that the polls were so wrong last weeks, it seems the researchers don’t have the tools to do a solid forecast, adn that while everybody is talking about Big Data. What’s the value of Big Data for business when you can’t even predict the results of elections?

image

Nice to be back in the UK and we enjoyed the Cottswolds again and especially our visit to Oxford where we visited the Bodleian Library where some scenes of the Harry Potter films were filmed, impressive! You can smell the past in this Library and the importance to stick with traditions and institutions which form the solid base of democratic countries.