3 manieren waarop ongestructureerde gegevensanalyse elke auditor zal beïnvloeden
3 manieren waarop ongestructureerde gegevensanalyse elke auditor zal beïnvloeden
03 januari 2022 

3 manieren waarop ongestructureerde gegevensanalyse elke auditor zal beïnvloeden

Introductie

Het is geen geheim dat in de wereldeconomie van vandaag de emmer met data overstroomt. Naarmate onze middelen om gegevens te verzamelen, te analyseren en te interpreteren toenemen, groeit ook de beschikbaarheid en het volume van data. Dat is zowel een zegen als een last.

De inzichten die deze steeds groter wordende hoeveelheid gegevens ons kan bieden is enorm, zonder weerga en met grote gevolgen en kan veel voor ons veranderen. Auditors die Big Data gebruiken om zakelijke beslissingen te onderbouwen, laten nu al een concurrentievoordeel zien, en de sector is nog maar net begonnen.

Aan de andere kant is deze stortvloed aan gegevens ook een vloek: er is gewoon te veel van, en het wordt steeds moeilijker om het idiomatische kaf van het koren te scheiden. Het probleem wordt nog groter wanneer we ongestructureerde gegevens aan de mix toevoegen.

Denk er maar eens over na: de gegevens die we kennen - de gegevens waarmee de meeste auditors elke dag werken - zijn aanzienlijk in volume, maar relatief eenvoudig te begrijpen. Deze gestructureerde gegevens zijn kwantitatief en georganiseerd in een vast formaat, met gedefinieerde parameters. Denk aan spreadsheets, databases en ERP-systemen, en de gegevens die daarin zijn opgenomen. Denk aan balansen en onkostennota's.

Die georganiseerde, gestructureerde gegevens zijn natuurlijk van grote waarde, maar ze vertegenwoordigen slechts een vijfde van de gegevens waarover organisaties beschikken.

De rest - de overige 80% van wat volgens marktanalisten van IDC in 2025 175 zettabytes (of 175 biljoen gigabytes) aan wereldwijde gegevens zal zijn - is wat we ongestructureerde data noemen. Denk hierbij aan alles buiten de georganiseerde data, waaronder:

  • De e-mails die je vanochtend hebt beantwoord.
  • De berichten die je vanaf elk apparaat verstuurt.
  • Jouw actieve smart home-apparaat, dat te allen tijde naar je luistert.
  • De zoekopdrachten die je invoert in Google.
  • De post die je onlangs hebt geliked en becommentarieerd.
  • Die onvoltooide roman op je laptop.
  • Het artikel dat je op dit moment leest.

Met andere woorden, ongestructureerde gegevens zijn gewoon alle informatie die niet in spreadsheets of relationele databases kan worden opgenomen. Het zijn kwalitatieve gegevens, en ze zijn van nature ongeorganiseerd en moeilijk te beheren, controleren en onderhouden. En het meeste ervan is waardeloos. Maar een groot deel ervan is uiterst nuttig; het bevat inzichten die de auditfunctie radicaal kunnen veranderen en nieuwe wegen naar welvaart kunnen openen.

Het is belangrijk om hier op te merken dat, hoewel niemand waarschijnlijk jouw persoonlijke computer zal hacken en jouw onvoltooide roman zal uitkammen op zoek naar bruikbare inzichten, de informatie die jij consumeert en deelt via de digitale media en kanalen van jouw werkgever (e-mails, PDF's, Slack, documenten, enz.) over het algemeen allemaal vrij spel is voor het verzamelen door de organisatie als het gaat om ongestructureerde data-analyse.

In de toekomst zullen we dieper ingaan op het wat, waarom en hoe van ongestructureerde gegevens, maar laten we vandaag eens kijken naar drie eenvoudige manieren waarop ongestructureerde gegevensanalyse nu al de manier verandert waarop we audits bekijken.


1: Een nieuwe kijk op fraudedetectie en –analyse 

Achter elke fraudeactiviteit zit een menselijke dimensie: een motief, een middel en een feilloos menselijk vermogen om onderweg iets te verpesten. In het geval van Enron was dat deels de neiging om geprojecteerde winsten te claimen als werkelijke winsten. In Bernie Madoff's geval, was het het inzicht van een klokkenluider en de onvolmaakte toepassing van een handige kleine regel, de Wet van Benford (Benford’s Law). Fraudemotieven variëren van hebzucht tot wanhoop tot overleving (hoewel, laten we eerlijk zijn: over het algemeen is het hebzucht), en ze komen over het algemeen tot stand met de juiste afstemming van gelegenheid, druk en rationalisatie, zoals in dit artikel wordt onderzocht. maar we kunnen geen volledig beeld van fraude en het verhaal erachter krijgen zonder te kijken naar de ongestructureerde gegevens eromheen: e-mails van werknemers, sms'jes en sociale media-activiteiten, bijvoorbeeld.

Ongestructureerde gegevensanalysetools kunnen in alle bedrijfseigen en openbare gegevens peilen die met een fraude in verband kunnen worden gebracht, zodat CFE's de fraude met meer munitie kunnen opsporen en aanpakken. Heeft John, de investeringsbankier, lovende recensies over een bedrijf online gezet en vervolgens zijn aandelen in het bedrijf vrijgegeven voordat de aandelen aanzienlijk daalden? Betaalt het bedrijf verzekeringsclaims uit met grote fraudemarkers? Noemt Mary van de boekhouding onevenredig veel een bepaalde klant of persoon in e-mails? Dit zijn geen rokende wapens, maar de gedragingen achter deze communicatie kleuren allemaal het opsporen en onderzoeken van fraude.

Maar het is onmogelijk om elke e-mail van het bedrijf te lezen, zegt je. Dat is niet zo, maar wie wil dat handmatig doen? Enter ongestructureerde gegevensanalyse, ons geautomatiseerde venster op het enorme maar eindige universum van ongestructureerde gegevens. Met de juiste tool, ondersteund door de juiste software voor de analyse van auditgegevens, kunnen we deze gegevens in seconden, niet eeuwen, doorspitten om de juiste indicatoren te vinden.


2. Vergroting van cultuur en CSR-audits

 
Misschien was het de realisatie dat millennials nu het grootste segment van de beroepsbevolking vormen. Misschien waren het de tekortkomingen van maatschappelijk verantwoord ondernemen (MVO) die een nieuw licht wierpen op rampzalige arbeidsomstandigheden en de ethiek in de toeleveringsketen (denk aan de met puin bedekte GAP-t-shirts in de nasleep van de instorting van de kledingfabriek in Dhaka). Misschien was het de nieuwe zichtbaarheid van bedrijfsactiviteiten via sociale media.

Of misschien was het al van het bovenstaande, maar één ding is duidelijk: op een bepaald moment in het afgelopen decennium zijn organisaties hun rol in de wereld wat serieuzer gaan nemen. Neem de ontluikende opkomst van MVO-audits en de cultuuraudit, dat is een compleet onderzoek naar en rapport over de staat van de ethiek, aannames, normen, moraal, waarden, gedragingen van een organisatie, en alles wat bijdraagt aan de essentie van wat ze zijn: inclusief hoe werknemers en het publiek over hen denken.

Met andere woorden, de gegevens die als basis dienen voor een cultuur audit zijn bijna allemaal kwalitatief en ongestructureerd. Dit is waar ongestructureerde data-analyse tools kunnen worden geïmplementeerd om te helpen bij het uitvoeren van een cultuur audit en het onderbouwen van de bevindingen.


3. Diep inzicht door de (onvolmaakte) kunst van sentimentanalyse


De meest voor de hand liggende bron van openbaar beschikbare ongestructureerde gegevens die de meesten van ons in ons dagelijks leven gebruiken, is - je raadt het al - sociale media. Op sociale-mediakanalen worden werknemers niet beperkt door het bedrijfsprotocol. Klanten kunnen er binnen enkele seconden hun frustratie over een product of dienst naar alle uithoeken van de wereld ventileren. En influencers kunnen een levenswerk aan inspanningen in ondernemerschap in luttele seconden maken of breken.

Onze standaardmethode om het sentiment van een merk via sociale kanalen te beoordelen, is doorgaans erg handmatig. Er is echter veel vooruitgang geboekt op het gebied van sentimentanalyse, en geautomatiseerde tools geven ons nu een glimp van het collectieve sentiment ten opzichte van onze bedrijven en onze activiteiten.

Met de juiste tool voor ongestructureerde gegevensanalyse kan een organisatie bijvoorbeeld publiek beschikbare gegevens analyseren (denk aan Twitter-feeds) om een idee te krijgen van het algemene sentiment ten opzichte van hun bedrijf. Deze informatie kan enorm waardevol zijn, niet alleen om cultuur-audits te helpen verbeteren, maar ook voor wervingsdoeleinden, het beoordelen van aandelenkoersen, het analyseren van fraude, het verbeteren van activiteiten en het begrijpen van de bedrijfsidentiteit.

Sentimentanalyse is een onvolmaakte kunst die geleidelijk aan beter wordt. Een werknemer kan bijvoorbeeld de woorden "Ik haat mijn baan" in een Twitter post schrijven, maar er een foto aan toevoegen waarop de gelukkige werknemer te zien is met een gigantisch geschenk dat hij net van zijn baas gekregen heeft. In dit geval was de opmerking ironisch bedoeld - de foto geeft duidelijk aan dat ze van hun baan houden. Maar een machine zou het omgekeerde sentiment in dit voorbeeld niet detecteren - nog niet. Zoals op alle gebieden van machinaal leren worden er vorderingen gemaakt bij het vaststellen van sociale context en negatie, maar de sentimentanalyse zal nooit perfect zijn. Steeds bruikbaarder, maar niet perfect.


De kern van het verhaal

 

Het gebruik van ongestructureerde gegevens lijkt een enorm potentieel bij zich te dragen. Om betere detectives van CFE's te maken; om te begrijpen waarom de markten jouw bedrijf gewoon niet leuk vinden; om te leren wat jouw werknemers echt van je vinden. Maar het komt erop neer dat ongestructureerde gegevensanalyse slechts een hulpmiddel is in de steeds breder wordende gereedschapskist van een accountant. Ongestructureerde data-analyse is verre van een wondermiddel en pretendeert dat ook niet te zijn. Maar net zoals alle audit intelligence is ons vermogen om verdiepend in zaken zoals fraude en sentiment in context te plaatsen, vormen ongestructureerde gegevens het sediment aan de oppervlakte in deze Klondike stormloop van gegevens waaruit de goudklompjes van inzicht worden gevonden.


 Paul Leavoy is een schrijver die zich al meer dan tien jaar bezighoudt met enterprise management technologie. Momenteel doet hij onderzoek naar en schrijft hij over data analytics en internal audit technologie voor CaseWare IDEA.