#WiskundePlantyn

Hoe wiskunde uit de 18de eeuw bepaalt of jij online schoenen kan kopen

"Wij denken dat er gefraudeerd is met uw kredietkaart, gelieve ze te blokkeren", meldde mijn kredietkaartbeheerder me enkele weken geleden. Oeps, even mijn verrichtingen checken. Ik vond niet dadelijk een verrichting die ik niet had uitgevoerd maar ik had wel enthousiast solden gekocht in een Oostenrijkse winkel. Meerdere grote betalingen op een paar weken tijd (niet alles werd tegelijk afgeprijsd) naar een tot dan toe voor mij ongekende winkel. Dat had de aandacht getrokken van mijn kredietkaartbeheerder.

Experten voorspellen dat de online kredietkaartfraude tegen 2020 wereldwijd $32 miljard zal bedragen! En dus zetten banken massaal in op het voorkomen van dergelijke fraude. Dat doen ze via "machine learning". Dat klinkt heel futuristisch maar eigenlijk is dat gewoon het geavanceerd gebruik van statistiek om op zoek te gaan naar patronen in data of om voorspellingen te doen op basis van data.

In het geval van fraudedetectie gaat men zo op zoek naar anomalieën in data op basis van "variabiliteit". Dat is een methode die al in 1696 werd gebruikt door Newton om, in opdracht van de "Britsh Royal Mint", te zoeken naar zilverstukken waarmee gefraudeerd was. Zilverhandelaars maakten er immers een sport van om kleine deeltjes zilver van de munten af te schrapen en te verkopen voor grof geld op het Europese vaste land. The Royal Mint riep de hulp in van zijn grootste wiskundige, maar die maakte een kapitale fout…

Omdat de Britse munten toen nog met de hand geslagen werden was dat gemiddelde nooit exact 100 g. Er werd bepaald dat ieder muntstuk tussen 99 en 101 g. als geldig beschouwd mocht worden. De "variabiliteit" van ieder muntstuk was dus 1 g.

Ieder stuk afzonderlijk wegen was onbegonnen werk. Daarom woog Newton een set van 2500 muntstukken en berekende het gemiddelde gewicht. Op dat gemiddelde paste hij dezelfde variabiliteit toe als op het een individueel muntstuk. En dat was iets te kort door de bocht…
Een gemiddelde waarde van 99,5 g. was volgens Newton perfect ok. Maar stel dat je 20 muntstukken hebt waarvan er 19 precies 100 g wegen en ééntje maar 90 g. dan is het gemiddelde gewicht 99,5 g. Perfect binnen de variabiliteit volgens Newton.

Newton vergat rekening te houden met de grootte van de steekproef. Abraham De Moivre, een Zwitserse Wiskundige, zette dat recht in 1718 met regel van de Moivre*. De Moivre houdt wel rekening met de steekproefgrootte en dat levert voor grootte steekproefen een veel kleinere variabiliteit op (zie tabel). Het is die regel van De Moivre die vandaag de dag nog steeds gebruikt wordt in heel wat fraudedetectiesystemen waaronder de fraudedetectie in online betalingen met je kredietkaart.

De werkwijze is uiteraard wel geëvolueerd. Dankzij de rekencapaciteit kunnen computersystemen vandaag deze beslissing op een tijdspanne van milliseconden nemen. En dankzij data-wetenschappers worden de algoritmes steeds gesofisticeerder. Voor het bepalen van anomalieën worden alsmaar meer parameters gebruikt, zoals je inkomen, je betaalgedrag in het verleden, gedrag van gelijkaardige klanten, enz… Maar het basisprincipe is hetzelfde gebleven; zoeken naar anomalieën op basis van variabiliteit. De Moivre legde dus meer dan 300 jaar geleden al een belangrijke basis voor het online shoppen van vandaag. Ik ben hem daar alvast dankbaar voor!

Sophie Ceyssens

*Regel van De Moivre: 
variabiliteit van het gemiddelde = (variabiliteit van 1 meting)/ vierkantswortel (grootte van de steekproef)

 

Deel dit artikel

Reageer op dit artikel
(bekijk de commentaren)