· 

Die Benford Analyse

Die Benford - Analyse wird auch gerne auf Konferenzen als eine typische Methode der Datenanalyse bei der Betrugsermittlung erwähnt. Während der Vorträge darüber höre ich dann oft von anderen Zuhörern die Bemerkung, dies sei ja ein schönes Thema für einen Vortrag, aber nicht praktikabel. Von wegen "klingt ja gut was der da erzählt, aber wofür soll das gut sein?"


Dass diese Aussage Unfug ist, denn man muss die Benford - Analyse einfach mal ausprobieren und wie

einfach sie angewendet werden und welche Ergebnisse sie liefern kann, zeige ich im Folgenden.

 

Auf die Theorie dahinter muss ich dennoch kurz eingehen. Keine Bange: Das Benford´sche Gesetz

ist kein Hexenwerk! Was ist also das Motiv der Benford - Analyse?

 

Das Benford´sche Gesetz sagt aus, dass in einem unveränderten Datensatz vorhandene Wertfelder oder besser Betragsfelder immer einem bestimmten Muster von Ziffern und

Ziffernfolgen entsprechen. Soll heißen, dass die 1 an erster Stelle einer Betragszahl natürlicherweise öfter vorkommt als die 2 und die 2 öfter als die 3 und so weiter. Daher nenne ich sie auch die Theorie der signifikanten Ziffern.

 

Es gibt da noch ein paar Bedingungen, die der Datensatz und genauer noch das Feld/die Spalte, auf

die man die Benford - Analyse anwendet, erfüllen müssen:

Zusammengefasst, heißt das: Wende die Benford - Analyse am besten nur auf das Betragsfeld des Datensatzes an!
Zusammengefasst, heißt das: Wende die Benford - Analyse am besten nur auf das Betragsfeld des Datensatzes an!

Analyse in IDEA starten

So, mit dem Hintergrundwissen machen wir uns an die Analyse! Die machen wir in IDEA.

 

Ja, es ist möglich diese auch in Excel durchzuführen. Das geht mit Hilfe von Makros. Diese kannst

Du im Netz runterladen. Doch wie sicher das ist und wie sauber die Analyse auf diese Weise funktioniert, möchte ich hier nicht weiter diskutieren. Eben solche auf Betrugsermittlung spezialisierte Analysen sind nun mal die Stärke von IDEA

oder ACL. So eine Software gehört daher zur Grundausstattung in den Werkzeugkoffer eines Betrugs-Datenermittlers.

Die

eigentliche Durchführung der Auswertung ist mit der Software ein Kinderspiel:

In der geöffneten Dateiwählen wir im Reiter "Analyse" --> "Benford´s Law" und in dem sich dann öffnenden Fenster das vorher erwähnte Betragsfeld in diesem Fall "Payment_Amount" und dann sehen wir auch gleich wie das Programm rödelt und die Analyse durchführt:


Auswertung

Sobald das Ergebnis erscheint, könnte man sagen: "Und wie Sie sehen, sehen Sie nichts."

Doch wenn wir -wie in diesem GIF zu sehen- auf die Auswertung der ersten und zweiten Ziffer gehen,

sehen wir sehr wohl Auffälligkeiten in dem Datensatz:

 

Dargestellt durch die roten und gelb schraffierten Balken, sehen wir das die ersten beiden Ziffernfolgen "10…..", "50….." sowie "75….." so oft vorkommen, dass IDEA dies als "höchst verdächtig" einstuft.

 

Das bedeutet, es gibt mehr Datensätze mit diesen ersten zwei Ziffern im Feld Payment_Amount als die obere Grenze des Benford´schen Gesetzes zulässt.

Die gelb markierten Ziffernfolgen sind verdächtig oft, also noch innerhalb der Grenzen, jedoch weit

über der erwarteten Anzahl des Benford Laws vertreten. Auch diese deuten auf Manipulation und damit auf weitere Untersuchungen hin.

 

Dies macht man mit einem einfachen Mausklick auf den entsprechenden Balken. So kann man auswählen,

ob man die Datensätze anzeigen oder für tiefergehende Analysen extrahieren möchte.

IDEA Benford Analyse
Die grafische Auswertung der ersten und zweiten Ziffern in der Benford-Analyse mit IDEA zeigen Auffälligkeiten

Das bietet sich an um der Ursache für die große Häufigkeit auf den Grund zu gehen. Es kann sich ja zum Beispiel auch um reine Dauerauftragsbuchen handeln. Allerdings können es auch fingierte Rechnungsbeträge sein, also Betrug.

 

Jedenfalls bietet die Benford Analyse in vielen Fällen einen guten Einstieg, um einen Überblick über den Datensatz zu bekommen. Auf jeden Fall kann ich Benford im Einkaufsbereich empfehlen.


Kommentar schreiben

Kommentare: 0