Benford-analízis¶
A modul célja¶
A Benford-analízis modul célja, hogy a megnyitott cég könyvelési vagy NAV számlaadatai alapján gyorsan feltárja a számjegy-eloszlásban jelentkező rendellenességeket, és ezzel segítse a könyvvizsgálati, ellenőrzési és adattisztasági munkát.
A modul két, egymást kiegészítő nézőpontból vizsgálja az adatokat:
- Benford első számjegy elemzés – azt vizsgálja, hogy az első szignifikáns számjegyek eloszlása mennyire követi a Benford-törvényt,
- Mantissa Arc teszt – azt vizsgálja, hogy a logaritmikus mantisszák eloszlása mennyire tekinthető egyenletesnek.
A modul elsődleges célja nem a végleges bizonyítás, hanem a kockázatjelzés és priorizálás:
- hol lehet szükség részletesebb ellenőrzésre,
- mely adathalmaz érdemel mélyebb vizsgálatot,
- mely mentett lekérdezés vagy adatforrás mutat szokatlan mintázatot.
Mit csinál a modul röviden?
A modul a kiválasztott összeghalmazból statisztikai jellegű mintázatokat számol, majd táblázatos és grafikus formában megmutatja, hogy az adatok mennyire viselkednek természetes, elvárt módon.
-
Mit vizsgál?
Első számjegy-eloszlást és mantissza-mintázatot vizsgál ugyanazon adathalmazon.
-
Mit lehet kiválasztani?
A felhasználó adatforrást és elemzett mezőt is választhat, így ugyanaz a halmaz több nézőpontból is ellenőrizhető.
-
Mit jelez az eredmény?
Nem végleges bizonyítást ad, hanem gyors kockázatjelzést és priorizálást támogat.
-
Mit lehet exportálni?
A Benford eredmények több formátumban exportálhatók, a Mantissa Arc eredmények pedig
PDF,Excelés különCSVexportban is megjelennek.
Hol érhető el?¶
A modul az alkalmazás felső menüsorából nyitható meg:
Elemzések > Anomáliák > Benford-analízis
Kinek szól a modul?¶
A modul minden olyan felhasználónak hasznos lehet, aki nagyobb mennyiségű pénzügyi vagy számlaadat mintázatait szeretné gyorsan áttekinteni, és szeretné azonosítani azokat a részhalmazokat, amelyek további vizsgálatot igényelhetnek.
Különösen hasznos azokban a helyzetekben, amikor a cél:
- a természetes és a szokatlan számjegyeloszlási minták elkülönítése,
- a részletesebb ellenőrzésre érdemes adathalmazok priorizálása,
- az adatok szerkezeti sajátosságainak gyors vizuális áttekintése,
- a további elemzési lépések fókuszának kijelölése.
A felhasznált elemzési módszerek¶
Benford-törvény röviden¶
A Benford-törvény szerint sok természetes eredetű, több nagyságrendet átfogó adathalmazban az első számjegyek nem egyenletesen fordulnak elő.
Az elvárt első számjegy gyakoriság például:
| Első számjegy | Várható gyakoriság |
|---|---|
1 | kb. 30,10% |
2 | kb. 17,61% |
3 | kb. 12,49% |
9 | kb. 4,58% |
A modul a következő képletet használja:
ahol d az első számjegy (1..9).
Mikor hasznos a Benford-elemzés?¶
Különösen akkor, ha az adatok:
- sok különböző nagyságrendet tartalmaznak,
- természetes üzleti folyamatból keletkeztek,
- nem mesterségesen generált, nem fix tartományra korlátozott értékek.
Fontos
A Benford-törvény nem minden adathalmazra alkalmazható. Ha az adatok erősen szabályozottak, küszöbölt értékekből állnak, vagy szűk tartományban mozognak, akkor az eltérés önmagában nem jelent problémát.
Mantissa Arc teszt röviden¶
A Mantissa Arc teszt a kiválasztott abszolút értékek log10 transzformáltjának tört részét, azaz a mantisszát vizsgálja.
A számítás lényege:
A mantisszák ideális esetben közel egyenletesen oszlanak el a 0..1 tartományon. A modul ezt kétféleképpen szemlélteti:
- Pontfelhő körre vetítve – a mantisszák körkoordinátákra vetítve,
- Mantissza-hisztogram – a mantisszák eloszlása 10 binben.
A körre vetítés:
Ha a pontok erősen egy irányba koncentrálódnak, az szabályos vagy mesterséges mintázatra utalhat.
A képernyő felépítése¶
A képernyő 5 fő részre osztható:
- Fejléc – a modul neve és rövid célleírása
- Adatforrás-választó blokk – forrás, elemzett mező kiválasztása és frissítés
- Összesítő kártyák – elemszám, gyanús számjegyek, rövid következtetés
- Görgethető tartalom – Benford táblázat, Benford diagram, Mantissa Arc teszt
- Alsó műveleti sáv – lekérdezési statisztika, export, bezárás
| Képernyőrész | Tartalom |
|---|---|
Fejléc | Benford-analízis cím és rövid célleírás |
Adatforrás | forrás kiválasztása, elemzett mező kiválasztása, frissítés |
Összesítés | elemzett tételek, gyanús számjegyek, következtetés |
Benford rész | Benford tábla és Benford diagram |
Mantissa Arc rész | összegzés, pontfelhő, hisztogram |
Státuszsor | lekérdezési idő, export, bezárás |
Képernyőkép #1 – teljes nézet
Készíts képernyőképet a teljes Benford-analízis ablakról úgy, hogy már legyen lefuttatott elemzés. Jó, ha egyszerre látszik a felső adatforrás-választó, az összesítő blokk, a számjegy-eloszlás tábla, a Benford diagram, valamint a Mantissa Arc pontfelhő és hisztogram is.
A használat folyamata lépésről lépésre¶
Előfeltétel¶
A modul csak akkor használható, ha:
- van megnyitott cég,
- a cég adatbázisa elérhető,
- az adott adatforrás már be van töltve a rendszerbe,
- AuditXML vagy NAV fejléc adatok rendelkezésre állnak.
Javasolt használati folyamat¶
- Nyissa meg a
Benford-analízismodult. - Az
Adatforráslegördülőből válassza ki a vizsgálandó adathalmazt. - Az
Elemzett mezőlegördülőből válassza ki, hogy mely összegmező alapján történjen a számítás. - Szükség esetén kattintson a
🔄 Frissítésgombra az adatforráslista újratöltéséhez. - Az adatforrás vagy az elemzett mező kiválasztása után a modul automatikusan lefuttatja az elemzést.
- Tekintse át az összesítő kártyákat:
Elemzett tételekGyanús számjegyekÖsszesítő következtetés- Nézze meg a részletes táblázatot, hogy mely számjegyek térnek el leginkább.
- Vizsgálja meg a Benford diagramot a trend gyors áttekintéséhez.
- Tekintse át a Mantissa Arc részt:
- pontfelhő,
- mantissza-hisztogram,
- koncentrációs összegzés.
- Szükség esetén exportálja az eredményt
Excel,PDFvagyCSVformátumba.
Tipikus első használat¶
Ha most használja először a modult, érdemes:
- először a
📊 Teljes AuditXMLadatforrást megnézni, - utána a releváns mentett lekérdezéseket külön-külön is elemezni,
- majd összehasonlítani a Benford és a Mantissa Arc eredményeket.
Gyakorlati javaslat
Ha egy mentett lekérdezés gyanús Benford-eltérést mutat, érdemes ugyanazt a részhalmazt QueryBuilderben vagy más részletező nézetben tovább bontani partnerre, időszakra vagy naplóra.
Input adatok és adatforrások¶
Közvetlen felhasználói inputok¶
A modul kevés manuális paramétert kér, a fő döntési pont az adatforrás kiválasztása.
| Paraméter / vezérlő | Típus | Jelentés |
|---|---|---|
Adatforrás | legördülő | Meghatározza, mely adathalmazon fusson az elemzés |
Elemzett mező | legördülő | Meghatározza, mely összegmező alapján történjen a Benford- és Mantissa-számítás |
🔄 Frissítés | gomb | Újratölti az elérhető adatforrások listáját |
Export | legördülő gomb | Az eredmény exportálása Excel, PDF, CSV (Benford) vagy CSV (Mantissa Arc) formátumba |
Bezárás | gomb | Bezárja az ablakot |
Elérhető adatforrás-típusok¶
A modul az alábbi típusokkal tud dolgozni:
| Adatforrás típus | Leírás | Alapértelmezett mező |
|---|---|---|
Teljes AuditXML | Az összes elérhető AuditXML könyvelési adat | osszeg |
Mentett AuditXML lekérdezés | Elmentett részhalmaz az AuditXML adatokból | osszeg, vagy a mentett lekérdezéshez tartozó kiválasztott értékmező |
Teljes NAV Fejléc | NAV számla fejléc adatok teljes halmaza | invoice_gross_amount_huf |
Mentett NAV lekérdezés | Elmentett részhalmaz a NAV fejléc adatokból | a mentett lekérdezéshez tartozó kiválasztott értékmező |
A háttérben használt értékmezők¶
A modul nem tetszőleges oszlopon számol, hanem csak az engedélyezett összegmezőkön.
| Lehetséges értékmező | Jelentés |
|---|---|
osszeg | összeg |
devosszeg | devizaösszeg |
afaalap | áfaalap |
| Lehetséges értékmező | Jelentés |
|---|---|
invoice_gross_amount_huf | bruttó összeg HUF-ban |
invoice_net_amount_huf | nettó összeg HUF-ban |
invoice_vat_amount_huf | áfaösszeg HUF-ban |
Mi számít elemzett tételnek?
A modul csak a nem nulla, számmá alakítható, érvényes numerikus összegeket veszi figyelembe.
Képernyőkép #2 – adatforrás választó
Készíts képet a felső adatforrás-választó blokkról úgy, hogy a legördülő lista nyitva legyen, és látható legyen legalább egy teljes adatforrás és néhány mentett lekérdezés.
A paraméterek és kezelőszervek hatása az eredményre¶
Adatforrás¶
Ez a legfontosabb paraméter, mert teljesen meghatározza, hogy:
- milyen rekordok kerülnek be a vizsgálatba,
- melyik értékmező szolgál számítási alapul,
- milyen számjegy-eloszlás és mantissza-mintázat jön létre.
Közvetlen hatása:
- más adatforrás → más elemszám,
- más értékmező → más első számjegyek,
- más részhalmaz → más Benford- és Mantissa-eredmény.
Elemzett mező¶
Ez a második legfontosabb tényleges elemzési paraméter.
Hatása az eredményre:
- ha például
osszeghelyettdevosszegalapján történik a számítás, a teljes eloszlás megváltozhat, - NAV esetén a
bruttó,nettóésáfamezők eltérő eloszlást adhatnak, - ugyanazon adatforráson belül is teljesen más mintázat jelenhet meg a kiválasztott mezőtől függően.
A modul viselkedése:
- AuditXML adatforrásnál
Összeg,Devizaösszeg,Áfaalapválasztható, - NAV fejléc adatforrásnál
Bruttó összeg (HUF),Nettó összeg (HUF),Áfa összeg (HUF)választható, - adatforrásváltáskor a rendszer az adott forrástípushoz illeszkedő mezőlistát kínálja fel.
🔄 Frissítés¶
A gomb újratölti az adatforráslistát, beleértve a mentett lekérdezéseket is.
Mikor fontos?
- új mentett lekérdezés készült,
- egy mentett lekérdezés módosult,
- másik cég megnyitása után a lista frissítése szükséges.
Export¶
Az export nem módosítja az elemzést, csak a már elkészült eredményeket menti ki.
Jelenlegi működés
Az export funkció formátumonként eltérő részletességet kínál: a PDF a teljes vizuális összképet adja, míg a CSV export külön választható a Benford és a Mantissa Arc hisztogram adataihoz.
A számítási logika részletesen¶
Adatbetöltés és előszűrés¶
A modul a kiválasztott adatforrásból az értékmező tartalmát olvassa ki, majd minden sorra elvégzi az alábbi lépéseket:
NULLértékek kizárása- számmá konvertálás
- abszolút érték képzése:
|x| - a nem értelmezhető vagy az elemzésre nem alkalmas numerikus értékek kizárása
Ennek eredménye a ténylegesen elemezhető értékhalmaz.
Első szignifikáns számjegy meghatározása¶
A modul a vezető számjegyet numerikusan határozza meg, nem karakterkivágással.
A logika:
Ez azért fontos, mert így a 0 < |x| < 1 tartományba eső értékek is helyesen kezelhetők.
Példák¶
| Érték | Első szignifikáns számjegy |
|---|---|
1250 | 1 |
87,3 | 8 |
0,0452 | 4 |
-702 | 7 |
Benford várható értékek számítása¶
A modul 1..9 számjegyekre kiszámítja a Benford szerinti várható százalékot.
Ezután minden számjegyre meghatározza:
ActualCount– tényleges darabszám,ActualPct– tényleges százalék,Deviation– eltérés a várt értéktől.
Gyanús számjegyek meghatározása¶
A modul egy számjegyet akkor jelöl gyanúsnak, ha az abszolút eltérés legalább 5,0 százalékpont.
Ez alapján készül:
- a táblázat soronkénti státusza,
- a
Gyanús számjegyekösszesítő érték, - az összesítő következtetés.
Mit jelent a 5% küszöb?
Ez egy egyszerű, jól értelmezhető gyakorlati küszöb. Nem helyettesít formális statisztikai próbát, hanem gyors figyelmeztető szabályként működik.
Mantissa Arc számítás¶
Minden érvényes értékre a modul kiszámítja a mantisszát:
Ezután:
- körkoordinátákra vetíti a mantisszát,
- pontfelhőt épít,
- 10 darab hisztogram-binbe sorolja az értékeket,
- kiszámítja az átlagvektort és annak hosszát.
A koncentrációs mutató:
ahol:
sumXéssumYa körre vetített pontok koordinátáinak összege,Naz elemzett tételek száma.
Mantissa értelmezési küszöbök a modulban¶
R tartomány | Megjelenített minősítés |
|---|---|
< 0,15 | ✅ Közel egyenletes mantissza-eloszlás |
< 0,30 | ⚠️ Mérsékelt mantissza-koncentráció |
>= 0,30 | 🚨 Erős mantissza-koncentráció |
Vizualizációs beállítások¶
A modul a Mantissa Arc résznél két fix beállítást használ:
| Paraméter | Érték | Jelentés |
|---|---|---|
MantissaHistogramBinCount | 10 | a mantissza-hisztogram 10 sávot használ |
MaxMantissaScatterPoints | 2500 | nagy adathalmaznál legfeljebb 2500 pont jelenik meg a pontfelhőn |
Miért van pontszám-korlát?
A pontfelhő grafikus teljesítménye és áttekinthetősége érdekében a modul mintát jelenít meg, miközben az összesítő statisztikák a teljes elemzett adathalmazra számolódnak.
Az eredmények értelmezése¶
Összesítő kártyák¶
| Kártya | Jelentés |
|---|---|
Elemzett tételek | Hány rekord került ténylegesen be a számításba |
Gyanús számjegyek | Hány számjegy lépte át az 5% eltérési küszöböt |
Összesítő következtetés | Gyors, rövid értelmezés a Benford-eltérésről |
Számjegy-eloszlás táblázat¶
A táblázat minden számjegyre megmutatja:
| Oszlop | Jelentés |
|---|---|
Sz.jegy | az első szignifikáns számjegy |
Benford | az elvárt százalékos arány |
Db | a tényleges darabszám |
Tényleges | a tényleges százalékos arány |
Eltérés | a tényleges és a várt érték különbsége |
Státusz | OK vagy Gyanús |
A gyanús sorokat a felület piros háttérrel emeli ki.
Benford diagram¶
A diagram két oszlopsorozatot mutat:
Benford (várható %)Tényleges %
Ez különösen akkor hasznos, ha gyorsan szeretné látni:
- egyetlen számjegynél van-e kiugrás,
- általános torzulás figyelhető-e meg,
- a kisebb számjegyek vagy a nagyobb számjegyek felé tolódik-e az eloszlás.
Mantissa Arc pontfelhő¶
A pontfelhő a mantisszák körre vetített mintázatát mutatja.
Mit érdemes figyelni?
- egyenletes, kör mentén szórt pontok → természetesebb eloszlás,
- sűrűsödés bizonyos íveken → koncentrált mintázat,
- rövid átlagvektor → kisebb koncentráció,
- hosszú átlagvektor → erősebb koncentráció.
Mantissza-hisztogram¶
A hisztogram a 0,0–1,0 tartomány 10 részre osztott eloszlását mutatja.
Mit érdemes figyelni?
- viszonylag egyenletes sávok → közel természetes mantissza-eloszlás,
- egy-egy sáv dominanciája → torzult vagy szabályos mintázat.
Képernyőkép #3 – Mantissa Arc rész
Készíts külön képernyőképet a Mantissa Arc szekcióról úgy, hogy egyszerre jól látszódjon a rövid szöveges összegzés, a pontfelhő és a mantissza-hisztogram.
Export lehetőségek¶
A modul négy exportlehetőséget kínál:
- külön munkalapon exportálja a
Benfordés aMantissa Arcadatokat - tartalmazza a Benford táblázatot és a Mantissza-hisztogram bin értékeit
- a Mantissa Arc lapon a sávok, darabszámok és százalékos arányok is megjelennek
- riport formában tartalmazza a Benford táblázatot és a Benford diagramot
- tartalmazza a Mantissa Arc teszt összegzését és diagramjait is
- a diagramok képként kerülnek beágyazásra
- a Benford táblázat egyszerű, pontosvesszős exportja
- jól használható további táblázatos feldolgozáshoz vagy archiváláshoz
- a Mantissza-hisztogram sávjainak táblázatos exportja
- a sávazonosítót, tartományt, darabszámot és százalékos arányt tartalmazza
Fontos megjegyzések az exportnál¶
- Export csak akkor indítható, ha már van lefuttatott elemzés.
- Az
Excelexport két munkalapot hoz létre: egyBenfordés egyMantissa Arclapot. - A
Mantissa ArcExcel lapon a hisztogram sávjai, darabszámai és százalékos arányai szerepelnek. - A
CSVexport külön választható aBenfordés aMantissa Arcadatokra. - A
PDFexport a Benford-rész mellett a Mantissa Arc teszt vizuális eredményeit is tartalmazza. - A
PDFexportban a diagram képként kerül beágyazásra.
Jelenlegi korlát
Az Excel export a Mantissa-hisztogram táblázatos értékeit tartalmazza, de a pontfelhő vizuális ábráját nem. A Mantissa Arc teljes vizuális megjelenése jelenleg a PDF exportban érhető el.
Gyakorlati javaslat
Ha a cél vizuális értelmezés és prezentálás, a PDF export a legalkalmasabb. Ha a cél további feldolgozás, szűrés vagy összehasonlítás, az Excel vagy a két külön CSV export a praktikusabb választás.
Milyen következtetések vonhatók le?¶
A modul eredményei alapján többféle, egymást kiegészítő következtetés vonható le.
Ha a Benford és a Mantissa is nyugodt képet mutat¶
Ez arra utalhat, hogy:
- az adatok szerkezete természetes,
- nincs nyilvánvaló számjegy-manipuláció,
- az adott halmaz első körben alacsonyabb kockázatúnak tekinthető.
Ha a Benford eltér, de a Mantissa kevésbé koncentrált¶
Ez jelentheti azt, hogy:
- bizonyos számjegyek torzultak,
- de az egész adathalmaz nem mutat erős szabályosságot,
- érdemes célzottan a kiugró számjegyek mögötti tételeket vizsgálni.
Ha a Mantissa erősen koncentrált¶
Ez arra utalhat, hogy:
- az értékek mesterségesebb szabályosságot hordoznak,
- kerekítés, fix árszintek vagy sablonszerű adatkeletkezés lehet jelen,
- részletesebb ellenőrzés indokolt lehet.
Ha mindkét nézet gyanús¶
Ez a legerősebb figyelmeztető jelzés lehet arra, hogy:
- az adathalmaz erősen torzult,
- nem természetes üzleti eloszlást tükröz,
- további részletező ellenőrzés szükséges.
Fontos szakmai megjegyzés
Az eltérés nem egyenlő hibával vagy szabálytalansággal. A modul eredményei mindig az üzleti környezet, a szűrések és az adathalmaz jellege alapján értelmezendők.
Hogyan segíti a modul a felhasználó munkáját?¶
A Benford-analízis modul a gyakorlatban az alábbiakban segít:
- gyorsan rangsorolhatóvá teszi a vizsgálandó adathalmazokat,
- segít eldönteni, mely mentett lekérdezések érdemelnek további vizsgálatot,
- támogatja az adatminőségi és anomáliaelemzési munkát,
- jól használható más nézetek előszűréseként,
- vizuálisan is értelmezhető eredményt ad.
Tipikus felhasználási helyzetek¶
- könyvvizsgálati tervezés során kockázatos részhalmazok keresése,
- NAV vagy AuditXML adatok összevetés előtti gyors szűrése,
- partnerre, időszakra vagy főkönyvi területre leszűrt mentett lekérdezések vizsgálata,
- adattisztasági vagy kontroll-elemzési feladatok.
Korlátok és fontos tudnivalók¶
Nem minden adathalmaz alkalmas Benford-vizsgálatra¶
Gyengébb vagy félrevezető eredményt adhat, ha az adatok:
- szűk értéktartományban mozognak,
- szabályozott ársávokból állnak,
- mesterséges küszöbök köré rendeződnek,
- túl kicsi mintaszámot tartalmaznak.
A 5% eltérési küszöb egyszerű szabály¶
A modul jelenlegi Benford minősítése egy gyakorlati, fix küszöbön alapul.
Ez azt jelenti, hogy:
- a minősítés könnyen értelmezhető,
- de nem helyettesít formális statisztikai tesztet,
- kis elemszámnál különösen óvatos értelmezés szükséges.
A Mantissa pontfelhő mintavételezett lehet¶
Nagy elemszám esetén a megjelenített pontok száma korlátozott lehet, de:
- a vizuális minta reprezentatív marad,
- az összesítő statisztika a teljes adathalmazból készül.
Negatív értékek kezelése¶
A modul abszolút értékkel dolgozik, ezért:
- a negatív és pozitív előjel nem különbözik az elemzés szempontjából,
- az elemzés a nagyságrend és számjegystruktúra alapján történik.
Gyakori kérdések¶
A Benford megfelel eredmény azt jelenti, hogy minden rendben van?
Nem. Ez csak azt jelzi, hogy az első számjegy eloszlás nem mutat erős eltérést a modul által használt szabály szerint.
A gyanús eredmény bizonyít csalást vagy hibát?
Nem. Ez figyelmeztető jelzés, amely további vizsgálatot indokolhat.
Miért lehet más eredmény ugyanarra a cégre más adatforrás esetén?
Mert a teljes adatállomány és egy leszűrt, mentett lekérdezés eloszlása természetesen különbözhet.
Miért fontos az Elemzett mező?
Mert más összegmező más nagyságrendi és számjegy-eloszlást eredményezhet.
Miért nem exportálódik minden Mantissa vizualizáció külön?
Jelenleg az Excel export a Mantissza-hisztogram táblázatos értékeit tartalmazza, míg a pontfelhő vizuális elemei a PDF exportban érhetők el. A CSV export továbbra is elsődlegesen a táblázatos Benford eredményeket tartalmazza.
Összefoglaló¶
A Benford-analízis egy olyan kockázatjelző és vizualizációs modul, amely a könyvelési és NAV adatokban rejlő mintázatokat két fontos nézőpontból elemzi:
- Benford első számjegy eloszlás,
- Mantissa Arc teszt.
A modul segít:
- gyorsan áttekinteni az adatok természetességét,
- azonosítani a gyanúsabb részhalmazokat,
- priorizálni a további könyvvizsgálati vagy ellenőrzési munkát,
- és vizuálisan is jól értelmezhető képet adni az adathalmaz szerkezetéről.
Rövid lényeg
A modul akkor ad igazán nagy értéket, ha nem önmagában, hanem a rendszer többi részletező és lekérdező eszközével együtt használja a felhasználó: előszűrésre, fókuszkijelölésre és kockázati priorizálásra.