Kihagyás

Benford-analízis

A modul célja

A Benford-analízis modul célja, hogy a megnyitott cég könyvelési vagy NAV számlaadatai alapján gyorsan feltárja a számjegy-eloszlásban jelentkező rendellenességeket, és ezzel segítse a könyvvizsgálati, ellenőrzési és adattisztasági munkát.

A modul két, egymást kiegészítő nézőpontból vizsgálja az adatokat:

  • Benford első számjegy elemzés – azt vizsgálja, hogy az első szignifikáns számjegyek eloszlása mennyire követi a Benford-törvényt,
  • Mantissa Arc teszt – azt vizsgálja, hogy a logaritmikus mantisszák eloszlása mennyire tekinthető egyenletesnek.

A modul elsődleges célja nem a végleges bizonyítás, hanem a kockázatjelzés és priorizálás:

  • hol lehet szükség részletesebb ellenőrzésre,
  • mely adathalmaz érdemel mélyebb vizsgálatot,
  • mely mentett lekérdezés vagy adatforrás mutat szokatlan mintázatot.

Mit csinál a modul röviden?

A modul a kiválasztott összeghalmazból statisztikai jellegű mintázatokat számol, majd táblázatos és grafikus formában megmutatja, hogy az adatok mennyire viselkednek természetes, elvárt módon.

  • Mit vizsgál?


    Első számjegy-eloszlást és mantissza-mintázatot vizsgál ugyanazon adathalmazon.

  • Mit lehet kiválasztani?


    A felhasználó adatforrást és elemzett mezőt is választhat, így ugyanaz a halmaz több nézőpontból is ellenőrizhető.

  • Mit jelez az eredmény?


    Nem végleges bizonyítást ad, hanem gyors kockázatjelzést és priorizálást támogat.

  • Mit lehet exportálni?


    A Benford eredmények több formátumban exportálhatók, a Mantissa Arc eredmények pedig PDF, Excel és külön CSV exportban is megjelennek.

Hol érhető el?

A modul az alkalmazás felső menüsorából nyitható meg:

Elemzések > Anomáliák > Benford-analízis


Kinek szól a modul?

A modul minden olyan felhasználónak hasznos lehet, aki nagyobb mennyiségű pénzügyi vagy számlaadat mintázatait szeretné gyorsan áttekinteni, és szeretné azonosítani azokat a részhalmazokat, amelyek további vizsgálatot igényelhetnek.

Különösen hasznos azokban a helyzetekben, amikor a cél:

  • a természetes és a szokatlan számjegyeloszlási minták elkülönítése,
  • a részletesebb ellenőrzésre érdemes adathalmazok priorizálása,
  • az adatok szerkezeti sajátosságainak gyors vizuális áttekintése,
  • a további elemzési lépések fókuszának kijelölése.

A felhasznált elemzési módszerek

Benford-törvény röviden

A Benford-törvény szerint sok természetes eredetű, több nagyságrendet átfogó adathalmazban az első számjegyek nem egyenletesen fordulnak elő.

Az elvárt első számjegy gyakoriság például:

Első számjegy Várható gyakoriság
1 kb. 30,10%
2 kb. 17,61%
3 kb. 12,49%
9 kb. 4,58%

A modul a következő képletet használja:

Benford(d) = log10(1 + 1/d) * 100

ahol d az első számjegy (1..9).

Mikor hasznos a Benford-elemzés?

Különösen akkor, ha az adatok:

  • sok különböző nagyságrendet tartalmaznak,
  • természetes üzleti folyamatból keletkeztek,
  • nem mesterségesen generált, nem fix tartományra korlátozott értékek.

Fontos

A Benford-törvény nem minden adathalmazra alkalmazható. Ha az adatok erősen szabályozottak, küszöbölt értékekből állnak, vagy szűk tartományban mozognak, akkor az eltérés önmagában nem jelent problémát.

Mantissa Arc teszt röviden

A Mantissa Arc teszt a kiválasztott abszolút értékek log10 transzformáltjának tört részét, azaz a mantisszát vizsgálja.

A számítás lényege:

m = frac(log10(|x|))

A mantisszák ideális esetben közel egyenletesen oszlanak el a 0..1 tartományon. A modul ezt kétféleképpen szemlélteti:

  • Pontfelhő körre vetítve – a mantisszák körkoordinátákra vetítve,
  • Mantissza-hisztogram – a mantisszák eloszlása 10 binben.

A körre vetítés:

x = cos(2πm)
y = sin(2πm)

Ha a pontok erősen egy irányba koncentrálódnak, az szabályos vagy mesterséges mintázatra utalhat.


A képernyő felépítése

A képernyő 5 fő részre osztható:

  1. Fejléc – a modul neve és rövid célleírása
  2. Adatforrás-választó blokk – forrás, elemzett mező kiválasztása és frissítés
  3. Összesítő kártyák – elemszám, gyanús számjegyek, rövid következtetés
  4. Görgethető tartalom – Benford táblázat, Benford diagram, Mantissa Arc teszt
  5. Alsó műveleti sáv – lekérdezési statisztika, export, bezárás
Képernyőrész Tartalom
Fejléc Benford-analízis cím és rövid célleírás
Adatforrás forrás kiválasztása, elemzett mező kiválasztása, frissítés
Összesítés elemzett tételek, gyanús számjegyek, következtetés
Benford rész Benford tábla és Benford diagram
Mantissa Arc rész összegzés, pontfelhő, hisztogram
Státuszsor lekérdezési idő, export, bezárás

Képernyőkép #1 – teljes nézet

Készíts képernyőképet a teljes Benford-analízis ablakról úgy, hogy már legyen lefuttatott elemzés. Jó, ha egyszerre látszik a felső adatforrás-választó, az összesítő blokk, a számjegy-eloszlás tábla, a Benford diagram, valamint a Mantissa Arc pontfelhő és hisztogram is.


A használat folyamata lépésről lépésre

Előfeltétel

A modul csak akkor használható, ha:

  • van megnyitott cég,
  • a cég adatbázisa elérhető,
  • az adott adatforrás már be van töltve a rendszerbe,
  • AuditXML vagy NAV fejléc adatok rendelkezésre állnak.

Javasolt használati folyamat

  1. Nyissa meg a Benford-analízis modult.
  2. Az Adatforrás legördülőből válassza ki a vizsgálandó adathalmazt.
  3. Az Elemzett mező legördülőből válassza ki, hogy mely összegmező alapján történjen a számítás.
  4. Szükség esetén kattintson a 🔄 Frissítés gombra az adatforráslista újratöltéséhez.
  5. Az adatforrás vagy az elemzett mező kiválasztása után a modul automatikusan lefuttatja az elemzést.
  6. Tekintse át az összesítő kártyákat:
  7. Elemzett tételek
  8. Gyanús számjegyek
  9. Összesítő következtetés
  10. Nézze meg a részletes táblázatot, hogy mely számjegyek térnek el leginkább.
  11. Vizsgálja meg a Benford diagramot a trend gyors áttekintéséhez.
  12. Tekintse át a Mantissa Arc részt:
  13. pontfelhő,
  14. mantissza-hisztogram,
  15. koncentrációs összegzés.
  16. Szükség esetén exportálja az eredményt Excel, PDF vagy CSV formátumba.

Tipikus első használat

Ha most használja először a modult, érdemes:

  • először a 📊 Teljes AuditXML adatforrást megnézni,
  • utána a releváns mentett lekérdezéseket külön-külön is elemezni,
  • majd összehasonlítani a Benford és a Mantissa Arc eredményeket.

Gyakorlati javaslat

Ha egy mentett lekérdezés gyanús Benford-eltérést mutat, érdemes ugyanazt a részhalmazt QueryBuilderben vagy más részletező nézetben tovább bontani partnerre, időszakra vagy naplóra.


Input adatok és adatforrások

Közvetlen felhasználói inputok

A modul kevés manuális paramétert kér, a fő döntési pont az adatforrás kiválasztása.

Paraméter / vezérlő Típus Jelentés
Adatforrás legördülő Meghatározza, mely adathalmazon fusson az elemzés
Elemzett mező legördülő Meghatározza, mely összegmező alapján történjen a Benford- és Mantissa-számítás
🔄 Frissítés gomb Újratölti az elérhető adatforrások listáját
Export legördülő gomb Az eredmény exportálása Excel, PDF, CSV (Benford) vagy CSV (Mantissa Arc) formátumba
Bezárás gomb Bezárja az ablakot

Elérhető adatforrás-típusok

A modul az alábbi típusokkal tud dolgozni:

Adatforrás típus Leírás Alapértelmezett mező
Teljes AuditXML Az összes elérhető AuditXML könyvelési adat osszeg
Mentett AuditXML lekérdezés Elmentett részhalmaz az AuditXML adatokból osszeg, vagy a mentett lekérdezéshez tartozó kiválasztott értékmező
Teljes NAV Fejléc NAV számla fejléc adatok teljes halmaza invoice_gross_amount_huf
Mentett NAV lekérdezés Elmentett részhalmaz a NAV fejléc adatokból a mentett lekérdezéshez tartozó kiválasztott értékmező

A háttérben használt értékmezők

A modul nem tetszőleges oszlopon számol, hanem csak az engedélyezett összegmezőkön.

Lehetséges értékmező Jelentés
osszeg összeg
devosszeg devizaösszeg
afaalap áfaalap
Lehetséges értékmező Jelentés
invoice_gross_amount_huf bruttó összeg HUF-ban
invoice_net_amount_huf nettó összeg HUF-ban
invoice_vat_amount_huf áfaösszeg HUF-ban

Mi számít elemzett tételnek?

A modul csak a nem nulla, számmá alakítható, érvényes numerikus összegeket veszi figyelembe.

Képernyőkép #2 – adatforrás választó

Készíts képet a felső adatforrás-választó blokkról úgy, hogy a legördülő lista nyitva legyen, és látható legyen legalább egy teljes adatforrás és néhány mentett lekérdezés.


A paraméterek és kezelőszervek hatása az eredményre

Adatforrás

Ez a legfontosabb paraméter, mert teljesen meghatározza, hogy:

  • milyen rekordok kerülnek be a vizsgálatba,
  • melyik értékmező szolgál számítási alapul,
  • milyen számjegy-eloszlás és mantissza-mintázat jön létre.

Közvetlen hatása:

  • más adatforrás → más elemszám,
  • más értékmező → más első számjegyek,
  • más részhalmaz → más Benford- és Mantissa-eredmény.

Elemzett mező

Ez a második legfontosabb tényleges elemzési paraméter.

Hatása az eredményre:

  • ha például osszeg helyett devosszeg alapján történik a számítás, a teljes eloszlás megváltozhat,
  • NAV esetén a bruttó, nettó és áfa mezők eltérő eloszlást adhatnak,
  • ugyanazon adatforráson belül is teljesen más mintázat jelenhet meg a kiválasztott mezőtől függően.

A modul viselkedése:

  • AuditXML adatforrásnál Összeg, Devizaösszeg, Áfaalap választható,
  • NAV fejléc adatforrásnál Bruttó összeg (HUF), Nettó összeg (HUF), Áfa összeg (HUF) választható,
  • adatforrásváltáskor a rendszer az adott forrástípushoz illeszkedő mezőlistát kínálja fel.

🔄 Frissítés

A gomb újratölti az adatforráslistát, beleértve a mentett lekérdezéseket is.

Mikor fontos?

  • új mentett lekérdezés készült,
  • egy mentett lekérdezés módosult,
  • másik cég megnyitása után a lista frissítése szükséges.

Export

Az export nem módosítja az elemzést, csak a már elkészült eredményeket menti ki.

Jelenlegi működés

Az export funkció formátumonként eltérő részletességet kínál: a PDF a teljes vizuális összképet adja, míg a CSV export külön választható a Benford és a Mantissa Arc hisztogram adataihoz.


A számítási logika részletesen

Adatbetöltés és előszűrés

A modul a kiválasztott adatforrásból az értékmező tartalmát olvassa ki, majd minden sorra elvégzi az alábbi lépéseket:

  1. NULL értékek kizárása
  2. számmá konvertálás
  3. abszolút érték képzése: |x|
  4. a nem értelmezhető vagy az elemzésre nem alkalmas numerikus értékek kizárása

Ennek eredménye a ténylegesen elemezhető értékhalmaz.

Első szignifikáns számjegy meghatározása

A modul a vezető számjegyet numerikusan határozza meg, nem karakterkivágással.

A logika:

exponent = floor(log10(|x|))
significand = |x| / 10^exponent
first_digit = int(significand)

Ez azért fontos, mert így a 0 < |x| < 1 tartományba eső értékek is helyesen kezelhetők.

Példák

Érték Első szignifikáns számjegy
1250 1
87,3 8
0,0452 4
-702 7

Benford várható értékek számítása

A modul 1..9 számjegyekre kiszámítja a Benford szerinti várható százalékot.

ExpectedPct(d) = log10(1 + 1/d) * 100

Ezután minden számjegyre meghatározza:

  • ActualCount – tényleges darabszám,
  • ActualPct – tényleges százalék,
  • Deviation – eltérés a várt értéktől.

Gyanús számjegyek meghatározása

A modul egy számjegyet akkor jelöl gyanúsnak, ha az abszolút eltérés legalább 5,0 százalékpont.

IsSuspicious = |ActualPct - ExpectedPct| >= 5.0

Ez alapján készül:

  • a táblázat soronkénti státusza,
  • a Gyanús számjegyek összesítő érték,
  • az összesítő következtetés.

Mit jelent a 5% küszöb?

Ez egy egyszerű, jól értelmezhető gyakorlati küszöb. Nem helyettesít formális statisztikai próbát, hanem gyors figyelmeztető szabályként működik.

Mantissa Arc számítás

Minden érvényes értékre a modul kiszámítja a mantisszát:

mantissa = frac(log10(|x|))

Ezután:

  • körkoordinátákra vetíti a mantisszát,
  • pontfelhőt épít,
  • 10 darab hisztogram-binbe sorolja az értékeket,
  • kiszámítja az átlagvektort és annak hosszát.

A koncentrációs mutató:

R = sqrt(sumX² + sumY²) / N

ahol:

  • sumX és sumY a körre vetített pontok koordinátáinak összege,
  • N az elemzett tételek száma.

Mantissa értelmezési küszöbök a modulban

R tartomány Megjelenített minősítés
< 0,15 ✅ Közel egyenletes mantissza-eloszlás
< 0,30 ⚠️ Mérsékelt mantissza-koncentráció
>= 0,30 🚨 Erős mantissza-koncentráció

Vizualizációs beállítások

A modul a Mantissa Arc résznél két fix beállítást használ:

Paraméter Érték Jelentés
MantissaHistogramBinCount 10 a mantissza-hisztogram 10 sávot használ
MaxMantissaScatterPoints 2500 nagy adathalmaznál legfeljebb 2500 pont jelenik meg a pontfelhőn

Miért van pontszám-korlát?

A pontfelhő grafikus teljesítménye és áttekinthetősége érdekében a modul mintát jelenít meg, miközben az összesítő statisztikák a teljes elemzett adathalmazra számolódnak.


Az eredmények értelmezése

Összesítő kártyák

Kártya Jelentés
Elemzett tételek Hány rekord került ténylegesen be a számításba
Gyanús számjegyek Hány számjegy lépte át az 5% eltérési küszöböt
Összesítő következtetés Gyors, rövid értelmezés a Benford-eltérésről

Számjegy-eloszlás táblázat

A táblázat minden számjegyre megmutatja:

Oszlop Jelentés
Sz.jegy az első szignifikáns számjegy
Benford az elvárt százalékos arány
Db a tényleges darabszám
Tényleges a tényleges százalékos arány
Eltérés a tényleges és a várt érték különbsége
Státusz OK vagy Gyanús

A gyanús sorokat a felület piros háttérrel emeli ki.

Benford diagram

A diagram két oszlopsorozatot mutat:

  • Benford (várható %)
  • Tényleges %

Ez különösen akkor hasznos, ha gyorsan szeretné látni:

  • egyetlen számjegynél van-e kiugrás,
  • általános torzulás figyelhető-e meg,
  • a kisebb számjegyek vagy a nagyobb számjegyek felé tolódik-e az eloszlás.

Mantissa Arc pontfelhő

A pontfelhő a mantisszák körre vetített mintázatát mutatja.

Mit érdemes figyelni?

  • egyenletes, kör mentén szórt pontok → természetesebb eloszlás,
  • sűrűsödés bizonyos íveken → koncentrált mintázat,
  • rövid átlagvektor → kisebb koncentráció,
  • hosszú átlagvektor → erősebb koncentráció.

Mantissza-hisztogram

A hisztogram a 0,0–1,0 tartomány 10 részre osztott eloszlását mutatja.

Mit érdemes figyelni?

  • viszonylag egyenletes sávok → közel természetes mantissza-eloszlás,
  • egy-egy sáv dominanciája → torzult vagy szabályos mintázat.

Képernyőkép #3 – Mantissa Arc rész

Készíts külön képernyőképet a Mantissa Arc szekcióról úgy, hogy egyszerre jól látszódjon a rövid szöveges összegzés, a pontfelhő és a mantissza-hisztogram.


Export lehetőségek

A modul négy exportlehetőséget kínál:

  • külön munkalapon exportálja a Benford és a Mantissa Arc adatokat
  • tartalmazza a Benford táblázatot és a Mantissza-hisztogram bin értékeit
  • a Mantissa Arc lapon a sávok, darabszámok és százalékos arányok is megjelennek
  • riport formában tartalmazza a Benford táblázatot és a Benford diagramot
  • tartalmazza a Mantissa Arc teszt összegzését és diagramjait is
  • a diagramok képként kerülnek beágyazásra
  • a Benford táblázat egyszerű, pontosvesszős exportja
  • jól használható további táblázatos feldolgozáshoz vagy archiváláshoz
  • a Mantissza-hisztogram sávjainak táblázatos exportja
  • a sávazonosítót, tartományt, darabszámot és százalékos arányt tartalmazza

Fontos megjegyzések az exportnál

  • Export csak akkor indítható, ha már van lefuttatott elemzés.
  • Az Excel export két munkalapot hoz létre: egy Benford és egy Mantissa Arc lapot.
  • A Mantissa Arc Excel lapon a hisztogram sávjai, darabszámai és százalékos arányai szerepelnek.
  • A CSV export külön választható a Benford és a Mantissa Arc adatokra.
  • A PDF export a Benford-rész mellett a Mantissa Arc teszt vizuális eredményeit is tartalmazza.
  • A PDF exportban a diagram képként kerül beágyazásra.

Jelenlegi korlát

Az Excel export a Mantissa-hisztogram táblázatos értékeit tartalmazza, de a pontfelhő vizuális ábráját nem. A Mantissa Arc teljes vizuális megjelenése jelenleg a PDF exportban érhető el.

Gyakorlati javaslat

Ha a cél vizuális értelmezés és prezentálás, a PDF export a legalkalmasabb. Ha a cél további feldolgozás, szűrés vagy összehasonlítás, az Excel vagy a két külön CSV export a praktikusabb választás.


Milyen következtetések vonhatók le?

A modul eredményei alapján többféle, egymást kiegészítő következtetés vonható le.

Ha a Benford és a Mantissa is nyugodt képet mutat

Ez arra utalhat, hogy:

  • az adatok szerkezete természetes,
  • nincs nyilvánvaló számjegy-manipuláció,
  • az adott halmaz első körben alacsonyabb kockázatúnak tekinthető.

Ha a Benford eltér, de a Mantissa kevésbé koncentrált

Ez jelentheti azt, hogy:

  • bizonyos számjegyek torzultak,
  • de az egész adathalmaz nem mutat erős szabályosságot,
  • érdemes célzottan a kiugró számjegyek mögötti tételeket vizsgálni.

Ha a Mantissa erősen koncentrált

Ez arra utalhat, hogy:

  • az értékek mesterségesebb szabályosságot hordoznak,
  • kerekítés, fix árszintek vagy sablonszerű adatkeletkezés lehet jelen,
  • részletesebb ellenőrzés indokolt lehet.

Ha mindkét nézet gyanús

Ez a legerősebb figyelmeztető jelzés lehet arra, hogy:

  • az adathalmaz erősen torzult,
  • nem természetes üzleti eloszlást tükröz,
  • további részletező ellenőrzés szükséges.

Fontos szakmai megjegyzés

Az eltérés nem egyenlő hibával vagy szabálytalansággal. A modul eredményei mindig az üzleti környezet, a szűrések és az adathalmaz jellege alapján értelmezendők.


Hogyan segíti a modul a felhasználó munkáját?

A Benford-analízis modul a gyakorlatban az alábbiakban segít:

  • gyorsan rangsorolhatóvá teszi a vizsgálandó adathalmazokat,
  • segít eldönteni, mely mentett lekérdezések érdemelnek további vizsgálatot,
  • támogatja az adatminőségi és anomáliaelemzési munkát,
  • jól használható más nézetek előszűréseként,
  • vizuálisan is értelmezhető eredményt ad.

Tipikus felhasználási helyzetek

  • könyvvizsgálati tervezés során kockázatos részhalmazok keresése,
  • NAV vagy AuditXML adatok összevetés előtti gyors szűrése,
  • partnerre, időszakra vagy főkönyvi területre leszűrt mentett lekérdezések vizsgálata,
  • adattisztasági vagy kontroll-elemzési feladatok.

Korlátok és fontos tudnivalók

Nem minden adathalmaz alkalmas Benford-vizsgálatra

Gyengébb vagy félrevezető eredményt adhat, ha az adatok:

  • szűk értéktartományban mozognak,
  • szabályozott ársávokból állnak,
  • mesterséges küszöbök köré rendeződnek,
  • túl kicsi mintaszámot tartalmaznak.

A 5% eltérési küszöb egyszerű szabály

A modul jelenlegi Benford minősítése egy gyakorlati, fix küszöbön alapul.

Ez azt jelenti, hogy:

  • a minősítés könnyen értelmezhető,
  • de nem helyettesít formális statisztikai tesztet,
  • kis elemszámnál különösen óvatos értelmezés szükséges.

A Mantissa pontfelhő mintavételezett lehet

Nagy elemszám esetén a megjelenített pontok száma korlátozott lehet, de:

  • a vizuális minta reprezentatív marad,
  • az összesítő statisztika a teljes adathalmazból készül.

Negatív értékek kezelése

A modul abszolút értékkel dolgozik, ezért:

  • a negatív és pozitív előjel nem különbözik az elemzés szempontjából,
  • az elemzés a nagyságrend és számjegystruktúra alapján történik.

Gyakori kérdések

A Benford megfelel eredmény azt jelenti, hogy minden rendben van?

Nem. Ez csak azt jelzi, hogy az első számjegy eloszlás nem mutat erős eltérést a modul által használt szabály szerint.

A gyanús eredmény bizonyít csalást vagy hibát?

Nem. Ez figyelmeztető jelzés, amely további vizsgálatot indokolhat.

Miért lehet más eredmény ugyanarra a cégre más adatforrás esetén?

Mert a teljes adatállomány és egy leszűrt, mentett lekérdezés eloszlása természetesen különbözhet.

Miért fontos az Elemzett mező?

Mert más összegmező más nagyságrendi és számjegy-eloszlást eredményezhet.

Miért nem exportálódik minden Mantissa vizualizáció külön?

Jelenleg az Excel export a Mantissza-hisztogram táblázatos értékeit tartalmazza, míg a pontfelhő vizuális elemei a PDF exportban érhetők el. A CSV export továbbra is elsődlegesen a táblázatos Benford eredményeket tartalmazza.


Összefoglaló

A Benford-analízis egy olyan kockázatjelző és vizualizációs modul, amely a könyvelési és NAV adatokban rejlő mintázatokat két fontos nézőpontból elemzi:

  • Benford első számjegy eloszlás,
  • Mantissa Arc teszt.

A modul segít:

  • gyorsan áttekinteni az adatok természetességét,
  • azonosítani a gyanúsabb részhalmazokat,
  • priorizálni a további könyvvizsgálati vagy ellenőrzési munkát,
  • és vizuálisan is jól értelmezhető képet adni az adathalmaz szerkezetéről.

Rövid lényeg

A modul akkor ad igazán nagy értéket, ha nem önmagában, hanem a rendszer többi részletező és lekérdező eszközével együtt használja a felhasználó: előszűrésre, fókuszkijelölésre és kockázati priorizálásra.