Rendszerszintű adatminőségi problémák az EU-SILC magyar jövedelmi adataiban (2014-2023)
Újabb problémákat tártak fel a KSH szegénységi adatait elemző kutatók. Legfrissebb tanulmányuk rövidített változatát az alábbiakban közöljük.
Írásunk szorosan kapcsolódik két korábbi, a Válasz Online felületén megjelent cikkhez. A Kutatói aggodalmak az EU-SILC magyarországi jövedelemadataival kapcsolatban című anyagban Tátrai Annamária és Gábos András a magyarországi EU-SILC adataiban feltárt, a szegénységi mutatók számításával összefüggő adatproblémákra hívták fel a figyelmet. Ezek az adatproblémák a szegénységi folyamatok hazai és európai uniós szintű nyomon követésének legfontosabb indikátorait érintik. A szerzők állítása szerint az adatproblémák csak szakmai hibák sorozataként állhattak elő, felvetve az adatmanipuláció lehetőségét is. Élő Anita Valami nagyon nem stimmel a KSH szegénységi adataival című írása Tátrai és Gábos eredményeihez kapcsolódva a szegénységkutatás közelmúltjának több aspektusát is tárgyalta. A Központi Statisztikai Hivatal (KSH) közleményében visszautasította az adatmanipuláció vádját, a jövedelemtorlódást a kereseteloszlás mintázataival magyarázta és a következő tájékoztatást adta:
- a 2022-es népszámlálás adataihoz történő újrasúlyozást jelentő nagyrevízió folyamatához kapcsolódóan, egy ún. rutin revízió keretében a jövedelemeloszlás problémáival is foglalkoznak, és
- a javított, a 2019-2024 közötti időszakot felölelő adatállományokat 2025 második negyedévében megküldik az Eurostat részére.
- A KSH álláspontja szerint „(…) a revízió eredményeként a változások érdemben nem befolyásolják majd a relatív jövedelmi szegénységi arány alakulását.”
Vagyis a KSH közleménye szerint a jelenleg folyó un. “nagyrevízió” ill. “rutin revízió” eredményeképpen nem változnak majd érdemben a korábban publikált szegénységi arányok. Az alábbiakban aggodalmunkat fejezzük ki azzal kapcsolatban, hogy vajon a KSH közleményében jelzett revízió kellő jelentőséget tulajdonít-e a felmerült problémáknak és a megfelelő alapossággal tervezi-e azokat kezelni. A revízió eredményeinek megelőlegezését szakmailag aggályosnak látjuk. Szakmai álláspontunk szerint az eddig feltárt problémák súlyossága és az adatproblémák természete a cikkünk megjelenésének idejében publikáltnál magasabb szegénységi arányt valószínűsít.
A problémák feltárása, vagyis 2023 óta számos alkalommal kezdeményeztünk párbeszédet a KSH-val, legutóbb 2025. április 17-én kelt, Kincses Áronnak, a KSH elnökének küldött levelünkben kértük, hogy mihamarabb kezdődjön szakmai egyeztetés az ügyben, biztosítsanak rálátást a tervezett felülvizsgálat elveire és módszereire, illetve az adattisztítási és imputálási folyamat részleteire. Egy ilyen egyeztetés lehetőséget adna a kutatói közösségben folyamatosan felhalmozódó tudás figyelembevételére a rutin revízió során, és így segíthetné – a kutatók számára egyetlen elérendő célként – a jó minőségű adatállományok létrehozását. Felvetésünkre a KSH nem mutatott nyitottságot, levelünkre nem kaptunk választ.
Újabb eredményeinket ezért a nyilvánosság előtt tesszük közzé,de ezzel párhuzamosan a KSH-val és az Eurostat-tal közvetlenül is megosztjuk azokat. Jelen írásunk az elemzésünk rövidített, közvélemény számára készített változata. Megállapításainkat most is, a magyarországi jövedelemadatok forrásának, az EU-SILC adatállománynak elemzésére alapozzuk. A szövegben alkalmazott naptári évek – hacsak külön nem jelezzük – az adatfelvétel évét jelölik. Az adatproblémák egy részével a Válasz Online-on 2025. április 1-jén megjelent írásban már foglalkoztunk. Az ott bemutatott problémák rövid összefoglalása után ismertetjük azokat az új számításokat, amelyeket a kutatói közösség végzett a cikk megjelenését követően. Ezek a számítások újabb adatproblémákat tártak fel, immár egy hosszabb, 2014 és 2023 közötti időszakban. Írásunk zárásként olyan szakmai javaslatokat fogalmazunk meg, amelyek szerintünk nélkülözhetetlenek az adatokkal kapcsolatos bizalom helyreállításához.
1. Mit állítottunk előző cikkünkben?
A Válasz Online felületén április 1-jén megjelentírásban és a KSH április 3-i közleményére adott válaszunkban három fontos állítást tettünk a jövedelemadatok megbízhatóságával kapcsolatban.
1. 2018-tól kezdődően olyan kiugró értékeket, csoportosulásokat figyeltünk meg a jövedelemeloszlásban, amelyek a szegénységi küszöb körül, a legtöbb esetben közvetlenül felette koncentrálódnak. Ilyen jelenség nem figyelhető meg más uniós tagállamok adataiban, és valószínűtlen, hogy természetes módon alakuljon ki.

Megjegyzés: A 2005-2023-as időszak egészére elérhető interaktív vizualizáció itt látható)
2. Elemzésünk eredményei arra utalnak, hogy ezek a torlódások az adattisztítás, a hiányzó adatok pótlása (imputálás) munkafázisában keletkezhettek, és ezek nyomán több évben is nagy valószínűséggel a valósnál alacsonyabbra becsülték a magyarországi szegénységi arányszámot. A hiányzó adatok pótlásának folyamata során olyan anomáliák is megjelentek, mint például az azonos jövedelmi értékek magas aránya: 2020-ban 316 egyfős háztartás jövedelme megegyezett (1,3 millió FT, 3996,3110974 €), ami statisztikailag rendkívül valószínűtlen.
3. A KSH közleményében megjelent állítással szemben, ezek a csoportosulások nem a minimálbér, garantált bérminimum, közfoglalkoztatotti bér miatt keletkeztek. Egyrészt azért, mert a jövedelemcsoportosulások nem esnek egybe az adott évi adminisztratív értékekkel, még az egyszerűbb jövedelemszerkezetű egyfős háztartások esetében sem. Másrészt azért, mert a jövedelemeloszlást a háztartás egy fogyasztási egységre jutó éves összjövedelme alapján számoljuk, aminek a kereset még az egyfős háztartások esetében is csak egyik összetevője, és elhanyagolható a valószínűsége annak, hogy ez a jövedelem egy nagyon szűk sávban ilyen nagy arányban forduljon elő, mint 2018 és 2021 között Magyarországon.

2. Mit állítunk most?
Fő állításunk az, hogy az EU-SILC jövedelemadatai egy olyan országot tárnak elénk, ami biztosan nem lehet Magyarország: a 2014 és 2021 közötti időszakban a mintába került háztartások 4-34%-ának esetében a rendelkezésre álló éves nettó jövedelem meghaladta a bruttó háztartás-jövedelem értékét. Eszerint a személyek 11-30%-a nem fizeti az adót, hanem kapja. Ez a magyar személyi jövedelemadó- és társadalombiztosítási járulékrendszer jellemzőit figyelembe véve lehetetlen.
2.1. 2020-ban 316 egyfős háztartás jövedelme azért azonos, mert eltérő bruttó jövedelmüket eltérő összegű – a magyar adórendszerben nem létező – negatív adó- és járulékösszegek egészítik ki
Az EU-SILC részletes információkat tartalmaz a mintába kerülő személyek, illetve háztartásaik különböző forrásokból származó jövedelmeiről. E különböző fajta jövedelmeket pedig két fő változóban összesíti.
- Az összes bruttó háztartási jövedelemháztartásonként összegzi az összes háztartástag bruttó személyes jövedelmeit (pl. a keresetek, nyugdíj, munkanélküli támogatások, ösztöndíj, amennyiben a háztartás valamely tagja rendelkezik ilyen jövedelemmel) és a háztartási szinten értelmezhető különböző fajta jövedelmek (pl. ingatlan-bérbeadásból származó jövedelem, családtámogatás, vagy más háztartásoktól kapott juttatások) bruttó értékét.
- Az összes rendelkezésre álló háztartási jövedelem (amire az egyszerűség kedvéért gyakran nettó háztartási jövedelemként hivatkoznak) ugyanezeket a bruttó tételeket összegzi, ám kivonja ezekből
- a jövedelmeket terhelő adókat és járulékokat;
- a vagyon után fizetett adókat; valamint
- a háztartás által más háztartásoknak rendszeresen adott juttatásokat.

Az összes rendelkezésre álló háztartás-jövedelem tehát arról nyújt információt, hogy egy-egy háztartás ténylegesen mekkora jövedelemből gazdálkodhat, mennyit tud valóban elkölteni. A jövedelmi szegénység, illetve a jövedelmi egyenlőtlenségek különböző mutatói ezen a változón alapulnak.
A kivont tételek mindegyike – tehát a jövedelmeket, illetve a vagyont terhelő adók, valamint a más háztartásoknak adott juttatások – csak nulla, vagy pozitív értéket vehet fel Magyarországon. (Európa egyes országaiban létezik olyan szabályozás, amely megengedi a befizetett adónál nagyobb összegű visszatérítést, ilyen típusú eszközöket azonban Magyarországon sohasem alkalmaztak. Ebben a kérdésben kértük az adóhivatal állásfoglalását, amely megerősítette, hogy Magyarországon ez csak kivételes esetben fordulhat elő.) Vagyis alapesetben teljesülnie kellene annak az összefüggésnek, hogy a bruttó háztartási jövedelem nagyobb vagy egyenlő, mint a rendelkezésre álló (nettó) háztartási jövedelem.

Megjegyzés. Ennek az összefüggésnek attól függetlenül fenn kell állnia, hogy bruttó, nettó, vagy bruttó és nettó jövedelmet is megadtak a mintába került személyek a kérdőív megválaszolásakor. Ha valamelyik jövedelmet nem kérdezték, vagy a válaszadó nem adott választ, akkor az adattisztítás során a KSH pótolja (imputálja) ezeket az értékeket.
Új eredményeink bemutatásához első lépésben az egyfős háztartások 2020-as adatait hívjuk segítségül. Emlékeztetőül: 2020-ban az egyfős háztartások 14%-ának, 316 egyfős háztartás éves jövedelme hajszálpontosan megegyezett (1,3 millió Ft, vagyis 3996,3110974 €). Ez az érték mintegy 35 ezer forinttal (109 euróval) haladja meg a szegénységi küszöböt (1.264.430 Ft, vagyis 3887 €).
Az első írásunk óta elvégzett vizsgálat azt mutatta ki, hogy
1. az egyező jövedelmű háztartásokat kizárólag egyedül élő nyugdíjas személyek alkotják.Az érintett személyek mindannyian 57-81 évesek, mindannyian kapnak öregségi nyugdíjat, 283 főnek (90%) egyáltalán nem volt munkajövedelme, 311 fő (98%) éves munkajövedelme nem éri el az 50.000 Ft-ot (154 €), tehát szinte kizárólag nyugdíjból élő háztartásokról van szó.
2. A 316 esetből 307 esetben az összes bruttó jövedelem, vagyis a nyugdíj, a bruttó munkabér és alkalmanként előforduló egyéb bevételek együttes értéke szegénységi küszöb alatti.
3. Ez a 307 háztartás azért került mégis a szegénységi küszöb fölé, mert esetükben az adók és járulékok értéke negatív volt. Mind a 307 esetben tehát a nyugdíj, és az összes bevétel értéke szegénységi küszöb alatti, egyénenként más-más összegű. Ezzel szemben mind a 307 esetben a nettó jövedelem egyezik. Vagyis a negatív adó- és járulékfizetés megemelte a számított nettó jövedelmet – a valóságosnál magasabb értéket eredményezve. Így ezek a háztartások hibás adóadatok miatt a nem szegények közé kerültek, noha bruttó jövedelmi helyzetük szerint mindannyian a szegények közé tartoznának.
Az alábbi táblázat illusztrációképpen néhány esettel szemlélteti a 316 egyező jövedelmű, egyfős háztartás közül 307 alkalommal fennálló helyzetet. A táblázat a háztartások éves jövedelmeket és rendszeres kiadásait, valamint a rendelkezésre álló (nettó) jövedelmet rögzíti, amit az 1.264.430 Ft-os szegénységi küszöbbel érdemes összevetni.

Kizártnak tartjuk, hogy az itt 6 eseten bemutatott, de az EU-SILC adatbázisában 307 esetben ugyanígy megjelenő jövedelemösszetétel valós lehetne.
A továbbiakban az azonos rendelkezésre álló (nettó) jövedelmet mutató háztartásokon kívül az összes egyfős háztartás jövedelmével foglalkozunk 2013-as és 2020-as évben.
Az alábbi ábra az egyfős háztartások jövedelemeloszlásának alsó 50%-át mutatja, a bruttó jövedelmük szerint sorba rendezve 2013-ban és 2020-ban. A szaggatott vonal a szegénységi küszöb adott évi értékét jelzi, az ez alatti nettó jövedelemmel rendelkező esetek számítanak szegénységben élőnek.
Az egyfős háztartásokban élők egy fogyasztási egységre jutó bruttó és rendelkezésre álló (nettó) jövedelme Magyarországon, 2013-ban és 2020-ban (fő)

Az eloszlást vizsgálva a következőket állapíthatjuk meg:
- 2013-ban nem látunk olyan esetet, ahol a nettó jövedelem (kék oszlop) értéke meghaladná az adott személy bruttó jövedelmének értékét (piros oszlop).
- 2013-ban az esetek sorba állításával folytonosan növekvő értékeket látunk, a jövedelemeloszlásban nem alakul ki egyező, vagy közel egyező értékek nyomán “plató”.
A 2013 évi az eloszlás megfelel a jövedelemeloszlások jellemző mintázatának, illetve összhangban van azzal, amit a magyar adórendszer és jövedelemszerkezet ismeretében várunk.
- 2020-ban azonban számos esetben a nettó jövedelem meghaladja a bruttó jövedelem értékét (ezt illusztrálják a kék sávok az ábrán).
- 2020-ban a szegénységi küszöb alatti bruttó jövedelmek esetén különösen jellemző, hogy a nettó jövedelem meghaladja a bruttót, a szegénységi küszöb feletti hosszú, vízszintes plató pedig azokat az egyfős háztartásokat jelöli, akiknek nettó jövedelme kissé a küszöb feletti (leggyakrabban 3996,3110974 €), bruttó jövedelmük viszont kisebb-nagyobb összegekkel a küszöb alatt marad.
Véleményünk szerint ezek az adatok nem reprezentálhatják a magyarországi egyfős háztartások valós jövedelemeloszlását 2020-ban.
Az egyfős háztartások jövedelemeloszlását 2013-ban és 2020-ban bemutató ábra interaktív változata, ami a 2005-2023 közötti időszak egészére és más háztartástípusokra (valamint a teljes mintára) történő szűrést is lehetővé teszi, a https://tatraiannamaria.shinyapps.io/nettobrutto linken érhető el.
2.2. A 2020-ban tapasztalt eset nem egyedi, ennél általánosabb és súlyosabb problémával van dolgunk
A 2020-ban az egyfős háztartásoknál bemutatott helyzet, mely szerint az esetek jelentős részében a rendelkezésre álló háztartás-jövedelem meghaladta a bruttó háztartás-jövedelem értékét, korántsem egyedi: 2014 és 2021 között minden évben és számos háztartástípusban nagy számban előfordult. Ebben az időszakban a hivatalos adatok alapján – ahogyan az alábbi ábrán is látható – a magyarországi háztartások 4-34%-ának alacsonyabb volt a bruttó jövedelme, mint a rendelkezésre álló jövedelme. Ezzel szemben 2014 előtt és 2021 után hasonlóra nem volt példa, vagy arányuk az összes esethez képest elhanyagolható volt.

Ez az ellentmondás elsősorban abból származik, hogy a személyi jövedelemadó és a társadalombiztosítási járulékok ugyanezen években jelentős arányban negatív értéket vesznek fel: 2014 és 2021 között az EU-SILC mintájába került személyek 11-30%-ának volt negatív befizetése (vagyis az EU-SILC adatbázisa szerint több adó- és járulékvisszatérítést kaptak, mint amennyi adót és járulékot befizettek). Vannak olyan országok, ahol a negatív személyi jövedelemadóteher létező jelenség (pl. Belgiumban, Luxemburgban vagy Szlovákiában, ahol a bérhez kapcsolódóan olyan készpénzes ellátásokra jogosultak a munkavállalók, melyek értéke meghaladhatja a befizetett adó összegét), de Magyarország nem tartozik ezek közé. Ennek ellenére, az összes uniós tagállam összes elérhető adatfelvételi évében a 2005 és 2023 közötti időszakban a hat leggyakoribb eset Magyarországon fordult elő, a 2014 és 2021 közötti években. Amint erre már felhívtuk a figyelmet, a magyar adórendszerben ez csak kivételes esetekben fordulhatna elő.

Az eddig bemutatottak következtében jelentős számban fordulnak elő olyan esetek, amelyek a negatív adó- és járulékbefizetések miatt kerülnek a szegénységi küszöb fölé. Vagyis bruttó jövedelmük szegénységi küszöb alatt van, de a nettó jövedelmük szegénységi küszöb fölötti. Az ilyen módon szegénységből kilépő “küszöbátlépő” esetek aránya a teljes mintában 2014 és 2021 között 1-9%, akiktehát nagy valószínűség szerint csak azért kerültek a statisztikában a szegénységi küszöb fölé, mert a KSH olyan adó és járulékvisszatérítéseket számolt el nekik, ami a magyarországi szabályozás szerint nem fordulhat elő.
Ezt a jelenséget vizualizálja az alábbi ábra, melyben
- lila színnel jelöltük az EU-SILC adatai szerint szegénységben élő személyeket, akiknek adója 0 vagy pozitív, vagyis esetükben nem jelenik meg a negatív adó- és járulékfizetés okozta “küszöbátlépési” jelenség;
- szürke színnel jelöltük a szegénységi küszöbnél nagyobb jövedelemből élőket, akiket szintén nem érint a “küszöbátlépés”.
- A világoskék és sötétkék sávok azt mutatják, hogy hogyan változik meg az eloszlás, ha a negatív adó- és járulékértékeket figyelembe vesszük (sötétkék oszloprészek), illetve, ha figyelmen kívül hagyjuk (világoskék oszlopok).
A világoskék területek tehát azokat a szegénységi küszöbnél alacsonyabb jövedelmű eseteket mutatják, akiknek jövedelme a negatív adó- és járulékfizetés miatt került a szegénységi küszöb fölé (sötétkék terület). Ezen esetek adják 2020-ban az egyfős háztartások 21%-át, 2018-ban a teljes minta 5%-át.

2.3. További problémák a jövedelemadatokban
Mindezek mellett elemzésünk más jellegű problémákat is feltárt. A szegénységi rés-arány (vagyis a szegénységben élőknek a szegénységi küszöbtől vett távolsága) nagyfokú, EU-összevetésben kiemelkedő volatilitást mutat a 2017-2024 közötti időszakban, különösen a gyermekek körében, miközben a korábbi időszakban ilyet nem tapasztaltunk. Kifejezetten a 2023-as évben több, egymással összefüggő probléma jelentkezik a jövedelemeloszlás alsó részében, melyek következtében az erre az adatfelvételi évre vonatkozó, és a KSH (mint 2022-as adatpont) és az Eurostat adatbázisába is bekerült adatok outlier (kiugró érték) jellegét eredményezik. Ebben az évben egyszerre figyelhetjük meg
- a szegénységben élők jövedelemszintjének az adatsorban kiugróan alacsony,
- az egyes életkori csoportok, elsősorban a gyermekek szegénységi rés-arányának kiugróan magas értékét, valamint
- az egyes háztartástípusok/életkori csoportok szokatlan arányú előfordulását a jövedelemeloszlás meghatározott részein.
Ezek – az előző és a rákövetkező évhez viszonyítva egyaránt – kiugró értékek valós társadalmi folyamatokkal, társadalompolitikai intézkedésekkel nem, csak adatproblémákkal magyarázhatók. Ezeket a kérdéseket részletesebben is tárgyaltuk a KSH-nak és az Eurostatnak ezzel az írással egyidejűleg megküldött feljegyzésünkben, mely az érdeklődő kutatók számára elérhető a Researchgate platformon.
3. Összegzés és javaslatok
Kutatásaink számos jelentős problémára derítettek fényt az EU-SILC magyarországi jövedelemadataiban, melyek megingatták a bizalmat ezek megbízhatóságában és használhatóságában. Ez nemcsak a hazai felhasználókat érinti, hanem mindazokat a szereplőket Európa- és világszerte, akik a hazai jövedelemadatokkal vagy az azokból számított jövedelemegyenlőtlenségi és szegénységi mutatókkal dolgoznak, abból publikálnak vagy azokra alapozva szakpolitikai döntéseket hoznak.
Éppen ezért elengedhetetlennek tartjuk, hogy az adatok megbízhatóságába vetett bizalom helyreálljon, és addig is amíg ez megtörténik, a felhasználók tájékoztatást és egyértelmű útmutatást kapjanak az adatok minőségével és használatával kapcsolatban.
1. Javasoljuk, hogy a nyilvánvaló adathibákat tartalmazó évekből származó jövedelmen alapuló magyarországi mutatószámok az Eurostat és a KSH adatbázisából és publikációiból kerüljenek ki, vagy azokat lássák el egyértelmű „revízió alatt” jelöléssel. Ez minden 2013-at követő magyarországi hullámot érint. Ezen kívül, az EU-SILC mikroadatainak kiadásakor, a felhasználókat tájékoztassák a revízió tényéről és tartalmáról, valamint fogalmazzanak meg egyértelmű ajánlást a magyar mikroadatok használata során a publikációkban alkalmazandó figyelmeztetés szövegéről.
2. Javasoljuk, hogy mielőbb induljon szakmai párbeszéd a KSH-nak az EU-SILC adatokkal foglalkozó munkatársai és az adathasználók között, már a KSH által jelzett revízió időszaka alatt, vagyis 2025. június 30-a előtt. Ennek az lenne a célja, hogy az adatállományok revíziója ne csak a 2022-es népszámlálás adataihoz való újrasúlyozásra és a 2019-2023 közötti adatállományokra, hanem a jövedelemadatokhoz közvetlenül kapcsolódó problémák kezelésére is terjedjen ki a 2014 és 2024 közötti időszak egészére. Fenntartjuk korábbi, ehhez kapcsolódó javaslatunkat is, hogy a szakmai egyeztetésre a KSH-tól független és a kutatók bizalmát is élvező szakmai szervezet vagy intézmény keretei között kerüljön sor.
3. Javasoljuk, hogy a folyamat keretében a súlyozással, a jövedelemellenőrzéssel és adattisztítással, valamint a hiányzó adatok pótlásával kapcsolatos algoritmusok legyenek szabadon hozzáférhetők, ami a szakmai párbeszéd előfeltétele.
Tátrai Annamária, ELTE Társadalomtudományi Kar, Statisztika tanszék
Gábos András, TÁRKI
Huszár Ákos, HUN-REN Társadalomtudományi Kutatóközpont
Krekó Judit, Budapest Intézet, HUN-REN Közgazdaság- és Regionális Tudományi Kutatóközpont
Tomka Zsófia, TÁRKI
Az elemzésünk előállításához felhasznált kódokat a https://github.com/AnnamariaTatrai/EUSILC_HU_reliability2 oldalon tesszük közzé.
Nyitókép: Költségvetési számítások. Fotó: Riccardo Milani / Hans Lucas / AFP
Ezt a cikket nem közölhettük volna olvasóink nélkül. Legyen támogatónk a Donably-n, az új, biztonságos, magyar fejlesztésű előfizetési platformon. Paypal, utalás és más lehetőségek itt >>>