Rendszerszintű adatminőségi problémák az EU-SILC magyar jövedelmi adataiban (2014-2023) – Válasz Online
 

Rendszerszintű adatminőségi problémák az EU-SILC magyar jövedelmi adataiban (2014-2023)

Tátrai Annamária
Tátrai Annamária
Gábos András
Gábos András
Huszár Ákos
Huszár Ákos
Krekó Judit
Krekó Judit
Tomka Zsófia
Tomka Zsófia
| 2025.06.03. | Háttér

Újabb problémákat tártak fel a KSH szegénységi adatait elemző kutatók. Legfrissebb tanulmányuk rövidített változatát az alábbiakban közöljük.

hirdetes

Írásunk szorosan kapcsolódik két korábbi, a Válasz Online felületén megjelent cikkhez. A Kutatói aggodalmak az EU-SILC magyarországi jövedelemadataival kapcsolatban című anyagban Tátrai Annamária és Gábos András a magyarországi EU-SILC adataiban feltárt, a szegénységi mutatók számításával összefüggő adatproblémákra hívták fel a figyelmet. Ezek az adatproblémák a szegénységi folyamatok hazai és európai uniós szintű nyomon követésének legfontosabb indikátorait érintik. A szerzők állítása szerint az adatproblémák csak szakmai hibák sorozataként állhattak elő, felvetve az adatmanipuláció lehetőségét is. Élő Anita Valami nagyon nem stimmel a KSH szegénységi adataival című írása Tátrai és Gábos eredményeihez kapcsolódva a szegénységkutatás közelmúltjának több aspektusát is tárgyalta. A Központi Statisztikai Hivatal (KSH) közleményében visszautasította az adatmanipuláció vádját, a jövedelemtorlódást a kereseteloszlás mintázataival magyarázta és a következő tájékoztatást adta:

Vagyis a KSH közleménye szerint a jelenleg folyó un. “nagyrevízió” ill. “rutin revízió” eredményeképpen nem változnak majd érdemben a korábban publikált szegénységi arányok. Az alábbiakban aggodalmunkat fejezzük ki azzal kapcsolatban, hogy vajon a KSH közleményében jelzett revízió kellő jelentőséget tulajdonít-e a felmerült problémáknak és a megfelelő alapossággal tervezi-e azokat kezelni. A revízió eredményeinek megelőlegezését szakmailag aggályosnak látjuk. Szakmai álláspontunk szerint az eddig feltárt problémák súlyossága és az adatproblémák természete a cikkünk megjelenésének idejében publikáltnál magasabb szegénységi arányt valószínűsít.

A problémák feltárása, vagyis 2023 óta számos alkalommal kezdeményeztünk párbeszédet a KSH-val, legutóbb 2025. április 17-én kelt, Kincses Áronnak, a KSH elnökének küldött levelünkben kértük, hogy mihamarabb kezdődjön szakmai egyeztetés az ügyben, biztosítsanak rálátást a tervezett felülvizsgálat elveire és módszereire, illetve az adattisztítási és imputálási folyamat részleteire. Egy ilyen egyeztetés lehetőséget adna a kutatói közösségben folyamatosan felhalmozódó tudás figyelembevételére a rutin revízió során, és így segíthetné – a kutatók számára egyetlen elérendő célként – a jó minőségű adatállományok létrehozását. Felvetésünkre a KSH nem mutatott nyitottságot, levelünkre nem kaptunk választ.

Újabb eredményeinket ezért a nyilvánosság előtt tesszük közzé,de ezzel párhuzamosan a KSH-val és az Eurostat-tal közvetlenül is megosztjuk azokat. Jelen írásunk az elemzésünk rövidített, közvélemény számára készített változata. Megállapításainkat most is, a magyarországi jövedelemadatok forrásának, az EU-SILC adatállománynak elemzésére alapozzuk. A szövegben alkalmazott naptári évek – hacsak külön nem jelezzük – az adatfelvétel évét jelölik. Az adatproblémák egy részével a Válasz Online-on 2025. április 1-jén megjelent írásban már foglalkoztunk. Az ott bemutatott problémák rövid összefoglalása után ismertetjük azokat az új számításokat, amelyeket a kutatói közösség végzett a cikk megjelenését követően. Ezek a számítások újabb adatproblémákat tártak fel, immár egy hosszabb, 2014 és 2023 közötti időszakban. Írásunk zárásként olyan szakmai javaslatokat fogalmazunk meg, amelyek szerintünk nélkülözhetetlenek az adatokkal kapcsolatos bizalom helyreállításához.

1. Mit állítottunk előző cikkünkben?

A Válasz Online felületén április 1-jén megjelentírásban és a KSH április 3-i közleményére adott válaszunkban három fontos állítást tettünk a jövedelemadatok megbízhatóságával kapcsolatban.

1. 2018-tól kezdődően olyan kiugró értékeket, csoportosulásokat figyeltünk meg a jövedelemeloszlásban, amelyek a szegénységi küszöb körül, a legtöbb esetben közvetlenül felette koncentrálódnak. Ilyen jelenség nem figyelhető meg más uniós tagállamok adataiban, és valószínűtlen, hogy természetes módon alakuljon ki.

A szegénységi küszöb feletti jövedelemtorlódás a 2021. évi adatok példáján (Forrás: saját számítások az EU-SILC adatai alapján.
Megjegyzés: A 2005-2023-as időszak egészére elérhető interaktív vizualizáció itt látható)

2. Elemzésünk eredményei arra utalnak, hogy ezek a torlódások az adattisztítás, a hiányzó adatok pótlása (imputálás) munkafázisában keletkezhettek, és ezek nyomán több évben is nagy valószínűséggel a valósnál alacsonyabbra becsülték a magyarországi szegénységi arányszámot. A hiányzó adatok pótlásának folyamata során olyan anomáliák is megjelentek, mint például az azonos jövedelmi értékek magas aránya: 2020-ban 316 egyfős háztartás jövedelme megegyezett (1,3 millió FT, 3996,3110974 €), ami statisztikailag rendkívül valószínűtlen.

3. A KSH közleményében megjelent állítással szemben, ezek a csoportosulások nem a minimálbér, garantált bérminimum, közfoglalkoztatotti bér miatt keletkeztek. Egyrészt azért, mert a jövedelemcsoportosulások nem esnek egybe az adott évi adminisztratív értékekkel, még az egyszerűbb jövedelemszerkezetű egyfős háztartások esetében sem. Másrészt azért, mert a jövedelemeloszlást a háztartás egy fogyasztási egységre jutó éves összjövedelme alapján számoljuk, aminek a kereset még az egyfős háztartások esetében is csak egyik összetevője, és elhanyagolható a valószínűsége annak, hogy ez a jövedelem egy nagyon szűk sávban ilyen nagy arányban forduljon elő, mint 2018 és 2021 között Magyarországon.

Az egyfős háztartások jövedelemeloszlását mutató hisztogram, adatfelvételi év: 2020, referenciaév: 2019 (Forrás: saját számítások az EU-SILC adatai alapján)

2. Mit állítunk most?

Fő állításunk az, hogy az EU-SILC jövedelemadatai egy olyan országot tárnak elénk, ami biztosan nem lehet Magyarország: a 2014 és 2021 közötti időszakban a mintába került háztartások 4-34%-ának esetében a rendelkezésre álló éves nettó jövedelem meghaladta a bruttó háztartás-jövedelem értékét. Eszerint a személyek 11-30%-a nem fizeti az adót, hanem kapja. Ez a magyar személyi jövedelemadó- és társadalombiztosítási járulékrendszer jellemzőit figyelembe véve lehetetlen.

2.1. 2020-ban 316 egyfős háztartás jövedelme azért azonos, mert eltérő bruttó jövedelmüket eltérő összegű – a magyar adórendszerben nem létező – negatív adó- és járulékösszegek egészítik ki

Az EU-SILC részletes információkat tartalmaz a mintába kerülő személyek, illetve háztartásaik különböző forrásokból származó jövedelmeiről. E különböző fajta jövedelmeket pedig két fő változóban összesíti.

Az összes rendelkezésre álló háztartás-jövedelem tehát arról nyújt információt, hogy egy-egy háztartás ténylegesen mekkora jövedelemből gazdálkodhat, mennyit tud valóban elkölteni. A jövedelmi szegénység, illetve a jövedelmi egyenlőtlenségek különböző mutatói ezen a változón alapulnak.

A kivont tételek mindegyike – tehát a jövedelmeket, illetve a vagyont terhelő adók, valamint a más háztartásoknak adott juttatások – csak nulla, vagy pozitív értéket vehet fel Magyarországon. (Európa egyes országaiban létezik olyan szabályozás, amely megengedi a befizetett adónál nagyobb összegű visszatérítést, ilyen típusú eszközöket azonban Magyarországon sohasem alkalmaztak. Ebben a kérdésben kértük az adóhivatal állásfoglalását, amely megerősítette, hogy Magyarországon ez csak kivételes esetben fordulhat elő.) Vagyis alapesetben teljesülnie kellene annak az összefüggésnek, hogy a bruttó háztartási jövedelem nagyobb vagy egyenlő, mint a rendelkezésre álló (nettó) háztartási jövedelem.




Megjegyzés. Ennek az összefüggésnek attól függetlenül fenn kell állnia, hogy bruttó, nettó, vagy bruttó és nettó jövedelmet is megadtak a mintába került személyek a kérdőív megválaszolásakor. Ha valamelyik jövedelmet nem kérdezték, vagy a válaszadó nem adott választ, akkor az adattisztítás során a KSH pótolja (imputálja) ezeket az értékeket.

Új eredményeink bemutatásához első lépésben az egyfős háztartások 2020-as adatait hívjuk segítségül. Emlékeztetőül: 2020-ban az egyfős háztartások 14%-ának, 316 egyfős háztartás éves jövedelme hajszálpontosan megegyezett (1,3 millió Ft, vagyis 3996,3110974 €). Ez az érték mintegy 35 ezer forinttal (109 euróval) haladja meg a szegénységi küszöböt (1.264.430 Ft, vagyis 3887 €).

Az első írásunk óta elvégzett vizsgálat azt mutatta ki, hogy

1. az egyező jövedelmű háztartásokat kizárólag egyedül élő nyugdíjas személyek alkotják.Az érintett személyek mindannyian 57-81 évesek, mindannyian kapnak öregségi nyugdíjat, 283 főnek (90%) egyáltalán nem volt munkajövedelme, 311 fő (98%) éves munkajövedelme nem éri el az 50.000 Ft-ot (154 €), tehát szinte kizárólag nyugdíjból élő háztartásokról van szó.

2. A 316 esetből 307 esetben az összes bruttó jövedelem, vagyis a nyugdíj, a bruttó munkabér és alkalmanként előforduló egyéb bevételek együttes értéke szegénységi küszöb alatti.

3. Ez a 307 háztartás azért került mégis a szegénységi küszöb fölé, mert esetükben az adók és járulékok értéke negatív volt. Mind a 307 esetben tehát a nyugdíj, és az összes bevétel értéke szegénységi küszöb alatti, egyénenként más-más összegű. Ezzel szemben mind a 307 esetben a nettó jövedelem egyezik. Vagyis a negatív adó- és járulékfizetés megemelte a számított nettó jövedelmet – a valóságosnál magasabb értéket eredményezve. Így ezek a háztartások hibás adóadatok miatt a nem szegények közé kerültek, noha bruttó jövedelmi helyzetük szerint mindannyian a szegények közé tartoznának.

Az alábbi táblázat illusztrációképpen néhány esettel szemlélteti a 316 egyező jövedelmű, egyfős háztartás közül 307 alkalommal fennálló helyzetet. A táblázat a háztartások éves jövedelmeket és rendszeres kiadásait, valamint a rendelkezésre álló (nettó) jövedelmet rögzíti, amit az 1.264.430 Ft-os szegénységi küszöbbel érdemes összevetni.

Forrás: saját számítások az EU-SILC adatai alapján. Megjegyzés: A táblázatban adatvédelmi okokból (vagyis a beazonosíthatóság lehetőségének kizárása érdekében) az adatbázisban szereplő értékeket kismértékben módosítottuk, azonban minden esetben úgy jártunk el, hogy az állományban lévő mintázatokat a módosított adatok is tükrözzék

Kizártnak tartjuk, hogy az itt 6 eseten bemutatott, de az EU-SILC adatbázisában 307 esetben ugyanígy megjelenő jövedelemösszetétel valós lehetne.

A továbbiakban az azonos rendelkezésre álló (nettó) jövedelmet mutató háztartásokon kívül az összes egyfős háztartás jövedelmével foglalkozunk 2013-as és 2020-as évben.

Az alábbi ábra az egyfős háztartások jövedelemeloszlásának alsó 50%-át mutatja, a bruttó jövedelmük szerint sorba rendezve 2013-ban és 2020-ban. A szaggatott vonal a szegénységi küszöb adott évi értékét jelzi, az ez alatti nettó jövedelemmel rendelkező esetek számítanak szegénységben élőnek.

Az egyfős háztartásokban élők egy fogyasztási egységre jutó bruttó és rendelkezésre álló (nettó) jövedelme Magyarországon, 2013-ban és 2020-ban (fő)

Forrás: saját számítások az EU-SILC alapján

Az eloszlást vizsgálva a következőket állapíthatjuk meg:

A 2013 évi az eloszlás megfelel a jövedelemeloszlások jellemző mintázatának, illetve összhangban van azzal, amit a magyar adórendszer és jövedelemszerkezet ismeretében várunk.

Véleményünk szerint ezek az adatok nem reprezentálhatják a magyarországi egyfős háztartások valós jövedelemeloszlását 2020-ban.

Az egyfős háztartások jövedelemeloszlását 2013-ban és 2020-ban bemutató ábra interaktív változata, ami a 2005-2023 közötti időszak egészére és más háztartástípusokra (valamint a teljes mintára) történő szűrést is lehetővé teszi, a https://tatraiannamaria.shinyapps.io/nettobrutto linken érhető el.

2.2. A 2020-ban tapasztalt eset nem egyedi, ennél általánosabb és súlyosabb problémával van dolgunk

A 2020-ban az egyfős háztartásoknál bemutatott helyzet, mely szerint az esetek jelentős részében a rendelkezésre álló háztartás-jövedelem meghaladta a bruttó háztartás-jövedelem értékét, korántsem egyedi: 2014 és 2021 között minden évben és számos háztartástípusban nagy számban előfordult. Ebben az időszakban a hivatalos adatok alapján – ahogyan az alábbi ábrán is látható – a magyarországi háztartások 4-34%-ának alacsonyabb volt a bruttó jövedelme, mint a rendelkezésre álló jövedelme. Ezzel szemben 2014 előtt és 2021 után hasonlóra nem volt példa, vagy arányuk az összes esethez képest elhanyagolható volt.

Azon személyek aránya a magyarországi EU-SILC adatokban, akiknek háztartásában a rendelkezésre álló jövedelem nagyobb a háztartás bruttó jövedelménél (2005-2023) Forrás: saját számítások az EU-SILC adatai alapján

Ez az ellentmondás elsősorban abból származik, hogy a személyi jövedelemadó és a társadalombiztosítási járulékok ugyanezen években jelentős arányban negatív értéket vesznek fel: 2014 és 2021 között az EU-SILC mintájába került személyek 11-30%-ának volt negatív befizetése (vagyis az EU-SILC adatbázisa szerint több adó- és járulékvisszatérítést kaptak, mint amennyi adót és járulékot befizettek). Vannak olyan országok, ahol a negatív személyi jövedelemadóteher létező jelenség (pl. Belgiumban, Luxemburgban vagy Szlovákiában, ahol a bérhez kapcsolódóan olyan készpénzes ellátásokra jogosultak a munkavállalók, melyek értéke meghaladhatja a befizetett adó összegét), de Magyarország nem tartozik ezek közé. Ennek ellenére, az összes uniós tagállam összes elérhető adatfelvételi évében a 2005 és 2023 közötti időszakban a hat leggyakoribb eset Magyarországon fordult elő, a 2014 és 2021 közötti években. Amint erre már felhívtuk a figyelmet, a magyar adórendszerben ez csak kivételes esetekben fordulhatna elő.

A negatív adó- és járulék értékkel rendelkezők aránya a magyarországi EU-SILC mintájában (2005-2023) Forrás: saját számítások az EU-SILC adatai alapján

Az eddig bemutatottak következtében jelentős számban fordulnak elő olyan esetek, amelyek a negatív adó- és járulékbefizetések miatt kerülnek a szegénységi küszöb fölé. Vagyis bruttó jövedelmük szegénységi küszöb alatt van, de a nettó jövedelmük szegénységi küszöb fölötti. Az ilyen módon szegénységből kilépő “küszöbátlépő” esetek aránya a teljes mintában 2014 és 2021 között 1-9%, akiktehát nagy valószínűség szerint csak azért kerültek a statisztikában a szegénységi küszöb fölé, mert a KSH olyan adó és járulékvisszatérítéseket számolt el nekik, ami a magyarországi szabályozás szerint nem fordulhat elő.

Ezt a jelenséget vizualizálja az alábbi ábra, melyben

A világoskék területek tehát azokat a szegénységi küszöbnél alacsonyabb jövedelmű eseteket mutatják, akiknek jövedelme a negatív adó- és járulékfizetés miatt került a szegénységi küszöb fölé (sötétkék terület). Ezen esetek adják 2020-ban az egyfős háztartások 21%-át, 2018-ban a teljes minta 5%-át.

A jövedelemeloszlás változása a küszöbátlépő esetek következtében (2018) Forrás: saját számítások az EU-SILC adatai alapján.

2.3. További problémák a jövedelemadatokban

Mindezek mellett elemzésünk más jellegű problémákat is feltárt. A szegénységi rés-arány (vagyis a szegénységben élőknek a szegénységi küszöbtől vett távolsága) nagyfokú, EU-összevetésben kiemelkedő volatilitást mutat a 2017-2024 közötti időszakban, különösen a gyermekek körében, miközben a korábbi időszakban ilyet nem tapasztaltunk. Kifejezetten a 2023-as évben több, egymással összefüggő probléma jelentkezik a jövedelemeloszlás alsó részében, melyek következtében az erre az adatfelvételi évre vonatkozó, és a KSH (mint 2022-as adatpont) és az Eurostat adatbázisába is bekerült adatok outlier (kiugró érték) jellegét eredményezik. Ebben az évben egyszerre figyelhetjük meg

Ezek – az előző és a rákövetkező évhez viszonyítva egyaránt – kiugró értékek valós társadalmi folyamatokkal, társadalompolitikai intézkedésekkel nem, csak adatproblémákkal magyarázhatók. Ezeket a kérdéseket részletesebben is tárgyaltuk a KSH-nak és az Eurostatnak ezzel az írással egyidejűleg megküldött feljegyzésünkben, mely az érdeklődő kutatók számára elérhető a Researchgate platformon.

3. Összegzés és javaslatok

Kutatásaink számos jelentős problémára derítettek fényt az EU-SILC magyarországi jövedelemadataiban, melyek megingatták a bizalmat ezek megbízhatóságában és használhatóságában. Ez nemcsak a hazai felhasználókat érinti, hanem mindazokat a szereplőket Európa- és világszerte, akik a hazai jövedelemadatokkal vagy az azokból számított jövedelemegyenlőtlenségi és szegénységi mutatókkal dolgoznak, abból publikálnak vagy azokra alapozva szakpolitikai döntéseket hoznak.

Éppen ezért elengedhetetlennek tartjuk, hogy az adatok megbízhatóságába vetett bizalom helyreálljon, és addig is amíg ez megtörténik, a felhasználók tájékoztatást és egyértelmű útmutatást kapjanak az adatok minőségével és használatával kapcsolatban.

1. Javasoljuk, hogy a nyilvánvaló adathibákat tartalmazó évekből származó jövedelmen alapuló magyarországi mutatószámok az Eurostat és a KSH adatbázisából és publikációiból kerüljenek ki, vagy azokat lássák el egyértelmű „revízió alatt” jelöléssel. Ez minden 2013-at követő magyarországi hullámot érint. Ezen kívül, az EU-SILC mikroadatainak kiadásakor, a felhasználókat tájékoztassák a revízió tényéről és tartalmáról, valamint fogalmazzanak meg egyértelmű ajánlást a magyar mikroadatok használata során a publikációkban alkalmazandó figyelmeztetés szövegéről.

2. Javasoljuk, hogy mielőbb induljon szakmai párbeszéd a KSH-nak az EU-SILC adatokkal foglalkozó munkatársai és az adathasználók között, már a KSH által jelzett revízió időszaka alatt, vagyis 2025. június 30-a előtt. Ennek az lenne a célja, hogy az adatállományok revíziója ne csak a 2022-es népszámlálás adataihoz való újrasúlyozásra és a 2019-2023 közötti adatállományokra, hanem a jövedelemadatokhoz közvetlenül kapcsolódó problémák kezelésére is terjedjen ki a 2014 és 2024 közötti időszak egészére. Fenntartjuk korábbi, ehhez kapcsolódó javaslatunkat is, hogy a szakmai egyeztetésre a KSH-tól független és a kutatók bizalmát is élvező szakmai szervezet vagy intézmény keretei között kerüljön sor.

3. Javasoljuk, hogy a folyamat keretében a súlyozással, a jövedelemellenőrzéssel és adattisztítással, valamint a hiányzó adatok pótlásával kapcsolatos algoritmusok legyenek szabadon hozzáférhetők, ami a szakmai párbeszéd előfeltétele.

Tátrai Annamária, ELTE Társadalomtudományi Kar, Statisztika tanszék
Gábos András, TÁRKI
Huszár Ákos, HUN-REN Társadalomtudományi Kutatóközpont
Krekó Judit, Budapest Intézet, HUN-REN Közgazdaság- és Regionális Tudományi Kutatóközpont 
Tomka Zsófia, TÁRKI


Az elemzésünk előállításához felhasznált kódokat a https://github.com/AnnamariaTatrai/EUSILC_HU_reliability2 oldalon tesszük közzé.


Nyitókép: Költségvetési számítások. Fotó: Riccardo Milani / Hans Lucas / AFP

Ezt a cikket nem közölhettük volna olvasóink nélkül. Legyen támogatónk a Donably-n, az új, biztonságos, magyar fejlesztésű előfizetési platformon. Paypal, utalás és más lehetőségek itt >>>

hirdetés

#EU-SILC#KSH#szegénység#szegénységi adatok