Számoljunk le végre a vizuális analfabétizmussal!

| 2026.06.01. | esszé

Úgy érezhetjük, a mesterséges intelligencia (AI) tökéletesre csiszolt „fényképeivel” végleg kicsúszik a kezünkből a valóság, és már a saját szemünknek sem hihetünk. Pedig a vizuális megtévesztés szinte egyidős a kultúránkkal, és az idén 200 éves fotográfia a valóságnak egy interpretációja volt mindig is. A félrevezető digitális giccs áradata feletti kétségbeesés helyett érdemes felismerni a lehetőséget: az AI okozta sokk lehet az a régóta várt katalizátor, amely végre rákényszerít minket a vizuális analfabétizmus felszámolására. Vendégszerzőnk, Virágvölgyi István kurátor, a Capa Központ művészeti vezetőjének esszéje.

A kíváncsiság evolúciós csapdája

Miért nem tudjuk levenni a szemünket egy fotónak látszó, gyanúsan tökéletes AI-képről? A válasz az agyunk mélyén, evolúciós huzalozásunkban rejlik. Az ember olthatatlanul kíváncsi lény, aki szereti feszegetni az érzékelése határait, ezért ösztönösen vonzódik az illúziókhoz.

Amikor valami olyat látunk, ami eltér az elvárttól, az agyunk azonnal fokozott elemzésbe kezd. Ez egy túlélési mechanizmus, amely a dopaminrendszerünk „jutalmazási jóslási hibájaként” működik: a meglepetés, az új információ vagy akár csak annak ígérete örömérzetet vált ki, hogy ösztönözze a tanulást és a környezetünk pontosabb kiismerését. Emiatt keressük tudat alatt is azt, ami „becsapja” a szemünket.

Valójában, ahogy Irving Biederman idegtudós fogalmaz, az ember biológiailag kódolt „infovore”, azaz információfaló lény, akinek az agya éhezik a vizuális mintázatokra. Mindannyian ismerjük például a pareidolia jelenségét, amikor állatokat vélünk felfedezni a felhőkben vagy arcokat egy bolygó felszínén – az agyunk egyszerűen éhezik az értelemre, még ott is, ahol nincs.

A pareidolia jelenségének felhasználása a művészetben: Arcimboldo híres festménye mindannyiunk számára nyilvánvalóan nemcsak néhány furcsán elrendezett gyümölcsöt és virágot, hanem egy emberi arcot ábrázol. Giuseppe Arcimboldo: II. Habsurg Rudolf Vertumnusként, olajfestmény fatáblán, 70,5×57,5 cm, 1590 (forrás: Wikipédia/Google Arts & Culture)

A szemfényvesztés évezredei: az ókori festészettől a hiperrealizmusig

Az illúziókeltés vágya tehát egyidős az emberi kultúrával. A síkbeli felületeken alkalmazott, érzékeket megzavaró technikák már az antikvitásban is foglalkoztatták a 2500 évvel (!) ezelőtt élt őseinket. A híres ókori görög legenda szerint Zeuxisz olyan élethű szőlőt festett, hogy a madarak rászálltak csipegetni azt – ám vetélytársa, Parrhasziosz még rajta is túltett, amikor olyan valósághű függönyt festett a falra, amelyet maga Zeuxisz próbált meg félrehúzni.

A művészettörténet során ez a törekvés kristályosodott ki a trompe-l’œilnek nevezett, szó szerinti fordításban „szemet becsapó” technikákban. A festők megtanulták tudatosan ingerelni az agyunk vizuális rendszerét, így művészetük a vizuális manipuláció kísérleti laboratóriumává vált (ezért magán a művészeten keresztül érthetjük meg a leghatékonyabban e vizuális folyamatot). A trompe-l’œil módszer a művész mesterségbeli virtuozitását is bizonyította, miközben folyamatosan elámította a nézőt. Kiváló példa erre Giovanni Santi A fájdalmas Krisztus című festménye, ahol egy apró, festett légy zavarja meg az érzékeinket: a kép síkján pihenő rovar illúziója olyan elemi erejű, hogy még 500 évvel elkészülte után is képes azonnali reflexet és meglepetést kiváltani az észlelésünkből.

A Krisztus testén látható légy kettős jelentéssel bír: egyfelől a nézőt megtévesztő, a festményt még valószerűbbé tevő trompe-l’œil bravúr, másfelől pedig olyan mágikus védelmező jelkép, amelynek célja a valódi rovarok távoltartása volt. Giovanni Santi: A fájdalmas Krisztus (Vir Dolorum), tempera festmény vásznon, 66,5×54,5 cm, 1490 körül (forrás: Szépművészeti Múzeum)

A festészet illúziókeltése az ellenreformáció barokk katedrálisainak mennyezetén találkozott össze az építészettel leglátványosabban. A római Sant’Ignazio és Il Gesù templomok vagy a bécsi Jezsuita-templom mai szemmel is lélegzetelállító, háromdimenziós hatású, de valójában síkbeli freskói szinte szó szerint kaput nyitottak a mennyországra. Felemelve ezzel a hívőt a mindennapi nyomorból, és visszaterelve őt a katolikus nyájba.

Érdekes megkeresni az építészet és a festmény határát, ahol a valós épületet festészeti illúzióval kezdik tovább nagyítani. Jezsuita-templom, Bécs (fotó: Gyulai Szilvia)

A vizuális illúziók történetében azonban nem a valóság hű leutánzása az egyetlen módja az érzékeink kijátszásának; a huszadik század közepén megjelenő op-art (optikai művészet) egészen más utat választott. Míg a korábbi korok trompe-l’œil festészete a valóság precíz másolásával téveszt meg, az op-art nem létező látványok segítségével akart ugyanolyan – vagy talán még letaglózóbb – illúziót teremteni. A műfaj világhírű úttörője, a magyar származású Victor Vasarely tökélyre fejlesztette ezt a játékot. Geometrikus konstrukciói ugyan nem a fizikai valóságban léteznek, optikai erejük mégis elsöprő, és szinte fizikai reakcióra kényszerítik az agyunkat – bizonyítva, hogy a szemünk tiszta absztrakcióval is tökéletesen manipulálható.

Victor Vasarely: Vega, szitanyomat papíron, 50,5×66 cm, 1957/1959 (forrás: Szépművészeti Múzeum/Vasarely Múzeum)

Azt hihetnénk, hogy a fotográfia megjelenésével a valóságot minél jobban utánzó illúziók kora lejárt, hiszen beköszöntött a képek világába maga a „valóság”. Érdekes válasza volt erre a festészetnek a hiperrealizmus, amely olyan extrémen valósághű festményeket hoz létre, amik több részletet és tükröződést mutatnak meg, mint amit szabad szemmel valaha láthatnánk – valóságosabbnak hatnak a valóságnál. Az AI-generált „fényképek” valójában ennek a folyamatnak a betetőzései. Az algoritmus nem fényképez, hiszen nem tárgyakról visszaverődő fényt rögzít, hanem korábbi fényképek és más vizuális illusztrációk alapján szintetizál; olyan képet hoz létre, amiről a betáplált adatok alapján sejti, hogy tetszeni fog nekünk. Ez nem fotó, hanem egy algoritmikus-hiperrealisztikus kép, ami a kollektív vágyainkból építkezik.

Richard Estes: Telefonfülkék, akril festmény farostlemezen, 122×175,3 cm, 1967 (forrás: Museo Nacional Thyssen-Bornemisza, Madrid)

A fotográfia nagy mítosza: az objektivitás illúziója

Bár az AI képgenerálás logikája a festészetéhez áll közelebb (nincs a valóság leképezéséhez kötve), a végeredmény mégis fotórealisztikus, ezért a befogadó ugyanabba a csapdába esik: elhiszi a fotográfia objektivitásának makacs mítoszát. Bár a fotográfia idén kétszáz (!) éves, a fejünkben még mindig „tinédzserkorát” éli az értelmezése: ösztönösen azt feltételezzük, hogy amit egy fotón látunk, az maga a nyers valóság. Pedig a fénykép sosem volt más, mint szubjektív interpretáció, hiszen a valóságnak egy technikai tulajdonságok és emberi döntések által meghatározott szeletét rögzíti – ez alól még a tudományos vagy a rendőrségi helyszínelési képek sem kivételek, pedig alkotóik a lehető legközelebb próbálnak kerülni az objektív valóság dokumentálásához.

A fotóba vetett vakhit az agyunk alapműködéséből fakad. Az emberi agyba érkező információk túlnyomó többsége – egyes becslések szerint akár 90 százaléka – vizuális természetű, tehát a látásunkhoz köthető. A világ elképesztő komplexitását pedig folyamatos egyszerűsítésekkel próbáljuk kezelhetővé tenni. Ahogy Daniel Kahneman Nobel-díjas pszichológus rámutatott, gondolkodásunk mintegy 95 százaléka gyors, intuitív sémákra épül. Ez az automatizmus az oka annak, hogy a legtöbb ingerre – amelyek nagy része vizuális – reflexszerűen, kritikai szűrő nélkül reagálunk.

A fotográfia esetében is pontosan ezen az észlelési korláton csúszunk el. Míg egy távcsőbe pillantva érezzük az eszköz jelenlétét, hatását és korlátait, addig

egy fényképet nézve nem vesszük figyelembe, nem gondoljuk végig a fotógép torzításait vagy a fotós szelektív döntéseit és lehetséges motivációit, amelyek mind nagyban befolyásolták a fotót.

A modern kijelzőket ráadásul tudatosan úgy tervezik, hogy szinte észrevétlenek maradjanak, így a rajtuk látott digitális képeket ma már természetesebbnek érezzük, mint egy optikai eszközzel, mondjuk egy mikroszkópon keresztül vizsgált látványt.

Ez a vizuális kiszolgáltatottságunk válik a manipuláció melegágyává. Társas lényként alapvető igényünk, hogy hatást gyakoroljunk egymásra. Céljaink elérése érdekében – gyakran nem is tudatosan – folyamatosan alakítjuk a rólunk vagy a világról alkotott képet: elhallgatunk tényeket, vagy eszközöket keresünk a másik meggyőzésére és elámítására. Ez az ősi emberi szándék szülte a tudatos képmanipulációt is, amely valójában nem az AI-val, hanem magával a fotográfiával egyidőben született meg, hogy a látványt a saját narratíváinkhoz igazítsa.

Fotózás előtt: a megfigyelő hatása és a megrendezett valóság

Általában az utólagos retusálást értjük képmanipuláció alatt, pedig a valóság torzítása már az exponálás előtt megkezdődik. A fényképezőgép megjelenése önmagában megváltoztat bármilyen szituációt: amint valaki felemeli az okostelefonját, a jelenlévők elkezdenek „viselkedni”, hiszen tudják, hogy potenciálisan megörökíthetik őket. Máris nem az történik, ami a gép jelenléte nélkül zajlana. A legáltalánosabb manipulációnk pedig csupán egyetlen szó: „Csíííz!” A pillanatnyi, mesterséges mosoly kiprovokálásával megszépítjük a valóságot, és ez a módosítás még az ilyesmi kiszűrésében egyébként szigorú sajtófotó-pályázatok szűrőjén sem akad fenn.

Ez a fajta rendezői attitűd rögtön a technika hajnalán jelen volt. A francia Louis Daguerre, a fotográfia feltalálóinak egyike, híres képén a Temple körútról (1838) csak egy cipőpucoló és ügyfele látszik Párizs nyüzsgő belvárosában. Mindenki más mozgásban volt, így nem hagyott nyomot a hosszú képrögzítési idő alatt az alacsony fényérzékenységű nyersanyagon. De a tízperces expozícióhoz képest még így is túl éles a két emberi alak. Daguerre valószínűleg modelleket bérelt fel, akiket tudatosan állított be mozdulatlanul a kompozíció egy hangsúlyos pontjára, hogy így népszerűsítse találmányát az ember első fotográfiai bemutatásával.

Louis-Jacques-Mandé Daguerre: Boulevard du Temple, dagerrotípia, kb. 13×16 cm, 1838. május 4. (forrás: Wikipedia)

A lefotózott jelenet megrendezésének egy évszázaddal későbbi példája Jevgenyij Haldej 1945-ös fotója a berlini Reichstagra „frissen” kitűzött szovjet zászlóról. A állami hírügynökség számára dolgozó fotóriporter nem csupán passzívan megörökítette az eseményt, hanem aktívan megrendezte azt: vörös asztalterítőből varratott zászlót vitt magával, és katonákat kért meg a jelenet újrajátszására napokkal a valódi városostrom után. A képet később tovább retusálták: drámai füstöt adtak hozzá, és eltüntették a katona karjáról a két karórát, hogy elkerüljék a fosztogatás gyanúját.

Az első az eredeti fotó, a második annak retusált változata, ahogyan a szovjet Ogonjok magazinban 1945. május 13-án megjelent – eltávolított karórával és hozzáadott füsttel. Zászlófelvonás a Reichstag felett, Berlin, Németország, 1945. május 2. (fotó: Jevgenyij Haldej/TASzSz/Wikipedia)

Fotózás közben: technikai absztrakció és optikai csalódás

Sok olyan tulajdonsága van a fotográfiának, ami az exponálás pillanatában módosítja a képet. A fekete-fehér képek esetében például a színek kivonása már önmagában erős absztrakció, amit kétszáz éve természetesnek fogadunk el.

Emellett a fotográfus technikai választásai is módosítják a látványt. A képkivágás meghatározásával a fotós dönt arról, mi maradjon ki a megmutatott narratívából – mit „mond el” és mit „hallgat el”. Ugyanígy az objektívválasztás is drasztikusan alakítja a fénykép térérzetét: teleobjektívvel megfelelően fényképezve egy tucatnyi ember is sűrű tömegnek tűnhet. A különböző szűrők, hosszú expozíciós idők és vakubeállítások szintén mind a vizuális hatás fokozását szolgálják és a fotós eszköztárának részei.

Fotózás után: a sötétkamra és a montázs hatalma

A kép elkészülte utáni képmódosítás sem az AI vagy a Photoshop találmánya. Például már 1865-ben, Abraham Lincoln meggyilkolása után egy olyan heroikus hatású portrényomatot árultak az elnökről, amely valójában egy ügyes montázs volt: Lincoln fejét éppen egyik politikai riválisa, John C. Calhoun szenátor testére másolták rá. Mivel Calhoun a rabszolgatartó Dél egyik legfőbb ideológusa volt, az eredeti képen szereplő feliratokat is át kellett dolgozni, hogy illeszkedjenek Lincoln szellemiségéhez. Lincoln fejét pedig Anthony Berger fotójáról másolta át – tükrözés után – a fényképeket egy montázsban egyesítő szemfüles vállalkozó.

Ez egy montázs, amin Abraham Lincoln feje egy John C. Calhoun szenátort ábrázoló nyomat testére és hátterére van rámásolva. Abraham Lincoln amerikai elnök (feliratok a képen: Constitution, Union, Proclamation of freedom), mezzotinto nyomat, 1865? (forrás: William Pate/Library of Congress)

John C. Calhoun amerikai szenátor (feliratok a képen: Strict constitution, Free trade, The sovereignty of the states), mezzotinto nyomat (Mathew B. Brady dagerrotípiája alapján Thomas Hicks festette, majd Alexander Hay Ritchie metszette), kb. 1852 (forrás: A.H. Ritchie & Co./Library of Congress)

Abraham Lincoln amerikai elnök, albumin papírkép, 1864. február 9. (forrás: Anthony Berger/Mathew Brady Studio/Library of Congress)

Ha már a sötétkamrák korában is így hajlították a valóságot a politikai narratíva vagy a piaci igények kedvéért, miért lepődnénk meg ma az AI által generált látványokon? Az algoritmus csupán felgyorsította azt a folyamatot, amely a fotográfia első pillanatától kezdve velünk van: a vágyat, hogy az ábrázolt látványt a saját céljainkhoz igazítsuk.

A „vizuális funkcionális analfabétizmus” felszámolása

Az AI keltette bizonytalanság, bár kétségkívül fájdalmas, valójában elengedhetetlen a fejlődésünkhöz. Egy hamis viszonyítási pontot ugyan elveszítünk, de cserébe esélyt kapunk a szellemi érettségre. Ahogy Susan Sontag fogalmazott:

„A fénykép azt sugallja: akkor tudunk a világról, ha olyannak fogadjuk el, amilyennek a fényképezőgép rögzíti. Ez viszont pontosan az ellentéte a megismerésnek, amely éppen abból indul ki, hogy nem fogadja el a világot olyannak, amilyennek látszik.”

Legfőbb ideje tehát, hogy a verbális készségek fejlesztése mellett a vizuális írástudás is méltó helyet kapjon az alap- és középfokú oktatásban. Nem várhatjuk el a következő generációktól, hogy hatékonyan védekezzenek a dezinformációs kampányok ellen, ha közben nem tanítjuk meg nekik a képek értő olvasását. A holnap diákjainak már fel kellene ismerniük, hogy az Instagramon rájuk ömlő felvételek nem nyers tények, hanem olyan kifejezőeszközök, amelyek éppúgy alkalmasak az igazmondásra, mint a megtévesztésre – pontosan úgy, ahogy a beszélt nyelv is.

Érdemes itt egy pillanatra kinyitni egy zárójelet: bár ez az írás leginkább a fotók és AI-képek szűk szeletét vizsgálja, a valódi vizuális írástudáshoz a videók, térképek és a hírekből ránk zúduló grafikonok és infografikák kritikus értelmezése is szervesen hozzátartozik. Egy megfelelően torzított tengelyű vagy grafikailag félrevezetően hangsúlyozott statisztikai ábra is hatékony fegyvere lehet a dezinformációnak. A vizuális írástudás alapkompetencia, nem „száműzhető” csupán a rajzórára.

Bár a végeláthatatlan görgetés közben elénk kerülő AI-képek sokszor a szem giccses, szorongásoldó „rágógumijai”, egyúttal fontos görbe tükröt is tartanak elénk. Arra sarkallnak, hogy ne tekintsük a fényképeket objektív igazságnak, csupán szubjektív interpretációnak. Amennyiben képesek vagyunk megugrani ezt a gondolati szintet,

a mesterséges intelligencia nem a valóság alkonyát, hanem egy tudatosabb és kritikusabb korszak hajnalát hozhatja el.

Ugyanakkor látnunk kell, hogy a kritikus gondolkodás önmagában nem csodaszer. Jogosan tartunk attól, hogy a fake news és a deepfake technológiák terjedése olyan mély szkepticizmusba taszít minket, ahol már a hiteles információkban is kételkedni kezdünk – ezt a jelenséget Ariana Modirrousta-Galian és Philip A. Higham 2023-as kutatása is alátámasztotta. Ez a fajta totális bizalomvesztés pedig éppen a célzott dezinformációs kampányok malmára hajtja a vizet.

Mindez azonban csak még sürgetőbbé teszi a vizuális műveltség elsajátítását. Hiszen ha még a kétszáz éves technikák alapvető összefüggései sem világosak mindenki számára – miközben naponta képek és videók százait fogyasztjuk –, akkor hiányzik az a közös nyelv és platform, amelyen ezeket a társadalmi problémákat érdemben megvitathatnánk. Amíg az oktatás hiányosságai miatt a trompe-l’œil és a pareidolia magyarázatra szoruló szakkifejezések maradnak – szemben mondjuk az általánosan ismert abszolutizmus történelmi vagy a fotoszintézis biológiai alapfogalmával –, addig a helyzet érdemi végiggondolására és kitárgyalására sincs esélyünk.

Ugyan a gyerekmedence ideje lejárt, de ha már a mély vízbe dobtak minket, ne csak kapálózzunk: tanuljunk meg profin úszni – akár a sodrással szemben is!

Nyitókép: John Baeder: John’s Diner with John’s Chevelle, olajfestmény vásznon, 76×122 cm (forrás: Wikipedia)

Ezt az írást nem közölhettük volna olvasóink nélkül. Legyen támogatónk a Donably-n, a biztonságos, magyar fejlesztésű előfizetési platformon. Paypal, utalás és más lehetőségek itt >>>