10 Esettanulmány: Az MDP hatásköri lista prozopográfiai elemzése (1955)

Ez az esettanulmány az MDP (Magyar Dolgozók Pártja) 1955-ös hatásköri listáját elemzi prozopográfiai módszerrel. A korpusz 1870 főt tartalmaz, 10 változóval személyenként. A fejezet az adatbázis-építés és a kereszttábla-elemzés gyakorlati lépéseit mutatja be — az előző fejezet (9) módszertani keretét egy konkrét forráson alkalmazva.

10.1 A forrás és a kutatási kérdés

A hatásköri lista az MDP apparátusának 1870 neves adatbázisa: minden személy neve, pozíciója, születési éve, párttagsági adatai, pártiskolai végzettsége és eredeti foglalkozása rögzített. Az adatbázis 492 archív életrajzi fotót is tartalmaz — kézzel írt vagy gépelt életrajzi lapokat, amelyek gazdagabb, nem strukturált információt hordoznak (apa foglalkozása, iskolai végzettség, származás).

A központi kutatási kérdés: Milyen társadalmi mobilitási csatornákat nyitott meg a párt a káderei számára?

10.1.1 A korpusz számokban

Jellemző Érték
Személyek száma 1 870
Ebből nő 202 (10,8%)
Változók személyenként 10
Archív életrajz (fotó) 492 db

Az Excel-alapadatban rögzített változók: név, pozíció, születési év, MKP-tagság éve, SZDP-tagság éve, pártiskola, eredeti foglalkozás, mióta viseli a pozíciót, forrás, egyéb megjegyzés.

10.2 Az adatforrások rendszere

A prozopográfiai elemzés itt három rétegű forrásrendszerre épül:

Strukturált adattábla (Excel): A hatásköri lista 1870 neves adatbázisa, 10 változóval. Előnye, hogy azonnal elemezhető — hátránya, hogy számos változó hiányos.

Archív életrajzi lapok: 492 db kézzel írt/gépelt életrajzi fotó, amelyek gazdag, de nem strukturált információt tartalmaznak. Hagyományos OCR nehezen kezeli őket; multimodális AI-olvasás és manuális feldolgozás szükséges. 35 személy került teljes feldolgozásra mintaként.

Másodlagos szakirodalom: Korábban publikált elemzések a témáról, amelyek validálásra és kiegészítésre használhatók.

Gyakorlati tanács: Mindig keressünk több forrástípust! A strukturált és nem strukturált adatok együtt adják a teljes képet. Ez az elv az előző fejezetben tárgyalt ElitData projektnél is érvényesült.

10.3 Adattisztítás és standardizálás

A legidőigényesebb, de legfontosabb fázis. A tipikus problémák és megoldások:

Probléma Megoldás
Hiányzó adatok (n.a., üres cellák) Hiányzó adatok jelölése: külön kategória („Ismeretlen”)
Nem egységes írásmód („munkásnő” vs. „munkás”) Egységesítő tábla (lookup): pl. „vasésztergályos” → Ipari szak.
Születési év formátumok (1920 vs. „1920.”) Numerikus konverzió: születési év → int
Több pozíció egy cellában Átírások, rövidítések feloldása

A duplikáció-szűrés név + születési év alapján történik. Validálási scriptek futtatása automatikus ellenőrzést biztosít.

10.4 Változók és kategorizálás

A prozopográfiai elemzés építőkövei a jól definiált kategóriák. Az alábbi tábla a fő változókat mutatja:

Változó Típus Kategóriák
Társadalmi réteg Kategorikus (8) Ipari szakmunkás, Értelmiségi, Segéd-/betanított munkás, Tisztviselő, Mezőgazdasági, Szabadfoglalkozású, Kereskedő, Ismeretlen
Pozíció hierarchia Ordinális (5) Felső vezetés, Középvezetés, Alsó-középvezetés, Politikai munkatárs, Egyéb
Pártiskola szint Ordinális (0–7) 0=nincs → 7=Szovjetunióban végzett
Párttagság időszaka Ordinális (4) Illegális korszak, 1945, Koalíciós időszak, 1949 után
Korcsoport Kategorikus 22–24, 25–29, 30–34, 35–39, 40–44, 45–49, 50+
Származás Kategorikus Munkás, Paraszt, Értelmiségi, Kispolgár, Ismeretlen

Fontos: a kategorizálást előre rögzítsük és dokumentáljuk, mielőtt az elemzésbe kezdünk! Utólagos kategória-módosítás az összes korábbi eredményt érvénytelenítheti.

10.5 Adatgazdagítás archív forrásokból

Az archív életrajzi lapok feldolgozása a strukturált adatbázist olyan változókkal egészíti ki, amelyek az Excel-alapadatból hiányoznak:

  • Iskolai végzettség (formális iskolázottság)
  • Apa foglalkozása → társadalmi réteg
  • Származás megjelölése
  • Eredeti foglalkozás (pártba lépés előtt)

A 492 fotó olvasása (gépelt/kézírt magyar szöveg) hagyományos OCR-rel nem működik megbízhatóan. Az esettanulmány multimodális LLM-alapú olvasást alkalmaz, kézi ellenőrzéssel.

Kihívások:

  • Nem minden fotó olvasható (elforgatott, halvány) → el kell fogadni a hiányosságot
  • Az AI-kiolvasás ellenőrzése elengedhetetlen (pl. születési év tévedések)
  • A „neves” fotók felülreprezentálják a felső vezetést → mintareprezentativitási torzítás

10.6 Kereszttábla-elemzés

A prozopográfiai elemzés fő módszere a kereszttábla: két kategorikus változó összevetése táblázatban, sor- és oszlopszázalékok számításával.

10.6.1 Példa: Foglalkozás × Pozíció (nők, 25–34 év)

Középvez. Pol. mtárs Titkár
Munkás 50% 76,6% 41,6%
Értelmiségi 27,8% 6,7% 25%
Alkalmazott 20,4% 3,3% 33,3%

A munkás származásúak felülreprezentáltak a politikai munkatársi pozíciókban — ez jelzi a párt tudatos rekrutációs stratégiáját.

További vizsgálható kereszttáblák:

  • Eredeti foglalkozás × Elért pozíció szint
  • Pártiskola végzettség × Pozíció szint
  • Korcsoport × Pozíció típusa

Eszközök: pandas (Python) crosstab, pivot_table | Excel pivot tábla | SPSS / R

10.7 Eredmények: mobilitási minták

10.7.1 A női káderek pozíció szerinti megoszlása (N=202)

Pozíció Nők száma
Politikai munkatárs 84
Középvezető 54
Titkár 30
Alsó vezető 12
Felső vezető 11
Újságíró 10

10.7.2 Fő megállapítások

  1. A párt komoly mobilitási csatornát jelentett: munkás származásúak felsővezetővé válhattak.
  2. A pártiskola pótolja a formális iskolázottságot: a politikai munkatársak 72,6%-a végzett pártiskolát.
  3. A nők a középvezetésig jutottak: a legfelső vezető testületek (PB, Titkárság) nők nélkül működtek.
  4. A férj szerepe meghatározó: a női káderek 35%-ának a férje is pártkarriert futott.
  5. Intergenerációs mobilitás: a párt tette lehetővé a szegényparaszti → vezető testületi pályaívet.

10.8 Karrierútak: életrajzi példák

Az adatok mögötti emberi történetek:

Nagy Józsefné Szarka Jolán: 6 elemi → szövőnő → pártfőiskolát végzett → Országos Tervhivatal → könnyűipari miniszter (1955). Szegényparaszti származás.

Varga Ferencné: 6 elemi, cipőgyári munkásnő → 1949 megyei PB munkatárs → járási PB titkár → Agrártudományi Egyetem hallgató. Munkásszármazás.

Lakatos Éva: 4 polgári, vasésztergályos → 1944 illegális mozgalom, deportálás → Szikra szerkesztő → Szabad Ifjúság felelős szerkesztő → pártfőiskola → Szabad Nép rovatvezető.

Jóboru Magda: Egyetem, tanár, munkás szülők → 1945 MKP → 1947 pártiskola → 1949 VKM politikai államtitkár → miniszterhelyettes → oktatási miniszter első helyettese.

10.9 Validálás

10.9.1 Belső validálás

  • Fotó-minta vs. Excel adat kereszthivatkozás (24/35 egyezés)
  • Automatizált név-egyeztetés (pontos + részleges)
  • Születési év, pozíció konzisztencia-ellenőrzés

10.9.2 Külső validálás

  • Összevetés publikált kutatási eredményekkel
  • Fotó minta (n=16 nő) vs. teljes állomány (N=202) összehasonlítása
  • A minta torzításainak dokumentálása

A három rétegű validálás elve: Excel + fotó + publikáció = három forrásból származó ellenőrzés. A diszkrepanciák is informatívak — azt mutatják, hol és miért térnek el a források.

10.10 Módszertani kihívások

Adatminőségi kihívások:

  • Hiányzó adatok: nem minden változó ismert minden személyre (pl. iskolai végzettség csak 27/202 nőre)
  • Egyenetlen forrás-kimerítősség: a neves szereplőkről több adat áll rendelkezésre
  • Történeti terminológia: a korabeli kategóriákat mai fogalmakra kell fordítani
  • Név-változatok: házasságkötés utáni névváltoztatások, becenevek

Értelmezési kihívások:

  • Minta-reprezentativitás: a fotó-minta nem tükrözi a teljes populációt
  • Kauzalitás vs. korreláció: a pártiskola okozza-e a mobilitást, vagy a mobilizálódóban lévők kerülnek be?
  • Selection bias: a listán szereplés maga már a szelekciós folyamat eredménye
  • A „mobilitási csatorna” mérésének nehézsége: többdimenziós mozgás

10.11 Az MDP-elemzés és az ElitData összehasonlítása

A két esettanulmány különböző korszakokat és társadalmi csoportokat vizsgál, de a prozopográfiai módszer alapstruktúrája azonos:

Szempont ElitData (Horthy-kor) MDP hatásköri lista (1955)
Csoport Tudáselit: tudósok, írók, tanárok Pártkáderek: funkcionáriusok, vezetők
Forrás Lexikonok, névsorok, anyakönyvek Hatásköri lista, archív életrajzok
Méret ~3 900 személy 1 870 személy
Adatmodell Relációs (PostgreSQL) Egyszerű táblázatos (Excel)
Elemzés Hálózat, térkép, statisztika Kereszttábla, vizualizáció
Frontend Egyetlen HTML, D3.js Excel + interaktív HTML riport

Mindkét projekt jól mutatja, hogy a prozopográfia módszertani kerete skálázható: egyszerű Excel-alapú elemzéstől a teljes relációs adatbázisig alkalmazható, a kutatási kérdés és az erőforrások függvényében.