10 Esettanulmány: Az MDP hatásköri lista prozopográfiai elemzése (1955)
Ez az esettanulmány az MDP (Magyar Dolgozók Pártja) 1955-ös hatásköri listáját elemzi prozopográfiai módszerrel. A korpusz 1870 főt tartalmaz, 10 változóval személyenként. A fejezet az adatbázis-építés és a kereszttábla-elemzés gyakorlati lépéseit mutatja be — az előző fejezet (9) módszertani keretét egy konkrét forráson alkalmazva.
10.1 A forrás és a kutatási kérdés
A hatásköri lista az MDP apparátusának 1870 neves adatbázisa: minden személy neve, pozíciója, születési éve, párttagsági adatai, pártiskolai végzettsége és eredeti foglalkozása rögzített. Az adatbázis 492 archív életrajzi fotót is tartalmaz — kézzel írt vagy gépelt életrajzi lapokat, amelyek gazdagabb, nem strukturált információt hordoznak (apa foglalkozása, iskolai végzettség, származás).
A központi kutatási kérdés: Milyen társadalmi mobilitási csatornákat nyitott meg a párt a káderei számára?
10.1.1 A korpusz számokban
| Jellemző | Érték |
|---|---|
| Személyek száma | 1 870 |
| Ebből nő | 202 (10,8%) |
| Változók személyenként | 10 |
| Archív életrajz (fotó) | 492 db |
Az Excel-alapadatban rögzített változók: név, pozíció, születési év, MKP-tagság éve, SZDP-tagság éve, pártiskola, eredeti foglalkozás, mióta viseli a pozíciót, forrás, egyéb megjegyzés.
10.2 Az adatforrások rendszere
A prozopográfiai elemzés itt három rétegű forrásrendszerre épül:
Strukturált adattábla (Excel): A hatásköri lista 1870 neves adatbázisa, 10 változóval. Előnye, hogy azonnal elemezhető — hátránya, hogy számos változó hiányos.
Archív életrajzi lapok: 492 db kézzel írt/gépelt életrajzi fotó, amelyek gazdag, de nem strukturált információt tartalmaznak. Hagyományos OCR nehezen kezeli őket; multimodális AI-olvasás és manuális feldolgozás szükséges. 35 személy került teljes feldolgozásra mintaként.
Másodlagos szakirodalom: Korábban publikált elemzések a témáról, amelyek validálásra és kiegészítésre használhatók.
Gyakorlati tanács: Mindig keressünk több forrástípust! A strukturált és nem strukturált adatok együtt adják a teljes képet. Ez az elv az előző fejezetben tárgyalt ElitData projektnél is érvényesült.
10.3 Adattisztítás és standardizálás
A legidőigényesebb, de legfontosabb fázis. A tipikus problémák és megoldások:
| Probléma | Megoldás |
|---|---|
| Hiányzó adatok (n.a., üres cellák) | Hiányzó adatok jelölése: külön kategória („Ismeretlen”) |
| Nem egységes írásmód („munkásnő” vs. „munkás”) | Egységesítő tábla (lookup): pl. „vasésztergályos” → Ipari szak. |
| Születési év formátumok (1920 vs. „1920.”) | Numerikus konverzió: születési év → int |
| Több pozíció egy cellában | Átírások, rövidítések feloldása |
A duplikáció-szűrés név + születési év alapján történik. Validálási scriptek futtatása automatikus ellenőrzést biztosít.
10.4 Változók és kategorizálás
A prozopográfiai elemzés építőkövei a jól definiált kategóriák. Az alábbi tábla a fő változókat mutatja:
| Változó | Típus | Kategóriák |
|---|---|---|
| Társadalmi réteg | Kategorikus (8) | Ipari szakmunkás, Értelmiségi, Segéd-/betanított munkás, Tisztviselő, Mezőgazdasági, Szabadfoglalkozású, Kereskedő, Ismeretlen |
| Pozíció hierarchia | Ordinális (5) | Felső vezetés, Középvezetés, Alsó-középvezetés, Politikai munkatárs, Egyéb |
| Pártiskola szint | Ordinális (0–7) | 0=nincs → 7=Szovjetunióban végzett |
| Párttagság időszaka | Ordinális (4) | Illegális korszak, 1945, Koalíciós időszak, 1949 után |
| Korcsoport | Kategorikus | 22–24, 25–29, 30–34, 35–39, 40–44, 45–49, 50+ |
| Származás | Kategorikus | Munkás, Paraszt, Értelmiségi, Kispolgár, Ismeretlen |
Fontos: a kategorizálást előre rögzítsük és dokumentáljuk, mielőtt az elemzésbe kezdünk! Utólagos kategória-módosítás az összes korábbi eredményt érvénytelenítheti.
10.5 Adatgazdagítás archív forrásokból
Az archív életrajzi lapok feldolgozása a strukturált adatbázist olyan változókkal egészíti ki, amelyek az Excel-alapadatból hiányoznak:
- Iskolai végzettség (formális iskolázottság)
- Apa foglalkozása → társadalmi réteg
- Származás megjelölése
- Eredeti foglalkozás (pártba lépés előtt)
A 492 fotó olvasása (gépelt/kézírt magyar szöveg) hagyományos OCR-rel nem működik megbízhatóan. Az esettanulmány multimodális LLM-alapú olvasást alkalmaz, kézi ellenőrzéssel.
Kihívások:
- Nem minden fotó olvasható (elforgatott, halvány) → el kell fogadni a hiányosságot
- Az AI-kiolvasás ellenőrzése elengedhetetlen (pl. születési év tévedések)
- A „neves” fotók felülreprezentálják a felső vezetést → mintareprezentativitási torzítás
10.6 Kereszttábla-elemzés
A prozopográfiai elemzés fő módszere a kereszttábla: két kategorikus változó összevetése táblázatban, sor- és oszlopszázalékok számításával.
10.6.1 Példa: Foglalkozás × Pozíció (nők, 25–34 év)
| Középvez. | Pol. mtárs | Titkár | |
|---|---|---|---|
| Munkás | 50% | 76,6% | 41,6% |
| Értelmiségi | 27,8% | 6,7% | 25% |
| Alkalmazott | 20,4% | 3,3% | 33,3% |
A munkás származásúak felülreprezentáltak a politikai munkatársi pozíciókban — ez jelzi a párt tudatos rekrutációs stratégiáját.
További vizsgálható kereszttáblák:
- Eredeti foglalkozás × Elért pozíció szint
- Pártiskola végzettség × Pozíció szint
- Korcsoport × Pozíció típusa
Eszközök: pandas (Python) crosstab, pivot_table | Excel pivot tábla | SPSS / R
10.7 Eredmények: mobilitási minták
10.7.1 A női káderek pozíció szerinti megoszlása (N=202)
| Pozíció | Nők száma |
|---|---|
| Politikai munkatárs | 84 |
| Középvezető | 54 |
| Titkár | 30 |
| Alsó vezető | 12 |
| Felső vezető | 11 |
| Újságíró | 10 |
10.7.2 Fő megállapítások
- A párt komoly mobilitási csatornát jelentett: munkás származásúak felsővezetővé válhattak.
- A pártiskola pótolja a formális iskolázottságot: a politikai munkatársak 72,6%-a végzett pártiskolát.
- A nők a középvezetésig jutottak: a legfelső vezető testületek (PB, Titkárság) nők nélkül működtek.
- A férj szerepe meghatározó: a női káderek 35%-ának a férje is pártkarriert futott.
- Intergenerációs mobilitás: a párt tette lehetővé a szegényparaszti → vezető testületi pályaívet.
10.8 Karrierútak: életrajzi példák
Az adatok mögötti emberi történetek:
Nagy Józsefné Szarka Jolán: 6 elemi → szövőnő → pártfőiskolát végzett → Országos Tervhivatal → könnyűipari miniszter (1955). Szegényparaszti származás.
Varga Ferencné: 6 elemi, cipőgyári munkásnő → 1949 megyei PB munkatárs → járási PB titkár → Agrártudományi Egyetem hallgató. Munkásszármazás.
Lakatos Éva: 4 polgári, vasésztergályos → 1944 illegális mozgalom, deportálás → Szikra szerkesztő → Szabad Ifjúság felelős szerkesztő → pártfőiskola → Szabad Nép rovatvezető.
Jóboru Magda: Egyetem, tanár, munkás szülők → 1945 MKP → 1947 pártiskola → 1949 VKM politikai államtitkár → miniszterhelyettes → oktatási miniszter első helyettese.
10.9 Validálás
10.9.1 Belső validálás
- Fotó-minta vs. Excel adat kereszthivatkozás (24/35 egyezés)
- Automatizált név-egyeztetés (pontos + részleges)
- Születési év, pozíció konzisztencia-ellenőrzés
10.9.2 Külső validálás
- Összevetés publikált kutatási eredményekkel
- Fotó minta (n=16 nő) vs. teljes állomány (N=202) összehasonlítása
- A minta torzításainak dokumentálása
A három rétegű validálás elve: Excel + fotó + publikáció = három forrásból származó ellenőrzés. A diszkrepanciák is informatívak — azt mutatják, hol és miért térnek el a források.
10.10 Módszertani kihívások
Adatminőségi kihívások:
- Hiányzó adatok: nem minden változó ismert minden személyre (pl. iskolai végzettség csak 27/202 nőre)
- Egyenetlen forrás-kimerítősség: a neves szereplőkről több adat áll rendelkezésre
- Történeti terminológia: a korabeli kategóriákat mai fogalmakra kell fordítani
- Név-változatok: házasságkötés utáni névváltoztatások, becenevek
Értelmezési kihívások:
- Minta-reprezentativitás: a fotó-minta nem tükrözi a teljes populációt
- Kauzalitás vs. korreláció: a pártiskola okozza-e a mobilitást, vagy a mobilizálódóban lévők kerülnek be?
- Selection bias: a listán szereplés maga már a szelekciós folyamat eredménye
- A „mobilitási csatorna” mérésének nehézsége: többdimenziós mozgás
10.11 Az MDP-elemzés és az ElitData összehasonlítása
A két esettanulmány különböző korszakokat és társadalmi csoportokat vizsgál, de a prozopográfiai módszer alapstruktúrája azonos:
| Szempont | ElitData (Horthy-kor) | MDP hatásköri lista (1955) |
|---|---|---|
| Csoport | Tudáselit: tudósok, írók, tanárok | Pártkáderek: funkcionáriusok, vezetők |
| Forrás | Lexikonok, névsorok, anyakönyvek | Hatásköri lista, archív életrajzok |
| Méret | ~3 900 személy | 1 870 személy |
| Adatmodell | Relációs (PostgreSQL) | Egyszerű táblázatos (Excel) |
| Elemzés | Hálózat, térkép, statisztika | Kereszttábla, vizualizáció |
| Frontend | Egyetlen HTML, D3.js | Excel + interaktív HTML riport |
Mindkét projekt jól mutatja, hogy a prozopográfia módszertani kerete skálázható: egyszerű Excel-alapú elemzéstől a teljes relációs adatbázisig alkalmazható, a kutatási kérdés és az erőforrások függvényében.