Adat a történettudományban
1
Előszó
2
Adat a történettudományban
2.1
Bevezetés
2.1.1
Digitális forrásgyűjtemények Magyarországon
2.2
Forrás és adat: alapvető megkülönböztetés
2.2.1
Fogalmi különbségtétel
2.2.2
Capta, nem data
2.2.3
Példa: Népszámlálás mint konstruált adat
2.3
Mi a digitális bölcsészet?
2.3.1
Eszköztár vagy új tudományág?
2.3.2
Az alapító projektek és módszereik
2.3.3
A modellezés mint központi paradigma
2.4
A digitális bölcsészeti munkafolyamat
2.4.1
A digitális projekt három komponense
2.4.2
Az adat-életciklus öt fázisa
2.4.3
Technológia és értékek
2.5
Három adat-típus a történészi kutatásban
2.5.1
Forrásban lévő adat
2.5.2
Adatbázisba rendezhető adat
2.5.3
Szöveg mint adat
2.6
AI használata a történeti kutatásban
2.6.1
Mi az AI és mi nem
2.6.2
Mikor hasznos az AI a történésznek?
2.6.3
AI etikai alapelvek
3
Bibliográfiai adat és hivatkozáskezelés
3.1
Bevezetés
3.2
Témák
3.3
További olvasnivaló
4
Történeti források kiadása a digitális világban – lehetőségek és gyakorlat
4.1
Bevezetés
4.2
Miért ne tekintsünk forráskiadásnak egy levéltári adatbázist?
4.3
Történeti források internetes közzététele
4.4
Digitális forráskiadás – szabványok és alkalmazások: a Text Encoding Initiative szabvány
4.5
Az optikai karakterfelismerés
4.6
Hazai gyakorlatok
4.7
Összegzés
4.8
Irodalomjegyzék
4.9
Demonstrációs eszköz: TEI Annotáló
5
A TEI–RiC annotáló eszköz: gyakorlati útmutató
5.1
Miért szükséges egy egyszerűsített annotáló eszköz?
5.2
Az eszköz felépítése és funkciói
5.2.1
Alapvető munkafolyamat
5.2.2
Annotációs kategóriák
5.2.3
Az annotáció exportálása
5.3
A kitöltött annotáló: gyakorlati bemutató
5.3.1
A dokumentumkezelő nézet
5.3.2
Az annotálás nézet
5.4
Hogyan használd az annotálót? – Lépésről lépésre
5.4.1
1. Dokumentum létrehozása
5.4.2
2. Annotálás
5.4.3
3. Hálózati nézet és elemzés
5.4.4
4. Exportálás és mentés
5.5
A publikációs változat: a forráskiadvány
5.6
Összefoglalás
6
Forrásban lévő adat I - Történeti statisztikák
6.1
Bevezetés
6.2
Témák
6.3
További olvasnivaló
7
Forrásban lévő adat II - Vizualizáció
7.1
Bevezetés
7.2
Témák
7.3
További olvasnivaló
8
Esettanulmány: Egyházmegyei ösztöndíjasok kollektív életrajzi elemzése (1957–1975)
8.1
Mi a prozopográfia?
8.2
A forrás és az adatmodell
8.2.1
A korpusz felépítése
8.2.2
A prozopográfiai adatmodell tervezése
8.2.3
Kulcsváltozók és operacionalizálásuk
8.3
Társadalmi háttér: honnan jöttek?
8.4
Egyházmegyei stratégiák: ki mennyit költ és kire?
8.4.1
A finanszírozás megosztása: egyházmegye vs. szülő
8.5
Értékelés és szelekció: mit keres a prefektus?
8.5.1
A kódolási séma
8.6
Időbeli dinamika: hogyan változott a rendszer?
9
Prozopográfiai adatbázis építése — lépésről lépésre
9.1
Mikor érdemes adatbázist építeni?
9.2
A kutatási keret meghatározása
9.3
Adatmodell tervezése
9.4
Adatgyűjtés és forráskezelés
9.5
Adatbevitel és kódolás
9.6
Adattisztítás és harmonizálás
9.7
Technikai megvalósítás
9.7.1
Backend — adatbázis-kezelő rendszer
9.7.2
Frontend — vizualizáció és lekérdező felület
9.8
Az ElitData böngésző felülete
9.8.1
Keresés és személyprofil
9.8.2
Statisztikák
9.8.3
Hálózat
9.8.4
Térkép
9.8.5
A nézetek kutatási alkalmazása
9.9
Elemzési lehetőségek
9.10
Kihívások és tanulságok
9.11
Etikai és jogi szempontok
9.12
A folyamat összefoglalása
10
Esettanulmány: Az MDP hatásköri lista prozopográfiai elemzése (1955)
10.1
A forrás és a kutatási kérdés
10.1.1
A korpusz számokban
10.2
Az adatforrások rendszere
10.3
Adattisztítás és standardizálás
10.4
Változók és kategorizálás
10.5
Adatgazdagítás archív forrásokból
10.6
Kereszttábla-elemzés
10.6.1
Példa: Foglalkozás × Pozíció (nők, 25–34 év)
10.7
Eredmények: mobilitási minták
10.7.1
A női káderek pozíció szerinti megoszlása (N=202)
10.7.2
Fő megállapítások
10.8
Karrierútak: életrajzi példák
10.9
Validálás
10.9.1
Belső validálás
10.9.2
Külső validálás
10.10
Módszertani kihívások
10.11
Az MDP-elemzés és az ElitData összehasonlítása
11
Saját prozopográfiai eszköz — egyetlen böngészőablakban
11.1
Miért egy kisebb, saját eszköz?
11.2
Az eszköz paraméterei
11.3
Adatmodell: könnyű séma + EAV
11.4
Kutatási munkafolyamat az eszközzel
11.5
Az eszköz letöltése és a demonstrációs adatsor
11.6
Demonstráció: az MTA első nemzedéke
11.6.1
Adatimport és autoMap
11.6.2
Harmonizálás: a vallás attribútum
11.6.3
Kapcsolatok: forráskritika
11.6.4
Vizualizáció
11.7
Mikor az egyetlen HTML-fájl a jó válasz, és mikor nem?
11.8
Korlátok és kockázatok
11.9
Kutatási reflexió és önálló feladatok
11.10
Összefoglaló
11.10.1
Letölthető anyagok
12
Adatbázisba rendezhető adat II - Adattisztítás
12.1
Bevezetés
12.2
Témák
12.3
További olvasnivaló
13
Esettanulmány: Szövegbányászat és diskurzuselemzés kombinálása levéltári korpuszon
13.1
A vizsgált eset és a kutatási kérdés
13.2
Korpusz és adatgyűjtés
13.3
Módszertani keret: szöveg mint adat + diskurzuselemzés
13.3.1
A kódolási séma
13.4
Kódolástól a hipotézisig: az elemzési lánc
13.4.1
Az aggregálás logikája
13.5
Eredmények és értelmezés
13.5.1
Időbeli dinamika
13.5.2
Aktorprofilok
13.5.3
A Pozsgay-fordulat: kvalitatív validálás
13.6
Módszertani reflexió
13.6.1
A hipotézis értékelése
14
Adatvizualizáció — Flourish, Datawrapper és interpretáció
14.1
Miért kell két eszközt is megtanulni?
14.2
Flourish vs. Datawrapper — döntési mátrix
14.3
Az ábraválasztás logikája
14.3.1
A kérdés típusa → ábratípus táblázat
14.3.2
Mit kerüljünk
14.3.3
Heurisztika: 30 másodperces teszt
14.4
Datawrapper: teljes munkamenet az MTA-adaton
14.4.1
0. lépés: regisztráció és adat-előkészítés
14.4.2
1. lépés: New chart → Upload data
14.4.3
2. lépés: Check & describe
14.4.4
3. lépés: Visualize — ábratípus választása
14.4.5
4. lépés: Refine (finomítás)
14.4.6
5. lépés: Annotate (címkézés)
14.4.7
6. lépés: Layout / Design
14.4.8
7. lépés: Publish & embed
14.5
Flourish: teljes munkamenet az MTA-adaton
14.5.1
0. lépés: regisztráció és adat-előkészítés
14.5.2
1. lépés: New visualization → sablon-választás
14.5.3
2. lépés: Data lap — CSV-betöltés
14.5.4
3. lépés: Column bindings — oszlop → szerep leképezés
14.5.5
4. lépés: Preview és finomítás
14.5.6
5. lépés: Header és footer (Annotate)
14.5.7
6. lépés: Publish → share
14.5.8
7. lépés: amikor több figurát egyesítünk — Story
14.6
Vizualizáció-etika és kritika
14.7
Kutatási munkafolyamat két lépésben
14.8
Összehasonlítás a korábbi fejezetekkel
14.9
További olvasnivaló
15
Adatok publikálása, dokumentáció, etika
15.1
Miért publikálni egyáltalán?
15.2
FAIR — a nyílt adatpublikálás négy alapelve
15.3
Hol publikáljunk? — repozitóriumok
15.3.1
Munkamenet Zenodón: egy tipikus publikálás
15.4
README mint műfaj — a dokumentáció standardja
15.4.1
Egy jól felépített README
15.4.2
Gyakori hibák a README-ben
15.5
Metaadatok és szabványok
15.6
Licencek — ki mit tehet az adatommal?
15.7
Adatvédelem és GDPR a történeti kutatásban
15.7.1
Elhunyt személyek
15.7.2
Élő személyek
15.7.3
Különleges (szenzitív) kategóriák
15.8
Kutatói etika történeti adatokon
15.9
Hosszú távú megőrzés és archiválás
15.10
Összefoglalás: egy prozopográfiai projekt publikálási kontrollistája
15.11
További olvasnivaló
6
Forrásban lévő adat I - Történeti statisztikák
“A szám soha nem semleges.”
6.1
Bevezetés
[Ez a fejezet még készülőben van]
6.2
Témák
Történeti statisztikák mint forrás-adat
Ki gyűjtötte, miért, hogyan?
Forráskritika számokra
Adat mint történeti konstrukció
6.3
További olvasnivaló
[Később kiegészítve]