Történeti adatbázis

Alapadatok
Attribútumok — nyers érték (forrásból) + harmonizált forma
💡 Nyers érték: pontosan ahogy a forrásban szerepel.
Harmonizált érték: egységesített, összehasonlítható forma. A Harmonizálás fülön tömeges átnevezés is lehetséges.
💡 Harmonizálás: A különböző forrásokban eltérően leírt, de azonos fogalmat jelölő értékeket itt lehet egységesíteni. Pl. „ÜGYVÉD", „ügyvéd dr.", „Ügyvéd (Bp.)" → mind a Ügyvéd harmonizált értéket kapják.
Kapcsolat hozzáadása
Kapcsolatok
1. Mi ez az eszköz?

A Történeti adatbázis egy böngészőben futó eszköz, amellyel különféle történeti forrásokból strukturált adatbázist lehet felépíteni, az adatokat harmonizálni (egységesíteni), és vizuálisan elemezni (hálózat, statisztikák, idősor, térkép).

👤 Prozopográfia — személyek életrajzi adatai, kapcsolatrendszere
Levelezés — levelek, iratok metaadatai (ki kinek, mikor, miről)
🏛 Intézménytörténet — szervezetek, tagságok, jogutódlás
📜 Egyházi anyakönyv — keresztelési, házassági, halálozási bejegyzések
Az adatok a böngészőben tárolódnak (localStorage) – nem kerülnek szerverre, internetkapcsolat nem szükséges. A JSON-exporttal mentsd el rendszeresen a munkádat!
2. Sémaválasztás

Az első indításkor a Sémaválasztó jelenik meg a főoldalon. Kattints a kívánt sémakártyára. Ez határozza meg, milyen mezők lesznek elérhetők az adatbevitelnél. Bármikor megváltoztatható a ⚙ Beállításokban — a már bevitt adatokat nem törli.

Ha nem vagy biztos a választásban, a Kihagyás gombbal üres adatbázist indíthatsz, és később beállíthatod a sémát.
3. Adatbevitel egyenként

Az ✏ Adatbevitel → Egyéni bevitel lapon adhatsz hozzá rekordokat.

Alapadatok

A séma által meghatározott mezők (a csillaggal jelölt mező kötelező). Szerkesztéshez: a Rekordok főoldalon kattints a kártyára → ✏ Szerkesztés.

Attribútumok
  • Típus — pl. Foglalkozás, Vallás, Lakóhely (Beállításokban bővíthető)
  • Nyers érték — pontosan ahogy a forrásban szerepel, pl. „ÜGYVÉD dr."
  • Harmonizált érték — egységesített forma, pl. „Ügyvéd"
  • Időpont — ha az adat időhöz kötött, pl. „1885–1910"
A nyers értéket mindig őrizd meg! A harmonizált értékre épülnek a vizualizációk, de a kutatás hitelességéhez az eredeti szöveg is szükséges.
4. Tömeges importálás CSV-ből

✏ Adatbevitel → CSV-import — ha már van táblázatban tárolt adatod.

  • Mentsd el az adatokat .csv formátumban, az első sornak fejlécnek kell lennie.
  • Karakter kódolás: UTF-8 vagy UTF-8 BOM (Excelből: Fájl → Mentés másként → CSV UTF-8 BOM-tal).
  • Minden oszlophoz megadhatod, melyik mezőnek feleljen meg: séma-mező, attribútum (nyers / harmonizált), vagy → Új attribútum típusként… (menet közben is létrehozhatsz új típust).
  • Az eszköz automatikusan próbálja felismerni az oszlopokat nevük alapján.
  • A Duplikátum-szűrés opció kihagyja a már meglévő nevű rekordokat.
5. Harmonizálás

A ⚖ Harmonizálás fülön az eltérő forrásszövegeket egységesíted egy közös formára.

Példa: „ÜGYVÉD", „ügyvéd dr.", „jogi praxis" → mind „Ügyvéd" harmonizált érték.

  • Válaszd ki az attribútum típust (pl. Foglalkozás).
  • A táblázatban látod az összes egyedi nyers értéket és előfordulási számukat.
  • Több sor kijelölhető egyszerre → Alkalmazás kijelöltekre gomb.
  • Az Önkitöltés gomb az üres harmonizált mezőkbe másolja a nyers értéket (gyors előkészítéshez).
A Harmonizálás fülön végzett módosítások csak a 💾 Mentés gombbal rögzülnek!
6. Kapcsolatok rögzítése

A 🔗 Kapcsolatok fülön rögzítheted a rekordok közötti viszonyokat.

  • Válaszd ki az 1. rekordot, a kapcsolat típusát és a 2. rekordot.
  • Az → Új kapcsolattípusként… opcióval menet közben is felvehetsz új típust.
  • Opcionálisan adj meg forrást (pl. melyik dokumentumból tudod a kapcsolatot).
  • A lista szűrhető a felső szövegmezővel.
Ha egy rekordot törölsz, az összes hozzá tartozó kapcsolat is törlődik.
7. Vizualizációk
🕸 Hálózat

Erő-gráf: csomópontok = rekordok, élek = kapcsolatok. A csomópontok húzhatók, a grafikon görgetéssel nagyítható, kattintásra megnyílik a rekord profilja. A Csomópont-szín legördülővel szín szerint ábrázolhatsz egy mezőt vagy attribútumot.

📊 Statisztikák

Sávdiagramok a séma lista-típusú mezőinek megoszlásáról, az attribútumok értékgyakoriságáról és a dátummező évtizedes eloszlásáról.

⏱ Idősor

Vízszintes sávdiagram az 1. és 2. dátummező alapján (pl. születési–halálozási év). A sávok kattinthatók. Ha csak 1 dátummező van, egypontos jelölőként jelenik meg.

🗺 Térkép

Interaktív Leaflet-térkép. Elfogadott formátumok: városnév (pl. Budapest, Kolozsvár, kb. 80 beépített hely) vagy koordináta (47.49, 19.04). Az ismeretlen helyneveket a térkép alatt listázza.

A Szín legördülő minden vizualizációnál listázza mind a séma-mezőket, mind az attribútum-típusokat.
8. Adatok mentése és betöltése
A böngésző cache törlésével az adatok elveszhetnek — rendszeresen exportálj!
  • ↓ Mentés — letölti a teljes adatbázist JSON fájlba (rekordok, attribútumok, kapcsolatok, beállítások).
  • ↑ Betöltés — JSON, CSV, TSV vagy Excel (.xlsx, .xls) fájl betöltése. JSON esetén a teljes adatbázis felülíródik (előtte mentés ajánlott). CSV/TSV/Excel esetén a program automatikusan az Adatbevitel → CSV-import 2. lépésére ugrik (oszlop-megfeleltetés); ekkor a meglévő adatok nem vesznek el, az új rekordok hozzáadódnak. Excel-fájl esetén a legtöbb adatot tartalmazó munkalap kerül beolvasásra.
A JSON fájl ember által olvasható szöveges formátum — szövegszerkesztővel megnézhető, de módosítani óvatosan szabad.
9. Zárolás és publikálás

Az adatbázist olvasható módra zárolhatod, vagy végleg publikálhatod – ez utóbbi visszavonhatatlan.

🔒 Zárolás (ideiglenes)

A fejlécen a 🔒 Zárolás gombra kattintva az adatbázis szerkesztési módja letiltódik:

  • A rekordok, attribútumok és kapcsolatok nézhetők, kereshetők, de nem módosíthatók.
  • A szerkesztési fülek (Adatbevitel, Harmonizálás, Kapcsolatok) nem érhetők el.
  • A 🔓 Szerkesztés gombbal bármikor feloldható (Beállítások gombbal is).
  • Az adatbázis továbbra is szerkesztésmódban tárolódik.
📢 Publikálás (végleges)

A 📢 Publikálás gomb megnyitja a publikálási párbeszédot:

  • Megadhatod a készítő nevét és intézményi affiliációját (pl. ELTE BTK).
  • A publikálás véglegesen lezárja az adatbázist – később nem szerkeszthető, nem oldhető fel.
  • A főoldalon megjelenik az „Publikált adatbázis" banner a készítő adataival és a publikálás dátumával.
  • Ha szerkeszteni szeretnél, a JSON-exporttal hozz létre egy új másolatot (importálás útján).
Használd a zárolást ideiglenes olvasható mód bevezetésére (csoportmunka, prezentáció), és a publikálást csak akkor, ha végleg kész az adatbázis.
10. Access adatbázisból importálás

Ha az adataid Microsoft Access (.mdb / .accdb) formátumban vannak, az access_to_csv.py Python szkripttel exportálhatod CSV-be.

Legegyszerűbb mód (Accessből közvetlenül)

Nyisd meg a táblát Accessben → Külső adatok → Exportálás → Szöveges fájl → CSV UTF-8.

Python szkripttel (automatikus)
pip install pyodbc # Minden tábla exportálása python access_to_csv.py adatbazis.accdb # Csak egy tábla python access_to_csv.py adatbazis.accdb --tabla Szemelyek # Linux/Mac: mdbtools szükséges sudo apt install mdbtools # Ubuntu brew install mdbtools # macOS
11. Beállítások

A fejléc ⚙ Beállítások gombjára kattintva érhető el.

  • Sablon — gyorsan válthatsz a beépített sémák között (a már bevitt adatokat nem törli).
  • Projekt neve — a fejlécben megjelenő cím.
  • Rekord típus és mezők — mezők átnevezése, törlése, új mező hozzáadása (szöveg / szám / lista / hosszú szöveg típusban). A speciális mezőknél jelölhető meg a cím-mező, az 1–2. dátummező (idősorhoz) és a helyszín mező (térképhez).
  • Attribútum típusok — szabadon bővíthető lista (pl. Foglalkozás, Vallás, Lakóhely).
  • Kapcsolat típusok — a rekordok közötti kapcsolatok elnevezései.
12. GYIK
Elvesztek az adataim.

A böngésző cache törlése törli az adatokat. Mindig exportálj JSON fájlba a ↓ Mentés gombbal, különösen hosszabb munka után.

Egy helynév nem jelenik meg a térképen.

Nézd meg a térkép alatti „Nem azonosított helyek" listát. Próbálj koordinátát beírni (pl. 47.49, 19.04). A geocoder kb. 80 Kárpát-medencei és európai helyet ismer.

Egyszerre több rekordhoz szeretnék harmonizált értéket adni.

A Harmonizálás fülön jelöld be a sorokat → írd be az egységesített értéket → Alkalmazás kijelöltekre.

A hálózaton minden csomópont azonos színű.

A „Csomópont-szín alapja" legördülőben válassz egy mezőt vagy attribútum-típust — de csak akkor működik, ha a rekordoknál van ilyen adat.

Hogyan törlök egy rekordot?

Kattints a rekord kártyájára → ✏ SzerkesztésTörlés. A törlés visszavonhatatlan.

Melyik böngészőben működik?

Bármely modern böngészőben (Chrome, Firefox, Edge, Safari). Az adatok böngészőnként külön tárolódnak — váltásnál JSON-exportot használj.

Ugyanahhoz a rekordhoz több azonos típusú attribútum felvehető?

Igen — pl. Lakóhely: „Pest" (1840) és Lakóhely: „Bécs" (1848) egymás mellett élnek, különböző időponttal.

Mekkora adatbázist kezel kényelmesen?

500–2000 rekord gond nélkül. 5000 felett a hálózatvizualizáció lassulhat; a térkép és a statisztikák jól skálázódnak. A localStorage határ kb. 5 MB.