1. Mi ez az eszköz?
A Történeti adatbázis egy böngészőben futó eszköz, amellyel különféle történeti forrásokból strukturált adatbázist lehet felépíteni, az adatokat harmonizálni (egységesíteni), és vizuálisan elemezni (hálózat, statisztikák, idősor, térkép).
👤 Prozopográfia — személyek életrajzi adatai, kapcsolatrendszere
✉ Levelezés — levelek, iratok metaadatai (ki kinek, mikor, miről)
🏛 Intézménytörténet — szervezetek, tagságok, jogutódlás
📜 Egyházi anyakönyv — keresztelési, házassági, halálozási bejegyzések
Az adatok a böngészőben tárolódnak (localStorage) – nem kerülnek szerverre, internetkapcsolat nem szükséges. A JSON-exporttal mentsd el rendszeresen a munkádat!
2. Sémaválasztás
Az első indításkor a Sémaválasztó jelenik meg a főoldalon. Kattints a kívánt sémakártyára. Ez határozza meg, milyen mezők lesznek elérhetők az adatbevitelnél. Bármikor megváltoztatható a ⚙ Beállításokban — a már bevitt adatokat nem törli.
Ha nem vagy biztos a választásban, a Kihagyás gombbal üres adatbázist indíthatsz, és később beállíthatod a sémát.
3. Adatbevitel egyenként
Az ✏ Adatbevitel → Egyéni bevitel lapon adhatsz hozzá rekordokat.
Alapadatok
A séma által meghatározott mezők (a csillaggal jelölt mező kötelező). Szerkesztéshez: a Rekordok főoldalon kattints a kártyára → ✏ Szerkesztés.
Attribútumok
- Típus — pl. Foglalkozás, Vallás, Lakóhely (Beállításokban bővíthető)
- Nyers érték — pontosan ahogy a forrásban szerepel, pl. „ÜGYVÉD dr."
- Harmonizált érték — egységesített forma, pl. „Ügyvéd"
- Időpont — ha az adat időhöz kötött, pl. „1885–1910"
A nyers értéket mindig őrizd meg! A harmonizált értékre épülnek a vizualizációk, de a kutatás hitelességéhez az eredeti szöveg is szükséges.
4. Tömeges importálás CSV-ből
✏ Adatbevitel → CSV-import — ha már van táblázatban tárolt adatod.
- Mentsd el az adatokat
.csv formátumban, az első sornak fejlécnek kell lennie.
- Karakter kódolás: UTF-8 vagy UTF-8 BOM (Excelből: Fájl → Mentés másként → CSV UTF-8 BOM-tal).
- Minden oszlophoz megadhatod, melyik mezőnek feleljen meg: séma-mező, attribútum (nyers / harmonizált), vagy → Új attribútum típusként… (menet közben is létrehozhatsz új típust).
- Az eszköz automatikusan próbálja felismerni az oszlopokat nevük alapján.
- A Duplikátum-szűrés opció kihagyja a már meglévő nevű rekordokat.
5. Harmonizálás
A ⚖ Harmonizálás fülön az eltérő forrásszövegeket egységesíted egy közös formára.
Példa: „ÜGYVÉD", „ügyvéd dr.", „jogi praxis" → mind „Ügyvéd" harmonizált érték.
- Válaszd ki az attribútum típust (pl. Foglalkozás).
- A táblázatban látod az összes egyedi nyers értéket és előfordulási számukat.
- Több sor kijelölhető egyszerre → Alkalmazás kijelöltekre gomb.
- Az Önkitöltés gomb az üres harmonizált mezőkbe másolja a nyers értéket (gyors előkészítéshez).
A Harmonizálás fülön végzett módosítások csak a 💾 Mentés gombbal rögzülnek!
6. Kapcsolatok rögzítése
A 🔗 Kapcsolatok fülön rögzítheted a rekordok közötti viszonyokat.
- Válaszd ki az 1. rekordot, a kapcsolat típusát és a 2. rekordot.
- Az → Új kapcsolattípusként… opcióval menet közben is felvehetsz új típust.
- Opcionálisan adj meg forrást (pl. melyik dokumentumból tudod a kapcsolatot).
- A lista szűrhető a felső szövegmezővel.
Ha egy rekordot törölsz, az összes hozzá tartozó kapcsolat is törlődik.
7. Vizualizációk
🕸 Hálózat
Erő-gráf: csomópontok = rekordok, élek = kapcsolatok. A csomópontok húzhatók, a grafikon görgetéssel nagyítható, kattintásra megnyílik a rekord profilja. A Csomópont-szín legördülővel szín szerint ábrázolhatsz egy mezőt vagy attribútumot.
📊 Statisztikák
Sávdiagramok a séma lista-típusú mezőinek megoszlásáról, az attribútumok értékgyakoriságáról és a dátummező évtizedes eloszlásáról.
⏱ Idősor
Vízszintes sávdiagram az 1. és 2. dátummező alapján (pl. születési–halálozási év). A sávok kattinthatók. Ha csak 1 dátummező van, egypontos jelölőként jelenik meg.
🗺 Térkép
Interaktív Leaflet-térkép. Elfogadott formátumok: városnév (pl. Budapest, Kolozsvár, kb. 80 beépített hely) vagy koordináta (47.49, 19.04). Az ismeretlen helyneveket a térkép alatt listázza.
A Szín legördülő minden vizualizációnál listázza mind a séma-mezőket, mind az attribútum-típusokat.
8. Adatok mentése és betöltése
A böngésző cache törlésével az adatok elveszhetnek — rendszeresen exportálj!
- ↓ Mentés — letölti a teljes adatbázist JSON fájlba (rekordok, attribútumok, kapcsolatok, beállítások).
- ↑ Betöltés — JSON, CSV, TSV vagy Excel (.xlsx, .xls) fájl betöltése. JSON esetén a teljes adatbázis felülíródik (előtte mentés ajánlott). CSV/TSV/Excel esetén a program automatikusan az Adatbevitel → CSV-import 2. lépésére ugrik (oszlop-megfeleltetés); ekkor a meglévő adatok nem vesznek el, az új rekordok hozzáadódnak. Excel-fájl esetén a legtöbb adatot tartalmazó munkalap kerül beolvasásra.
A JSON fájl ember által olvasható szöveges formátum — szövegszerkesztővel megnézhető, de módosítani óvatosan szabad.
9. Zárolás és publikálás
Az adatbázist olvasható módra zárolhatod, vagy végleg publikálhatod – ez utóbbi visszavonhatatlan.
🔒 Zárolás (ideiglenes)
A fejlécen a 🔒 Zárolás gombra kattintva az adatbázis szerkesztési módja letiltódik:
- A rekordok, attribútumok és kapcsolatok nézhetők, kereshetők, de nem módosíthatók.
- A szerkesztési fülek (Adatbevitel, Harmonizálás, Kapcsolatok) nem érhetők el.
- A 🔓 Szerkesztés gombbal bármikor feloldható (Beállítások gombbal is).
- Az adatbázis továbbra is szerkesztésmódban tárolódik.
📢 Publikálás (végleges)
A 📢 Publikálás gomb megnyitja a publikálási párbeszédot:
- Megadhatod a készítő nevét és intézményi affiliációját (pl. ELTE BTK).
- A publikálás véglegesen lezárja az adatbázist – később nem szerkeszthető, nem oldhető fel.
- A főoldalon megjelenik az „Publikált adatbázis" banner a készítő adataival és a publikálás dátumával.
- Ha szerkeszteni szeretnél, a JSON-exporttal hozz létre egy új másolatot (importálás útján).
Használd a zárolást ideiglenes olvasható mód bevezetésére (csoportmunka, prezentáció), és a publikálást csak akkor, ha végleg kész az adatbázis.
10. Access adatbázisból importálás
Ha az adataid Microsoft Access (.mdb / .accdb) formátumban vannak, az access_to_csv.py Python szkripttel exportálhatod CSV-be.
Legegyszerűbb mód (Accessből közvetlenül)
Nyisd meg a táblát Accessben → Külső adatok → Exportálás → Szöveges fájl → CSV UTF-8.
Python szkripttel (automatikus)
pip install pyodbc
# Minden tábla exportálása
python access_to_csv.py adatbazis.accdb
# Csak egy tábla
python access_to_csv.py adatbazis.accdb --tabla Szemelyek
# Linux/Mac: mdbtools szükséges
sudo apt install mdbtools # Ubuntu
brew install mdbtools # macOS
11. Beállítások
A fejléc ⚙ Beállítások gombjára kattintva érhető el.
- Sablon — gyorsan válthatsz a beépített sémák között (a már bevitt adatokat nem törli).
- Projekt neve — a fejlécben megjelenő cím.
- Rekord típus és mezők — mezők átnevezése, törlése, új mező hozzáadása (szöveg / szám / lista / hosszú szöveg típusban). A speciális mezőknél jelölhető meg a cím-mező, az 1–2. dátummező (idősorhoz) és a helyszín mező (térképhez).
- Attribútum típusok — szabadon bővíthető lista (pl. Foglalkozás, Vallás, Lakóhely).
- Kapcsolat típusok — a rekordok közötti kapcsolatok elnevezései.
12. GYIK
Elvesztek az adataim.
A böngésző cache törlése törli az adatokat. Mindig exportálj JSON fájlba a ↓ Mentés gombbal, különösen hosszabb munka után.
Egy helynév nem jelenik meg a térképen.
Nézd meg a térkép alatti „Nem azonosított helyek" listát. Próbálj koordinátát beírni (pl. 47.49, 19.04). A geocoder kb. 80 Kárpát-medencei és európai helyet ismer.
Egyszerre több rekordhoz szeretnék harmonizált értéket adni.
A Harmonizálás fülön jelöld be a sorokat → írd be az egységesített értéket → Alkalmazás kijelöltekre.
A hálózaton minden csomópont azonos színű.
A „Csomópont-szín alapja" legördülőben válassz egy mezőt vagy attribútum-típust — de csak akkor működik, ha a rekordoknál van ilyen adat.
Hogyan törlök egy rekordot?
Kattints a rekord kártyájára → ✏ Szerkesztés → Törlés. A törlés visszavonhatatlan.
Melyik böngészőben működik?
Bármely modern böngészőben (Chrome, Firefox, Edge, Safari). Az adatok böngészőnként külön tárolódnak — váltásnál JSON-exportot használj.
Ugyanahhoz a rekordhoz több azonos típusú attribútum felvehető?
Igen — pl. Lakóhely: „Pest" (1840) és Lakóhely: „Bécs" (1848) egymás mellett élnek, különböző időponttal.
Mekkora adatbázist kezel kényelmesen?
500–2000 rekord gond nélkül. 5000 felett a hálózatvizualizáció lassulhat; a térkép és a statisztikák jól skálázódnak. A localStorage határ kb. 5 MB.