1 Mi az adatbázis?
1.1 Alapfogalmak
Adatbázis: Strukturáltan tárolt, egymással kapcsolatban lévő adatok összessége, amelyek egy meghatározott célra szervezve, elektronikusan vannak tárolva.
Az adatbázis definíciójában három kulcsfogalmat kell kiemelni:
1.1.1 Strukturáltság
Az adatok nem összevissza, hanem rendezett formában, meghatározott szabályok szerint vannak elrendezve. Ez azt jelenti, hogy:
- Minden adatnak megvan a helye a rendszerben
- Az adatok típusa előre definiált (szöveg, szám, dátum, stb.)
- Az adatok kapcsolatai logikusan szervezettek
- Az elérés szabályozott és gyors
Példa: Egy levéltári fond adatai nem egyszerűen felsorolásban szerepelnek, hanem strukturált mezőkben: jelzet, megnevezés, időkör, terjedelem, stb.
1.1.2 Tárolás
Az adatok elektronikusan, tartósan őrődnek meg, és bármikor visszakereshetők. A tárolás jellemzői:
- Tartósság: Az adatok nem vesznek el (backup rendszerek)
- Gyorsaság: Gyors hozzáférés akár nagy mennyiségű adathoz is
- Biztonság: Jogosultságok, titkosítás
- Konzisztencia: Az adatok egységesek
1.1.3 Kapcsolatok
Az adatok között logikai kapcsolatok vannak, összetartoznak, egymásra hivatkoznak. Például:
- Egy kutató több látogatást tehet
- Egy látogatás során több fondotból kérhet iratokat
- Egy fond több dobozból áll
- Egy dobozban több irat van
Ezek a kapcsolatok nem véletlenszerűek, hanem a valós világ struktúráját tükrözik.
1.2 Miért van szükség adatbázisokra?
1.2.1 Nagy adatmennyiség kezelése
Levéltári példa:
500 dobozos fond, benne kb. 20.000 irat. Hogyan tartjuk nyilván? Hogyan keresünk benne?
Hagyományos megoldások: - Papír alapú leltárkönyv: Nehéz keresni, lassú, nem lehet rendezni - Word dokumentum: Nincs rendezés, szűrés, nehézkes keresés - Nem strukturált Excel: Áttekinthetetlen, lassú, hibás adatok
Adatbázis megoldás: - Gyors keresés bármilyen mező alapján - Többszempontú rendezés - Szűrés kombinált feltételek szerint - Statisztikák, összesítések másodpercek alatt
1.2.2 Kapcsolatok kezelése
Az adatok között gyakran bonyolult kapcsolatrendszerek vannak.
Példa: Kutatószolgálat
- Kovács János kutatót nyilván kell tartani (név, cím, email, telefon, intézmény)
- Kovács János többször is jön kutatni (látogatások dátumai, időpontjai)
- Minden látogatáson több fondból kérhet
- Egy fondot több kutató is kérhet
- Egy fondban több doboz van
- Minden kérésről dokumentálni kell, ki, mit, mikor kért
Hagyományos megoldás (Excel):
Név | Email | Dátum | Fond | Doboz
Kovács János| k@... | 2024.11.05| XXV-1 | 3
Kovács János| k@... | 2024.11.05| XXV-2 | 5
Kovács János| k@... | 2024.11.12| XXV-1 | 4
Probléma: Ha Kovács János emailje megváltozik, mindhárom sort javítani kell!
Adatbázis megoldás: - Kovács János adatai egyszer szerepelnek (KUTATÓK tábla) - Látogatásai külön táblában (LÁTOGATÁSOK) - Kérései külön táblában (KÉRÉSEK) - Email változás → egy helyen javítás
1.2.3 Probléma 3: Adatintegritás
Adatintegritás: Az adatok pontosak, konzisztensek és megbízhatóak.
Gyakori hibák strukturálatlan adatkezelésben:
- Elgépelés: “Kovács János” vs “Kovacs János” vs “Kovács Janos”
- Hiányzó kötelező adat: Fond jelzet nélküli rekord
- Nem létező hivatkozás: Olyan fondot kérnek, ami nincs nyilvántartva
- Duplikáció: Ugyanaz az adat többször szerepel
- Elavult adat: Az egyik helyen frissítve, máshol nem
Adatbázis megoldás: - Típusellenőrzés: Csak szám írható be a “Születési év” mezőbe - Kötelező mezők: Nem menthető rekord fondjel nélkül - Referenciális integritás: Csak létező fondra lehet hivatkozni - Egyedi kulcs: Nem lehet két azonos kutatói azonosító - Automatikus frissítés: Kapcsolt adatok automatikusan frissülnek
1.3 Adatbázisok a levéltári munkában
1.3.1 Tipikus felhasználási területek
Táblázat 2.1: Adatbázis alkalmazások a levéltárban
| Terület | Leírás | Bonyolultság |
|---|---|---|
| Nyilvántartás | Fondok, dobozok, iratok hierarchikus rendszere | Közepes |
| Iktatókönyv | Iktatott ügyek, iktatószámok, ügyintézők, határidők | Közepes |
| Kutatószolgálat | Kutatók, látogatások, kért fondok, engedélyek | Magas |
| Digitalizálási projekt | Dobozok, iratok, szkennelés státusza, munkatársak | Közepes |
| Raktárkezelés | Épületek, raktárak, polcok, fondok elhelyezése | Egyszerű |
| Kiállítás menedzsment | Kiállítások, kiállított tárgyak, iratok, kölcsönzések | Magas |
| Munkatársi nyilvántartás | Munkatársak, jogosultságok, szakterületek | Egyszerű |
1.3.2 Előnyök a levéltári munkában
- Gyors keresés: Bármely mező szerint másodpercek alatt
- Statisztikák: Hány fond, mennyi terjedelem, évenkénti bontás
- Kapcsolatok: Ki, mikor, mit kért - összetett lekérdezések
- Jelentések: Automatikus kimutatások, összesítők
- Többfelhasználós: Több munkatárs dolgozhat egy időben (korlátokkal)
- Verziókövetés: Ki, mikor módosított mit
- Biztonsági mentés: Automatikus backup rendszerek
1.4 Az adatbázisok fejlődése
1.4.1 Rövid történeti áttekintés
1960-as évek: Hierarchikus és hálós adatbázisok
- IBM IMS (Information Management System)
- Merev struktúra, nehéz módosítás
1970-es évek: Relációs modell megjelenése
- Edgar F. Codd publikációja (1970)
- SQL nyelv kifejlesztése
- Rugalmas, matematikai alapokon nyugvó modell
1980-as évek: Relációs adatbázisok elterjedése
- Oracle, DB2, Microsoft SQL Server
- Személyi számítógépeken is elérhetővé válnak
1990-es évek: Desktop adatbázisok
- Microsoft Access (1992)
- Nem informatikusok is használhatják
- Levéltárak is elkezdik használni
2000-es évek: Web-alapú rendszerek
- MySQL, PostgreSQL térnyerése
- Online katalógusok, digitális archívumok
2010-es évek: NoSQL és Big Data
- MongoDB, Cassandra
- Hatalmas adatmennyiségek kezelése
- Nem strukturált adatok (képek, videók)
1.5 Ellenőrző kérdések
- Mit jelent az, hogy az adatok “strukturáltan” vannak tárolva?
- Milyen problémákat old meg egy adatbázis a hagyományos (pl. Word) megoldásokhoz képest?
- Mi az adatintegritás, és miért fontos?
- Mondjon példát egy levéltári felhasználási területre, ahol adatbázis használata indokolt!
- Miért előnyös az adatbázisokban, hogy az adatok kapcsolatban vannak egymással?