4 Történeti források kiadása a digitális világban – lehetőségek és gyakorlat
Magyar Tudomány, 186/10 (2025), 2039–2050. DOI: 10.1556/2065.186.2025.10.22
4.1 Bevezetés
Az 1999-ben a történeti források kiadásának módszertani kérdéseiről megrendezett nagyszabású konferencia célkitűzése az volt, hogy közös gondolkodást kezdeményezzen a történész- és levéltárosszakma képviselői között arról, hogyan kell a különböző korszakokban keletkezett történeti forrásokat szakszerűen kiadni (Kenyeres 2000). Erre azért is volt szükség, mert a történeti forráskiadás lényegében egyetlen hivatalos szabályzata 1920-ban látott napvilágot (Századok, 1920–1921).
A forráskiadásról szóló konferencia óta eltelt közel negyedszázadban a digitalizáció területén bekövetkezett technikai változások nagyban befolyásolják a történeti források kiadásának lehetőségeit, ezért hasznos, ha folyamatos a szakmai diskurzus arról, mit és milyen feltételek teljesülése mellett tekintünk forráskiadásnak. Ennek jegyében rendezett konferenciát 2017-ben a Magyar Nemzeti Levéltár „Történelem egy kattintásra? Klasszikus forráskiadás és/vagy levéltári adatbázisok” címmel, hogy többek között a forráskiadás klasszikus módszereit járja körül az akkori legújabb technikai adottságoknak megfelelően (Reisz 2018). Tanulmánykötetekben (Sipos 2014), a Levéltári Közlemények (Ress 2006; Nagy 2007) és a Turul hasábjain (Kóta 2015) is jelentek meg a digitális forráskiadással kapcsolatos gondolatébresztő publikációk, a digitális eszközök fejlődése azonban rákényszeríti a szakmát arra, hogy rendszeresen számot vessen a legjobb szakmai és technikai színvonalon történő forráskiadás kihívásaival.
Jelen írás célja nem az, hogy alapelveket fektessen le, sokkal inkább egy áttekintés és problémafelvetés kíván lenni, bízva abban, hogy a forráskiadások közreadói a közeljövőben újabb konferencián vitathatják meg a 21. században követendő gyakorlatot. Ugyancsak nem célom elmélyülni a különböző történelmi korszakokban keletkezett források kiadási elveiben és szokásaiban, ehelyett igyekszem a digitális forráskiadásról általában gondolkozni. A tanulmány elsődlegesen az írott források témáját igyekszik körüljárni.
A következőkben először röviden összefoglalom a történeti forráskiadások különböző típusait, majd áttekintem a források publikálására kialakult különböző digitális gyakorlatokat a papíralapú kiadási szokásokkal történő összevetés révén, majd részletesen bemutatom a tudományos igényű digitális forráskiadás elkészítésének lehetőségeit, követelményeit, előnyeit és hátrányait. Bár a történeti források digitális formában történő publikálásának áttekintése során röviden kitérek a különböző adatbázisokra, célom nem ezek részletes bemutatása, mivel az adatbázisokat még akkor sem tekintem digitális forráskiadásnak, ha tartalmazzák valamely történeti forrás digitális másolatát. Amellett érvelek, hogy a két formát, azaz a források adatbázisba rendezését és a tudományos igényű digitális forráskiadást határozottan szét kell választani, és ki kell dolgozni az utóbbira vonatkozó, jelenleg teljesen hiányzó szakmai ajánlásokat és szabályokat, amelyek igazodnak a nemzetközi szabványokhoz, de figyelembe veszik a történeti források hazai kiadási gyakorlatának sajátosságait is.
Az írott történeti források papíralapú kiadásának is több típusát különböztetjük meg, amelyek befolyásolják a megjelenés formáját, a hozzáfűzött kísérőszövegek és jegyzetapparátus mennyiségét és milyenségét. Ezek alapján beszélhetünk fakszimile kiadásról, amikor az eredeti dokumentummal teljesen megegyező tartalmi és formai jegyekkel rendelkező hasonmást jelentetünk meg – az ilyen kiadások esetén a tartalmi jegyek mellett a formai és az anyagi hűségnek is kiemelkedő szerepe van. A fakszimile kiadások leggyakoribbak a középkori, illetve kora újkori iratok esetén, ahol az irat képi megjelentetésének valódi forrásértéke lehet, szemben a tömegesen keletkezett, írógéppel írt vagy stencilezett 20. századi iratokkal. Ugyancsak a középkori oklevelek publikálásának bevett gyakorlata a regeszták készítése, amelyek az okleveleket kivonatosan közlik, és tudományos apparátussal rendelkeznek. Egy irat teljes szövegű közlése esetén az eredeti forrás teljes szövegét publikálják, de ebben az esetben a szöveget átírják, előre meghatározott elvek szerint normalizálják. A kiadás alapjául az adott irat eredetije, illetve, ha az elveszett, az ahhoz legközelebb álló szövegváltozat szolgál. Az eredeti dokumentumhoz jelentős mennyiségű kiegészítő szöveg kapcsolódhat. Elvárás, hogy ebben megjelenjenek a szövegkiadás alapelvei, a válogatás szempontjai, a dokumentumok jelentősége, keletkezésük körülményei. A kritikai szövegkiadás annyiban különbözik a teljes szövegű közléstől, hogy a közreadó kritikai apparátusban közli a közreadott irat szövegbeli (íráskép, betűhasználat, hibák, javítások), illetve az esetleges példányok közti szövegbeli és tartalmi különbségeket. Minden esetben le kell írni az eredeti példány fizikai jellemzőit, illetve minden kapcsolódó információt, amely az iratok értelmezéséhez szükséges. A forráskiadások speciális fajtáját alkotják a fordítások, amelyek esetén szintén kiemelkedően fontos a megfelelő jegyzetapparátus a szövegek értelmezéséhez.
Mindezekből látható, hogy a történeti források kiadása szakértelmet, időt és anyagi ráfordítást igényel. A 21. századi digitális technikák számtalan olyan lehetőséget teremtenek, amelyeket megfelelően használva a korábbi szakmai elvek mentén színvonalas forráspublikációk készítésére nyílik lehetőség.
4.2 Miért ne tekintsünk forráskiadásnak egy levéltári adatbázist?
A korábban a levéltári adatbázisok és a forráskiadás témájában megjelent publikációk gyakran tárgyalják együtt a levéltári adatbázisokat és a digitális forráskiadást, elmosva a határt a két fogalom között. Jelen tanulmány amellett érvel, hogy helyesebb a két formát különválasztani egymástól, mint ahogyan egy mikrofilmtekercset sem tekintünk forráskiadásnak. Egy adatbázis ugyanis mindig egy adatstruktúra felől szerveződik. Ennek alapja általában valamilyen szabvány vagy más előre rögzített elv, amely mentén a változókat meghatározzák, ezáltal pedig előre rögzítik azokat az adattípusokat, amelyeket a kialakított adatbázis tartalmaz majd. Így egy adatbázis célja és rendeltetése nem az, mint egy (digitális) forráskiadásé, ami az adott forrásból, forráscsoportból indul ki, és bár egységes elvek szerint, de az egyedit kezeli. A két típust azonban nehéz elválasztani egymástól, mert – mint később látni fogjuk – a digitális forráskiadások készítése esetén is beszélünk adatbázisról, rendelünk metaadatokat a dokumentumokhoz, sőt ezeket össze is kapcsoljuk egymással.
A levéltárak egyik fő szakmai feladata, hogy különböző segédleteket készítsenek az általuk őrzött iratanyagról, amelyek támogatják annak nyilvántartását és használatát.33 Az elmúlt évtizedekben több nagyszabású levéltári adatbázis készült, amelyek döntő többsége a Hungaricana Közgyűjteményi Portál, az Elektronikus Levéltári Portál („Részletes keresés”), illetve az Adatbázisok Online („Adatbázisok”) felületén érhető el. Ezek az adatbázisok a levéltárak szakmai feladatait szem előtt tartva az iratanyagot vagy annak levéltári rendszere szerint írják le elsődlegesen nyilvántartási célból, vagy több irategyüttest előre meghatározott szempontok szerint feldolgozó tematikus adatbázisok, amelyek elsődlegesen kutatási segédletek. A levéltári adatbázisok többnyire különböző levéltári szabványokhoz igazodó metaadat-struktúrát követnek, amelyekhez a tömeges digitalizálási projektek lehetőség szerint (de nem minden esetben) az iratok digitális képét is hozzákapcsolják. Az iratok képét azonban nem látják el olyan tudományos apparátussal, amely forráskiadásnál megszokott, hiszen az adatbázisnak nem ez a célja, és az ilyen iratmásolat megegyezik papíralapú változatával. Ebből a szempontból az adatbázis nem más, mint egy segédlettel ellátott mikrofilmtekercs, még ha a technikai adottságok révén többet is nyújt a kutatónak. Önmagukban az adatbázisban tárolt adatok nem informatívabbak az eredeti iratban fellelhetőknél. Az adatbázis fő előnye az egységes adatszerkezetben és ennek révén a különböző adatbázisok összekapcsolhatóságában, valamint az adatok gyors és egyszerű kereshetőségében áll. Egy kereshető PDF, amelyet a kutató a saját számítógépéről is elér, többet nyújt egy mikrofilmfelvételnél; egy jól felépített és más adatbázisokhoz kapcsolódó adatbázis sokkal informatívabb, mint egy papíralapú segédlet. A levéltári adatbázisok rendeltetése az, hogy a kutatók és a levéltárosok számára elérhetővé tegyék az iratokra vonatkozó információkat, és könnyebb hozzáférést biztosítsanak azokhoz.
Mind a levéltári adatbázisok, mind a tudományos igényű digitális forráskiadás szakmai továbbfejlődését szolgálja, ha a két kategóriát nem mossuk össze, hanem külön-külön határozzuk meg igényes elkészítésük feltételeit.
4.3 Történeti források internetes közzététele
Az utóbbi évtizedekben nagy lendülettel bontakozott ki a történeti források közzététele az interneten, egyre több internetes felület jött létre történeti források digitális publikálására. Ezt részben a levéltári tömeges digitalizálás, részben a technika fejlődése tette lehetővé. Egy kutató minimális költséggel (levéltártól megvásárolva a szkennelt másolatot vagy saját eszközzel készítve publikálható minőségű digitális másolatot), akár csak minimális hozzáfűzött információval publikálhat egy forrást egy weboldalon – amely lehet egy újságé, egy projekté vagy egy magánszemélyé. Ezzel a gyakorlattal nemcsak kutatók, hanem intézmények is élnek, például a levéltárak gyakran ilyen formában mutatják be irataikat a szélesebb közönségnek.34 Szinte valamennyi hazai levéltár rendelkezik a honlapján iratbemutató felülettel, ahol különböző évfordulókhoz kötődően vagy a hónap, illetve hét dokumentumaként publikálnak forrásokat, amelyekhez különböző hosszúságú és színvonalú kommentárt, jegyzetapparátust rendelnek. Ez a forráspublikáció leginkább a fakszimile kiadásokra hasonlít, azzal a különbséggel, hogy míg egy fakszimile kötetben tematikusan több iratot publikálnak, az interneten egyszerre egyetlen irat nyilvánosságra hozatala is lehetséges alacsony költséggel. Az ilyen típusú iratpublikálás veszélye, hogy az irat képe levéltári jelzetétől megfosztva önálló életre kelhet az interneten, ami megnehezíti a rá való hivatkozást vagy egy nagyobb irategység részeként történő értelmezését.
A történeti források digitális formában történő publikálásának fóruma a levéltárak által kiadott Archívnet és Betekintő internetes folyóiratok. Az előbbi kifejezetten a történeti források online publikálására jött létre, papíralapú változata nem is létezik; az utóbbiban a tanulmányok dominálnak, és nyomtatott formában is megjelenik. Ezekben legtöbbször nem az iratok szkennelt változatát, hanem azok teljes szövegű átiratát jelentetik meg kísérőtanulmánnyal és jegyzetapparátussal, teljesítve a tudományos igényű forráskiadás alapvető kritériumait, de csak részben használva ki a digitális publikálás nyújtotta technikai lehetőségeket.
Ugyancsak egyfajta digitális forráskiadási gyakorlatnak tekinthető, amikor egy papíralapon is megjelent forráskötetet digitális formátumban (leggyakrabban PDF-dokumentumként) is nyilvánosságra hoznak. Ezek azonban valójában papíralapú forráskiadások másolatai más adathordozón megjelenítve.
A tudományos digitális szövegkiadás a következő módon foglalható össze az angolszász szakirodalom digital scholarly edition fogalma (Sahle 2016) és a hazai gyakorlatban használt tudományos forráskiadás elveinek összekapcsolásával: a tudományos kiadás a történeti dokumentum kritikai reprezentációja,35 és mint ilyen, történeti dokumentumokat dolgoz fel, azokat digitális formában jeleníti meg, és metaadatokkal látja el, a forráshoz szövegkritikai megjegyzéseket36 fűz. Fontos tehát, hogy nem tekinthetjük tudományos digitális szövegkiadásnak azokat a digitalizált dokumentumokat, amelyek nem reflektálnak a szöveg és hordozója sajátosságaira. Ide tartozhatnak ugyanakkor az eleve digitálisan született szövegkiadások, illetve azok az elektronikus formában megjelenített dokumentumok, amelyek a papíralapú dokumentumot szemantikus tartalommal egészítik ki, például a Text Encoding Initiative XML-szabvány segítségével (Maróthy 2018, 351–352).
4.4 Digitális forráskiadás – szabványok és alkalmazások: a Text Encoding Initiative szabvány
Ahogyan a levéltári iratok leírásának is léteznek nemzetközi szabványai, úgy a szövegek digitális formában való megjelenítésének is. Az 1994-ben létrejött Text Encoding Initiative (TEI) konzorcium közösen fejleszti és tartja fenn a TEI-szabványt, amelynek legfontosabb eredménye több olyan iránymutatás, amely meghatározza a gépileg olvasható szövegek kódolási módszereit (főként a bölcsészettudományok, a társadalomtudományok és a nyelvészet területén). A TEI-irányelveket széles körben használják közgyűjtemények, egyetemek és kiadók kutatás, oktatás és megőrzés céljából történő digitális szövegmegjelenítésre. Az iránymutatásokon kívül a konzorcium számos forrást és képzési eseményt kínál a TEI elsajátításához, információkat a TEI-t használó projektekről, a TEI-vel kapcsolatos kiadványok bibliográfiáját, valamint a TEI-hez kifejlesztett vagy ahhoz igazított szoftvereket.
A TEI azonban csak szövegkódolásra vonatkozó szabvány; nagy hiányosság, hogy jelenleg nem áll rendelkezésünkre történeti források digitális formában történő kiadására szolgáló szabvány, amely minimálisan meghatározná az ilyen kiadványokkal szemben támasztott elvárásokat.
Ahogyan a TEI-dokumentum képén (1. ábra) is láthatjuk, a digitális formátumba átkódolt szöveg alapjaiban különbözik egy szkennelés segítségével digitalizált dokumentumtól. A forráskiadás készítőinek különböző segédprogramok állnak rendelkezésükre, a szöveggel kapcsolatos szerkesztési, jegyzetelési feladatok elvégzése megfelelő előkészítés után nem bonyolultabb, mint a szövegszerkesztés vagy a táblázatkezelés.
4.5 Az optikai karakterfelismerés
A történeti források digitális kiadásának fő nehézsége a szövegek elektronikus formára történő átírása. Az optikai karakterfelismerés (optical character recognition, OCR) jelentős fejlődésen ment keresztül az utóbbi években. A kutatóknak lehetőségük nyílik olyan mesterségesintelligencia-alapú alkalmazások használatára, amelyeket egy-egy írástípus jellegzetességeire tanítanak meg, így a kézírás OCR-ezése is lehetséges. Az egyik legdinamikusabban fejlődő szövegfelismerő a Transkribus, amely két EU-projekt, a „tranScriptorium” és a „READ” keretében jött létre, és alkalmas a dokumentumok szövegfelismerésére, képelemzésére és szerkezetfelismerésére is. Így nemcsak tiszta folyószövegek átírására képes, hanem a dokumentumba utólag elhelyezett bejegyzéseket is felismeri, illetve kezeli a kézzel írt táblázatos formákat is. Azonban a mesterséges intelligencia ebben az esetben is csak segíti a kutató munkáját, az adott kézírás olvasására az algoritmust meg kell tanítani, ehhez megfelelő mennyiségű szöveget át kell írni. A platform lehetőséget nyújt a kooperációra, akár több kutató is dolgozhat közösen a szövegeken, másrészt projektjeinket nyilvánosságra hozva a szélesebb kutatóközösség segítségét is kérhetjük egy nehezebb szöveg átírásában. Az átírt szövegek mindegyike gazdagítja az algoritmust, amely ennek következtében dokumentumról dokumentumra egyre jobban teljesít, akár magyar nyelven is.
Bár egy találomra feltöltött magyar nyelvű kézírásos szöveg átírása még sok hibát tartalmazhat, ha hasonló írástípussal magyar nyelven készült szövegekkel tanítjuk az algoritmust, hamarosan sokkal használhatóbb eredményt érhetünk el. Angolul és németül jelenleg sokkal pontosabb a kézírás-felismerés, mert ezeken a nyelveken már sokkal több szöveget dolgoztak fel, a háttérben futó mesterségesintelligencia-alapú alkalmazás több forrásból tanulhatott.
A 20. század második felében géppel keletkezett iratok optikai karakterfelismerése lényegesen egyszerűbb, bár az utólagos kézi betoldások vagy a rosszabb papírminőség itt is nehézségek elé állíthatja a kutatókat. A (kéziratos forrásokhoz képest) viszonylag könnyű OCR-ezés azonban a digitális forráskiadások rovására is mehet. Kevés erőfeszítéssel készíthetőek olyan kiadványok, amelyek nem estek át alapos szöveggondozáson, ami a kézírásos szövegek átírásánál kényszerűségből megtörténik. Éppen ezért lenne fontos, hogy minél hamarabb lefektessük a tudományos igényű digitális történeti forráskiadás szabályait, amelyek igazodnak az adott történeti korszak forráskiadásának hagyományaihoz, illetve a 21. század lehetőségeihez és követelményeihez igazítják ezeket.
Ha a nyomtatott és digitális forráskiadásokat összevetjük egymással, az alábbi alapvető különbségeket látjuk: a nyomtatott forráskiadások terjedelmi okokból általában nem tartalmazzák az átírás mellett a dokumentum fakszimile változatát is, ezzel szemben a digitális kiadások leggyakrabban a forrás vizuális megjelenítéséből indulnak ki. Míg a nyomtatott kiadások általában egy forrásból csak egy szövegváltozatot jelenítenek meg, a digitális forráskiadások számítógépes szövegkódja a szöveg többféle nézetét is lefedheti, és különböző algoritmusok segítségével különböző szövegmegjelenítésekre képes. Ez a tulajdonság az, ami miatt célszerű megkülönböztetni egymástól valaminek a digitalizált kiadását és a digitális kiadását. Egy papíralapon megtervezett és elkészített kiadás tartalma és funkciói nem változnak meg annak digitalizálásával, digitális forráskiadás ellenben nem adható ki nyomtatásban a tartalom és a funkcionalitás jelentős csökkenése nélkül. A nyomtatás során elveszik a lehetőség, hogy nagyszámú dokumentumot lényegében korlátlan számú különböző nézetben jeleníthessünk meg ugyanabból az elektronikus kódból generálva.
4.6 Hazai gyakorlatok
A hazai gyakorlatban elsősorban az irodalomtudomány területén láthatunk példákat a digitális kritikai szövegkiadásokra, amelyek közül röviden érdemes szólni az Országos Széchényi Könyvtár (OSZK) Digitális Bölcsészeti Központja által üzemeltetett dHUpla (Digitális Bölcsészeti Platform) digitális bölcsészeti platformról. Ez egy online publikálási környezet, amely a közgyűjtemények szöveges forrásainak digitális közreadására szolgál, így a kéziratos korpuszok mellett nyomtatott és e-born tartalmak közzététele is szerepel a szolgáltatásai között. Bár a felület bemutatkozó oldala alapján jelenleg klasszikus írók kéziratos és nyomtatott forrásait teszi elérhetővé, az itt alkalmazott gyakorlat a szükséges tudományterületi különbségek áthidalása után alkalmas lehet történeti források digitális publikálására is. Példaként érdemes megtekinteni Móricz Zsigmond levelezésének digitális kritikai kiadását. A felületen egymás mellett találjuk a levél kéziratos változatát és az átírást, ahol az egyes szövegkritikai megjegyzések is megjelennek, a nevek pedig közvetlenül kapcsolódnak az entitástárhoz, és ezen keresztül a névtéradatbázishoz.
Jelenleg a levelezés kiadásának 2.0-ás változatát olvashatjuk, a forrásokhoz kapcsolódó előszóban pedig ismertetik a digitális szövegfeldolgozásra vonatkozó információkat, így azt is megtudhatjuk, hogy a második kiadás közel 100 levéllel bővebb az elsőnél, jól mutatva a digitális forráskiadás később szabadon bővíthető voltát. A megjelenítő felületen számos lekérdezési lehetőséget találunk, a belső linkkapcsolatok segítségével mozoghatunk az egyes entitások és a szövegek között.
A felület úgynevezett kreatív tartalmak megjelenítésére is alkalmas, a vizuális felületeken például kapcsolati hálókat vagy családfákat böngészhetünk.
Mindez jól mutatja, milyen sok lehetőség rejlik a történeti források digitális forráskiadásában is, amennyiben sikerül annak feltételeit megteremteni és szabályait lefektetni.
4.7 Összegzés
A korszerű eszközökkel létrehozott, a mesterséges intelligencia nyújtotta lehetőségeket jól használó digitális forráskiadás számos előnnyel jár. Gyakorlatilag megszünteti a terjedelmi korlátokat, a szakmai érvek mellett csak a kutató kapacitása szab határt az egy-egy gyűjteményben publikálható forrásoknak. Nem szükséges a kéziratot végleg lezárni, a dokumentumok menet közben is publikálhatóak, sorrendjük utólag is megváltoztatható, az esetleges hibák javítása bármikor megoldható. Az átírt szöveg mellett a digitális képek is megjeleníthetőek, így a két változat egyszerűen vethető össze. Szabványos adatstruktúrát és megfelelő keretrendszert használva az így készített forráskiadások csatlakozhatnak az egységes névtéradatbázisokhoz, az elektronikusan elérhető lexikonokhoz és egyéb kiadványokhoz, ami sokkal többet ad, mint egy kereshető szövegfájl elhelyezése egy weboldalon. Emellett a digitális forráskiadások megteremtik a lehetőséget a komplexebb számítógépes szövegelemzési vagy szövegbányászati módszerek alkalmazására, például szöveg-összehasonlítás révén szerzőazonosításra, vagy a forrásokban szereplő nevek kapcsolati hálóba szervezésére és ennek vizuális megjelenítésére.
Az előnyök felsorolása mellett azonban szólni kell az ilyen kiadások készítésének nehézségeiről is, így arról, hogy legalábbis kezdetben magas a bekerülési költségük. Egyrészt szükség van egy keretrendszerre, a megfelelő alkalmazások licencdíjának fedezésére és megfelelően képzett munkatársakra. Emellett kiemelten fontos a stabil tárolási környezet, amely hosszú távon biztosítja az így készült kiadások fennmaradását. Ennek hiányában, mivel a digitális forráskiadások teljességgel nem reprodukálhatóak nyomtatásban, a forráskiadások készítői olyankor is a papíralapú kötetek mellett teszik majd le a voksukat, amikor a szakmai szempontok a digitális kiadás mellett szólnának. Bár a digitális forráskiadás kétségkívül hordozhat jelentős többletinformációt a papíralapú változathoz képest, ebben az esetben is fontos, hogy a forráskiadás készítői annak célját és a rendelkezésre álló erőforrásokat mérlegelve döntsenek a megfelelő forma mellett, és ne fordítva, hiszen a történeti forráskiadás értékét a források gondos kiválasztása és a hozzájuk rendelt tudományos apparátus sokkal inkább befolyásolja, mint a publikálás formája.
4.8 Irodalomjegyzék
- „Adatbázisok”. Magyar Nemzeti Levéltár – Adatbázisok Online. https://adatbazisokonline.mnl.gov.hu/
- „ArchívNET. XX. századi történeti források”. Magyar Nemzeti Levéltár. https://www.archivnet.hu/
- „dHUpla – Digitális Bölcsészeti Platform”. https://dhupla.hu/
- „Example:
(TEI document)“. TEI. https://tei-c.org/release/doc/tei-p5-doc/en/html/examples-TEI.html - „Hungaricana. Közgyűjteményi Portál”. https://www.hungaricana.hu/
- Kenyeres István, szerk. (2000). „A történeti források kiadásának módszertani kérdései.” FONS, 7/1.
- Kóta Péter (2015). „Digitális forráskiadás. Gondolatok alapvető kérdésekről”. Turul, 88/4, 130–143.
- Maróthy Szilvia (2018). „A tudományos elektronikus szövegkiadások feldolgozása”. In: Kiszl – Csík, szerk. Valóságos könyvtár – könyvtári valóság. Budapest: ELTE BTK, 351–356. https://doi.org/10.21862/vkkv2018.351
- „Móricz Zsigmond levelezése (1892–1913)“. dHUpla. https://dhupla.hu/collection/moricz-zsigmond-levelezes
- Nagy Sándor (2007). „Adatbázisépítés és forráskiadás.” Levéltári Közlemények, 78/1, 173–176.
- Reisz T. Csaba (2018). „Történelem egy kattintásra?” Századok, 152, 685–694.
- Ress Imre (2006). „Digitális forráskiadás vagy elektronikus mutatózás?” Levéltári Közlemények, 77/1, 13–31.
- Sahle, Patrick (2016). „What Is a Scholarly Digital Edition?” In: Driscoll – Pierazzo, szerk. Digital Scholarly Editing. Cambridge: Open Book Publishers, 19–39.
- Sipos András (2014). „A digitalizálás mint a levéltári forráskiadás új útja?” In: Korompay et al., szerk. Forráskutatás, forráskiadás, tudománytörténet, II. Budapest: MNYT, 64–72.
- Századok (1920–1921). A Magyar Történelmi Társulat forráskiadási szabályzata. Melléklet, 1–24.
- „Text Encoding Initiative”. https://tei-c.org/
- „Unlock the Past with Transkribus”. https://www.transkribus.org/
4.9 Demonstrációs eszköz: TEI Annotáló
A fejezethez kapcsolódó demonstrációs eszköz a forráskiadás egy kulcslépését – az entitásjelölést – teszi interaktívan kipróbálhatóvá a fejezetben szereplő levéltári forrásszövegeken.
⬇ tei_annotalo.html letöltése Mentse el, majd nyissa meg böngészővel – telepítés nem szükséges.
A HTML-fájlt böngészőben lehet megnyitni, telepítés nélkül. Három fő nézete van, amelyek a fejléc tabjaival válthatók.
- Dokumentumok – itt látható az összes betöltött forrásszöveg kártyás nézetben, az annotációk típusonkénti összesítésével. Az „+ Új dokumentum” gombbal saját szöveg adható hozzá (cím, dátum, levéltári jelzet és plain text szöveg megadásával). A meglévő dokumentumok metaadatai az „Szerkesztés” gombbal módosíthatók.
- Annotálás – a legördülő menüből kiválasztott dokumentum szövege jelenik meg. Annotáláshoz elegendő az egérrel kijelölni egy szövegrészt: megjelenik egy kis panel, ahol ki kell választani az entitás típusát (Személy, Intézmény, Mű, Dátum, Hely, Egyéb), meg kell adni az azonosító nevet, és opcionálisan egy rövid megjegyzést. A már meglévő annotációk a jobb oldali listában szerkeszthetők vagy törölhetők. A típusszűrőkkel az egyes entitástípusok megjelenítése ki-bekapcsolható.
- Kapcsolatháló – az annotációkból automatikusan generált hálózatgráf, amelyen a csomópontok entitásokat, az élek az egy dokumentumon belüli (tömör) illetve több dokumentumban is szereplő (szaggatott) együttes előfordulásokat jelölik. A csomópontok húzhatók, a görgetőkerékkel és a jobb felső gombokkal zoomolható. Bal oldalt szűrhető, hogy mely dokumentumok és entitástípusok szerepeljenek a hálózatban. A „Hálózat frissítése” gomb az annotációk változása után szükséges.
Mentés és export – az eszköz minden módosítást automatikusan ment a böngésző tárba (localStorage), így az oldal újratöltése után a munka folytatható. A „HTML mentés” gomb egy önálló HTML-fájlt tölt le, amelybe az annotációk bele vannak égetve – ez átadható, archiválható, és maga is ugyanígy menthető tovább. A „TEI XML” és „JSON” gombok az aktuálisan megnyitott dokumentum annotációit exportálják szabványos formátumban.
A közlevéltárak és a nyilvános magánlevéltárak tevékenységével összefüggő szakmai követelményekről szóló 27/2015. (V. 27.) EMMI rendelet 40. § (3) szerint: „az iratanyag rendezettségéhez, tartalmi sajátosságaihoz igazodva, a kutatás és tájékoztatás céljainak megfelelően kiegészíti, részletezi, és a használhatóság, a levéltári tájékoztatás érdekében feltáró jellegű segédleteket, adatbázisokat készít.”↩︎
Természetesen nem szabad megfeledkeznünk az iratok digitális formában történő publikálásának ezt megelőző módjáról, a DVD-n kiadott forrásgyűjteményekről sem, amelyek részletes ismertetésétől itt most eltekintünk.↩︎
A reprezentáció egy dokumentum újrakódolását és átalakítását jelenti ugyanabban vagy másfajta médiumban. Ez vizuális szinten általában képi reprodukcióval, szöveges szinten pedig átírással történik.↩︎
Szövegkritika alatt azt a folyamatot értjük, amely tudományos céllal foglalkozik a szóban forgó dokumentummal, és segíti annak megértését. Azaz megfelelő szabályokat alkalmaz például az átírás során, amelyek érintik a helyesírás, az írásjelek, szövegjavítások kérdéskörét, és eldönti, hogy a szöveg mely objektumaihoz kapcsol jegyzeteket. Emellett a szerkesztett szöveget különböző kiegészítő megjegyzésekkel, szövegrészekkel látja el, és ezzel segíti a kontextualizálását, érthetővé és értelmezhetővé teszi azt a mai olvasó számára.↩︎