14 Adatvizualizáció — Flourish, Datawrapper és interpretáció

„Minden vizualizáció narratíva.”

Ebben a fejezetben két, webes böngészőben futó, kódolás nélküli vizualizációs platformot mutatunk be — a Flourish-t és a Datawrappert — a kötet korábbi fejezeteiből ismert adatokon. Mindkettőn végigmegyünk egy teljes munkameneten: adatbetöltés, ábratípus választása, finomítás, publikálás. Példaadatként az 11 fejezetben bevezetett MTA alapítói és első nemzedéke (1825–1850) prozopográfiai mintasor szolgál.

14.1 Miért kell két eszközt is megtanulni?

A történeti kutatás vizualizációs igényei két nagy csoportra oszlanak.

Publikációs grafika — tanulmány, monográfia, disszertáció figurája. Nyomtatásban is olvasható, fekete-fehérben is értelmezhető, egyértelmű, statikus, reprodukálható. Itt a Datawrapper az erősebb.

Interaktív, beágyazott felületek — online kiegészítő, honlap, konferencia-előadás képernyője. A felhasználó maga szűrhet, animáció, mozgó idősor, kattintható adatpont. Itt a Flourish a komolyabb választás.

A két eszköz nem versengő, hanem kiegészítő — ugyanazon adathalmazra a kutató mindkettőből készíthet különböző célú megjelenítést. A Datawrapper egyszerűbb és szigorúbb, a Flourish gazdagabb és szabadabb.

A kötet korábbi fejezeteiben két különböző eszköz-paradigmát láttunk: webes alkalmazás-szintű vizualizáció (D3 és Leaflet az ElitData böngészőjében, ld. 9.8), saját böngészőeszköz torteneti_adatbazis.html (ld. 11), és most a kódolás nélküli webes platformok jönnek. A választás nem abszolút sorrend, hanem a projekt mérete, a közönség és a reprodukálhatósági igény függvénye.

14.2 Flourish vs. Datawrapper — döntési mátrix

Kérdés Datawrapper Flourish
Fő profil hírlapi, tudományos grafika interaktív „story”, adat-újságírás
Regisztráció ingyenes, e-mail ingyenes alapverzió + fizetős
Export SVG, PNG, PDF (fizetős) PNG, beágyazott iframe
Interaktivitás mérsékelt (tooltip, szűrő) erős (animáció, lapozás, scrollytelling)
Template-ek kb. 20, konzervatív 40+, gazdag (network, sankey, bar chart race, arc diagram)
Térkép choropleth, szimbólum, lokátor choropleth, pont, projektált, 3D-sfera
Tanulási görbe enyhe közepes
Ideális használat cikkábra, statikus ábrázolás online kiegészítő, prezentáció

A legtöbb esetben a Datawrapper az első próba: gyors, egyszerű, publikáció-kompatibilis kimenetet ad. Ha az adatnak animációt, történetvezetést, komplex hálózatot vagy „bar chart race” mozgást szánunk, akkor a Flourish-ra érdemes váltani.

14.3 Az ábraválasztás logikája

Mielőtt bármelyik platformra feltöltenénk adatot, tisztáznunk kell, mi a vizualizáció kérdése. Ugyanarra az adatra többféle jó ábra készülhet — de rossz ábraválasztás mellett még a leggondosabb finomítás sem segít.

14.3.1 A kérdés típusa → ábratípus táblázat

Kutatási kérdés típusa Ajánlott ábra Példa a kötet adataira
Megoszlás néhány (3–7) kategórián Bar chart (vízszintes sáv) MTA felekezeti megoszlás
Megoszlás sok (8+) kategórián Horizontal bar chart vagy treemap MDP foglalkozási kategóriák
Időbeli változás egy számon Line chart MTA-tagok évenkénti választási száma
Időbeli változás több kategórián Stacked area / bar chart race MDP foglalkozások 1945–1955
Rangsor időben mozogva Bar chart race leggyakoribb elitcsoport évtizedenként
Két változó kapcsolata Scatter plot születési év vs. választási év
Eloszlás egyváltozós Histogram / density születési évek eloszlása
Földrajzi koncentráció Choropleth map egyházmegyei ösztöndíjasok (8)
Pont-jellegű földrajzi Symbol map MTA-tagok születési helyei
Entitások közötti hálózat Network / force-directed MTA kapcsolati gráf, ElitData-stílus
Áramlás A-ból B-be Sankey diagram foglalkozás-kategóriák átmenete időben
Hierarchikus kategóriák Treemap / sunburst MTA-osztály → foglalkozás-alcsoport

14.3.2 Mit kerüljünk

  • Pie chart 3-nál több szeleten — az arányokat az emberi szem rosszul becsli szögből. Ha megoszlás: bar chart.
  • 3D oszlop / torta — kozmetikai torzítás, semmi előnyt nem ad.
  • Kettős y-tengely két különböző skálán — ritkán indokolt, és majdnem mindig megtévesztő.
  • Word cloud kvantitatív kérdésre — a betűhossz, nem csak a szám, befolyásolja a méretet.

14.3.3 Heurisztika: 30 másodperces teszt

Készítsünk el egy ábrát, majd tegyük le, és egy kolléga nézze meg harminc másodpercig. Utána tegyük fel neki három kérdést:

  1. Mit ábrázol?
  2. Mi a figurának az egy fő állítása?
  3. Melyik adatpont (vagy kategória) a legfontosabb?

Ha a válaszok különböznek attól, amit mi magunknak gondoltunk — az ábra nem a jó típus, vagy a finomításon múlik. Ez az eljárás a nehéz adatok megértésében rendkívül hasznos, és sokkal olcsóbb, mint utólag cserélni a figurát egy lektorált tanulmányban.

14.4 Datawrapper: teljes munkamenet az MTA-adaton

Az alábbiakban egy valós kattintás-sorrendben építjük fel az MTA első 50 tagjának felekezeti megoszlás-ábráját. A demonstrációs adatbázis (11) Vallás-attribútuma a harmonizálás után három kanonikus értékre csökkent: Római katolikus, Református, Evangélikus.

14.4.1 0. lépés: regisztráció és adat-előkészítés

A app.datawrapper.de oldalon email + jelszóval regisztráljunk. Az ingyenes csomag az akadémiai használathoz bőven elegendő.

Az adatunkat a Datawrapper CSV formátumban kéri. A legegyszerűbb a harmonizált táblát Excelben pivot-táblával aggregálni, vagy kézzel egy kis kétoszlopos segédtáblát készíteni:

Felekezet,Fő
Római katolikus,31
Református,12
Evangélikus,7

(A konkrét számok a saját harmonizálás eredményétől függenek.)

14.4.2 1. lépés: New chart → Upload data

A dashboard bal felső sarkában „Create new” → „New chart”. A képernyő négy lapot mutat: Upload dataCheck & describeVisualizePublish & embed.

Az Upload data lapon három bemeneti mód:

  • Copy & paste (leggyorsabb) — Excelben jelöljük ki a két oszlopot, Ctrl+C, a Datawrapper szövegmezőjébe Ctrl+V.
  • Upload file.csv vagy .xlsx közvetlenül.
  • External link — ha az adat már publikus URL-en van.

Beillesztés után a jobb oldali előnézet azonnal megjeleníti a táblát. Kattintás: Proceed.

14.4.3 2. lépés: Check & describe

Itt a Datawrapper automatikusan felismeri az oszloptípusokat:

  • FelekezetText (kategória)
  • Number

Ha valamelyiket rosszul azonosítja, a fejléc fölötti ikonra kattintva felülírhatjuk. Ebben az esetben semmi tennivaló. Proceed.

14.4.4 3. lépés: Visualize — ábratípus választása

A bal oldalon körülbelül 20 ábratípus közül választhatunk. A 14.3.1 logikája szerint: három kategória, abszolút számok, kategória-megoszlás — a Bar chart (vízszintes sáv) a jó választás. Nem a Column chart (oszlopdiagram), mert a felekezet-nevek nem férnének el a vízszintes tengelyen; nem a Pie chart, mert három szeletnél ugyan még olvasható, de a bar chartról az arány pontosabban leolvasható.

Kattintás a Bar chart sablonra — az ábra azonnal frissül.

14.4.5 4. lépés: Refine (finomítás)

Ez a Datawrapper legfontosabb lapja. Rendszerint három-négy beállítás érdemi:

  • Appearance → Sort bars: Descending (nagyság szerint csökkenő). Így a domináns kategória kerül felülre — a könyvnek olvasható, önmagától beszélő ábrát ad.
  • Value labels: Show value labels at end of bar. Az érték a sáv végén — nem kell a tengelyre nézni.
  • Colors → Base color: semleges szürke vagy egyetlen kiemelő szín. Ha csak szám van (nem idő, nem politikai kategória), ne használjunk sok színt.
  • Grid lines: a vízszintes rácsot vegyük le, a függőleges maradhat.

14.4.6 5. lépés: Annotate (címkézés)

Az akadémiai grafikához mind a négy mező kitöltése ajánlott:

  • Title: A Magyar Tudós Társaság első 50 tagjának felekezeti megoszlása, 1825–1850
  • Description: egy mondatos lead, pl. „A harmonizált vallás-attribútum alapján; az eredeti forrásban 10 különböző írásmód szerepelt.”
  • Source: Saját adatbázis, MTA almanachok és akadémikus életrajzok alapján
  • Byline: [Készítő neve]
  • Notes: opcionális — itt érdemes megemlíteni a harmonizálási döntéseket vagy az n-t.

14.4.7 6. lépés: Layout / Design

Az ingyenes csomagban limitált, de a Layout lapon állítható: betűméret, témaszín, és hogy a figura „social share” változatához legyen-e külön crop. Publikációs célhoz a default téma szinte mindig jó — ne variáljunk.

14.4.8 7. lépés: Publish & embed

Publish chart gomb → a Datawrapper generál egy publikus URL-t (datawrapper.dwcdn.net/XYZ123/1/) és egy iframe-embed kódot. Ezen felül:

  • PNG letöltés — az ingyenes csomagban is elérhető, cikkábraként felhasználható.
  • SVG letöltés — csak a fizetős tervben. Ha SVG-re van szükség és az ingyenes csomagban vagyunk, a böngészőben az F12-es fejlesztői eszközökkel ki lehet menteni.

A publikált ábra nem törlődik automatikusan, és az URL tartósan érvényes — tehát feliratokban hivatkozhatunk rá.

A Datawrapper-munkamenet eredménye: a fenti lépések után előálló ábra illusztrációs változata. Nagyság szerint csökkenő sorrend, értékcímke a sáv végén, forrás- és n-megjelölés.

Figure 14.1: A Datawrapper-munkamenet eredménye: a fenti lépések után előálló ábra illusztrációs változata. Nagyság szerint csökkenő sorrend, értékcímke a sáv végén, forrás- és n-megjelölés.

14.5 Flourish: teljes munkamenet az MTA-adaton

A Flourish-on most ugyanezt az adatot, de egy alapvetően más kérdéssel visszülük végig: az MTA tagjainak egymás közti kapcsolatait jelenítjük meg hálózatként. Ez a feladat Datawrapperben nem is megoldható — ezért jó illusztráció arra, hol van az átjáró a két eszköz között.

14.5.1 0. lépés: regisztráció és adat-előkészítés

A app.flourish.studio oldalon email + jelszóval regisztráljunk. A „Personal” ingyenes csomag publikus adatokhoz — akadémiai használatra — megfelelő; csak a privát projekt és a csapat-funkciók fizetősek.

A hálózati ábrához két CSV kell:

nodes.csv — a személyek (csomópontok):

id,label,csoport
mta_kazinczy,Kazinczy Ferenc,irodalmár
mta_kolcsey,Kölcsey Ferenc,irodalmár
mta_toldy,Toldy Ferenc,irodalmár
mta_vorosmarty,Vörösmarty Mihály,irodalmár
mta_bajza,Bajza József,irodalmár
mta_eotvos,Eötvös József,politikus
mta_szalay,Szalay László,jogász
mta_kisfaludy_s,Kisfaludy Sándor,irodalmár
mta_kisfaludy_k,Kisfaludy Károly,irodalmár
...

edges.csv — a kapcsolatok (élek):

source,target,type
mta_kazinczy,mta_kolcsey,tanítvány
mta_kazinczy,mta_toldy,tanítvány
mta_vorosmarty,mta_bajza,kolléga
mta_eotvos,mta_szalay,kolléga
mta_kisfaludy_s,mta_kisfaludy_k,testvér

A két táblát a torteneti_adatbazis.html eszközből exportált CSV-k utófeldolgozásával is elő lehet állítani — a Rekordok fülből az id és a név kiszedhető, a Kapcsolatok fülből pedig az élek listája.

14.5.2 1. lépés: New visualization → sablon-választás

A dashboard tetején „New visualization” gomb. A Flourish most nem az adattal, hanem a sablonnal indít — ez fontos paradigma-különbség a Datawrapperhez képest. Négy fő kategória: Charts & maps, Hierarchies & networks, Time, flow, change, Story.

A kapcsolati hálózathoz a Hierarchies & networks → Network graph sablont választjuk. A sablon egy példa-adattal nyílik meg — látjuk, hogyan működik, mielőtt a sajátunkat feltöltjük.

14.5.3 2. lépés: Data lap — CSV-betöltés

A felső sávban két lap: Preview (ábra) és Data (táblázat). A Data lapra váltva két sub-fület találunk: Points (csomópontok) és Links (élek). Ez pontosan megfelel a nodes.csv és edges.csv szerkezetnek.

  • Points fül → Upload datanodes.csv. Ha már van példa-adat, a Flourish megkérdezi, hogy cseréljük-e: Replace all data.
  • Links fül → Upload dataedges.csv.

14.5.4 3. lépés: Column bindings — oszlop → szerep leképezés

A Flourish a sablonban elvárt „szerepeket” (role) a feltöltött adat oszlopaival köti össze. A jobb oldali Settings panelen:

  • PointsName (identifier) = id
  • PointsLabel = label
  • PointsColour by = csoport
  • PointsSize by = (opcionálisan üres, vagy egy mérőszám-oszlop)
  • LinksSource = source
  • LinksTarget = target
  • LinksType (for colour) = type

Preview-ra visszalépve: a force-directed szimuláció elindul, a csomópontok a csoport szerint színeződnek, az élek a típus szerint.

14.5.5 4. lépés: Preview és finomítás

A Settings panelen a leggyakoribb beállítások:

  • Physics → Link distance: ha túl közel vannak a csomópontok, növeljük.
  • Physics → Charge: taszítóerő; ha túl zsúfolt, állítsuk negatívabbra.
  • Labels → Always show labels: kikapcsolva csak hoverre jön, bekapcsolva mindig. Kutatási felületként bekapcsolás ajánlott, publikációs screenshotban kikapcsolás lehet tisztább.
  • Colours → Categorical palette: a csoport-színeket módosíthatjuk; felekezeti vagy politikai adatnál ne legyen piros/zöld-alapú paletta.

14.5.6 5. lépés: Header és footer (Annotate)

A Flourish a cím, leírás és forrás megadását külön panelen, a Header és Footer blokkban kéri:

  • Header → Title: Az MTA első nemzedékének kapcsolati hálózata, 1825–1850
  • Header → Subtitle: rövid leírás.
  • Footer → Source: forrás, n, adatgyűjtés időpontja.
  • Footer → Notes: módszertani megjegyzés.

14.5.7 6. lépés: Publish → share

Jobb felső sarokban „Export & publish”. Három kimenet érhető el:

  • Public URL: public.flourish.studio/visualisation/XXXXXX/ — bárki megnyithatja.
  • Embed code: iframe, tanulmány online kiegészítőjébe illeszthető.
  • PNG download: a pillanatnyi nézet állóképe.

Az ingyenes csomagban a vizualizáció publikus — bárki, akinek van URL-je, megnyithatja. Privát megosztáshoz fizetős terv kell.

14.5.8 7. lépés: amikor több figurát egyesítünk — Story

Ha a hálózat mellé még egy idővonalat és egy statisztikát is szeretnénk egyetlen görgetős oldalon megjeleníteni: a dashboard „New story” gombjával több korábban mentett vizualizáció fűzhető össze, és minden lépéshez külön cím + szöveg rendelhető. Ez a Flourish legerősebb funkciója publikációs kiegészítőként.

A Flourish Network graph sablon eredménye: az MTA első nemzedékének kapcsolati hálózata illusztrációs változatban. Csoport szerinti színkódolás (irodalmár, politikus, jogász, tudós), kapcsolat-típus szerinti élszínezés. Interaktív változatban a csomópontok húzhatók, a címkék hoverre jelennek meg.

Figure 14.2: A Flourish Network graph sablon eredménye: az MTA első nemzedékének kapcsolati hálózata illusztrációs változatban. Csoport szerinti színkódolás (irodalmár, politikus, jogász, tudós), kapcsolat-típus szerinti élszínezés. Interaktív változatban a csomópontok húzhatók, a címkék hoverre jelennek meg.

14.6 Vizualizáció-etika és kritika

A jó eszköz nem véd meg a rossz vizualizációtól. A leggyakoribb manipulatív vagy félrevezető minták:

Probléma Miért baj?
Csonkolt y-tengely apró különbségek drámainak látszanak
Kategória-sorrend ábécé / adatbeviteli sorrend szerint elfedi a nagyság szerinti rangsort
3D-s oszlopdiagram a háttérben lévő oszlopok optikailag kisebbnek tűnnek
Aránytalan ikonméret (pictogram) a terület kétszeres, ha a sugár is az → négyszeres szám-érzet
Szín-szemantika figyelmen kívül hagyása piros = „rossz”, zöld = „jó”; felekezeti térképen, politikai diagramon komoly félreolvasáshoz vezet
Hiányzó forrás és n az olvasó nem tudja, mennyire bízhat a figurában

A Datawrapper több ilyet alapból kizár (nem enged 3D-t, a forrás-sort kötelezően kitölteti); a Flourish szabadabb, ezért a kutatóra nagyobb felelősséget hárít.

Ellenőrző kérdések a publikálás előtt:

  • Egyértelmű-e a grafikon címéből, mire kell figyelni?
  • Szerepel-e a forrás, az n (elemszám), és az adatgyűjtés időpontja?
  • Fekete-fehér fénymásolatban is értelmes marad-e?
  • Egy olvasó, aki az adatot nem ismeri, mi alapján félreértené?
  • Mi az, amit a vizualizáció elfed (pl. időbeli változás egy pillanatkép mögött, nemi aránytalanság, regionális eltérés)?

14.7 Kutatási munkafolyamat két lépésben

Tipikus projektmenet egy történeti korpusznál:

  1. Feltáró szakasz: a kutató Datawrapperben gyorsan készít 5–10 „vázlat-grafikont” ugyanarról az adatról — más-más nézőpontból (felekezet, foglalkozás, évtized, régió). Ezek nem publikálásra készülnek, hanem a kutatási kérdés finomítására.
  2. Publikációs szakasz: kiválasztjuk azt a 2–3 figurát, amely a tanulmányban szerepelni fog, és ezeket végigvisszük a 14.6 checklistán. Ha interaktív online kiegészítőt is szeretnénk, egy-két kulcsfigurát átviszünk Flourish-ba.

Ez az eljárás hasonlít a kvalitatív kutatásból ismert „kódolás → memoírás → véglegesítés” folyamathoz: a vizualizáció is iteratív.

14.8 Összehasonlítás a korábbi fejezetekkel

Eszköz Mikor? Milyen készség kell? Reprodukálhatóság
D3.js / Leaflet (ElitData-stílus) egyedi webes felület, nagy projekt JS-ismeret, build-lánc közepes (kód igen, build-lánccal)
torteneti_adatbazis.html (ld. 11) saját prozopográfiai projekt, feltáró munkafázis nem kell kód közepes (CSV-export)
Datawrapper publikációs grafika, gyors vázlat nem kell kód közepes (CSV + PNG/SVG)
Flourish interaktív történet, prezentáció, scrollytelling nem kell kód alacsonyabb (iframe-függő)

A választás a kimenet típusának kérdése: webes alkalmazás a nagy projektekhez, saját HTML-eszköz a munkaadatbázishoz, Datawrapper / Flourish a publikus kommunikációhoz és az akadémiai figurához.

14.9 További olvasnivaló

  • Alberto Cairo: The Truthful Art (New Riders, 2016). Az adat-újságírás módszertanának alapkönyve.
  • Cole Nussbaumer Knaflic: Storytelling with Data (Wiley, 2015). Pragmatikus, üzleti fókuszú, de a tanácsai akadémiai figurára is átültethetők.
  • Edward Tufte: The Visual Display of Quantitative Information (2. kiadás, Graphics Press, 2001). A klasszikus — minimalizmus, „data-ink ratio”.
  • Datawrapper Academy: https://academy.datawrapper.de/ — rövid, gyakorlati tutoriálok.
  • Flourish Help: https://help.flourish.studio/ — sablononként lépésenkénti leírás.
  • Datawrapper Blog: https://blog.datawrapper.de/ — a „Weekly chart” rovatban számos historikus és társadalomtudományi példa található, amelyek módszertani szempontból is tanulságosak.