Webinář Otevřená data v knihovnictví

Dne 10. listopadu 2021 proběhl přibližně dvouhodinový webinář nazvaný Otevřená data v knihovnictví. Akce byla součástí cyklu Informační technologie v knihovnictví, který tradičně pořádá SKIP Praha, Národní knihovna ČR, Knihovna JabokOsvobozená knihovna, z. s.

Téma webináře, tedy otevřená data, se ukázalo jako mimořádně aktuální, o čemž svědčí i počet účastníků, který dosáhl čísla 110.

Opřeme-li se o zákon o svobodném přístupu k informacím, můžeme otevřená data vymezit jako „informace zveřejňované způsobem umožňujícím dálkový přístup v otevřeném a strojově čitelném formátu, jejichž způsob ani účel následného využití není povinným subjektem, který je zveřejňuje, omezen a které jsou evidovány v národním katalogu otevřených dat”. Otevřeným datům je v obecnější podobě věnována pozornost i v terminologické databázi TDKIV.

Významnou úlohu hrají otevřená data v řadě oblastí lidské činnosti (včetně knihovnictví), jak bylo doloženo konkrétními ukázkami v rámci webináře.

Jako první přednášející na něm vystoupil Ing. Jakub Malina z Ministerstva vnitra, který si připravil stručný úvod do otevřených dat. Zdůraznil, že data veřejné správy, která vznikají za peníze daňových poplatníků, jako celek mají velkou hodnotu. Data, u kterých je to možné, by proto měla být vhodně sdílena, a to nejlépe formou otevřených dat. Ta si můžeme představit jako surovinu, na jejímž základě vznikne nějaký konkrétní výrobek (aplikace) a ten je následně využíván. Jako konkrétní příklad lze zmínit nejrůznější přehledy dat o covidu-19, které čerpají právě z otevřených dat. Užitečným startovním bodem pro bližší seznámení se s otevřenými daty je Portál otevřených dat, na němž je k dispozici i Národní katalog otevřených dat. Otevřená data je možné využívat mj. i ve vzdělávání, a to nejenom v informatice a matematice, ale i např. v dějepisu či literatuře. Výrazný potenciál mají pochopitelně i data z oblasti kultury. Zájemci o otevřená data mohou využít vzdělávací možnosti nabízené prostřednictvím Portálu otevřených dat.

Mgr. Ondřej Svoboda z Institutu umění – Divadelního ústavu ve svém příspěvku nastínil, jak k otevírání dat přistupují právě v Divadelním ústavu. Nejprve stručně přiblížil tři významné projekty Divadelního ústavu – Virtuální studovnu, Databázi divadelní architekturyČeskou divadelní encyklopedii. S daty (v počítačové podobě) v Divadelním ústavu intenzivně pracují velmi dlouho; první verze databáze DIVADLO pochází již z roku 1995. Divadelní ústav se také účastní mezinárodních projektů – lze zmínit např. Travelogue (pilotní projekt zaměřený na sdílení dat o mobilitě umění) nebo Linked Heritage (projekt věnující se agregaci digitalizovaného obsahu do Europeany). V roce 2018 se podařilo zpřístupnit první otevřenou datovou sadu Inscenace v českých divadlech po roce 1945 (viz i záznam v Národním katalogu otevřených dat). V poslední době se Divadelní ústav zaměřuje na spolupráci s Wikidaty; k dispozici jsou i konkrétní vlastnosti (identifikátory), např. identifikátor budovy divadla ve virtuální studovně IDU, jejichž prostřednictvím jsou položky Wikidat propojovány se záznamy vytvořenými v Divadelním ústavu.

Jan Cibulka, novinář působící v Českém rozhlasu a na Fakultě sociálních věd Univerzity Karlovy, na konkrétních příkladech ukázal, jak s otevřenými daty pracují datoví žurnalisté. Upozornil na rubriku Datová žurnalistika na webu iROZHLAS. Zmínil důležitost otevřených dat souvisejících s covidem-19 – v tomto směru je u nás největším dodavatelem dat Ústav zdravotnických informací a statistiky. Dalším příkladem jsou otevřená data Českého statistického úřadu, mj. data týkající se voleb. Tato data pak zpracovávají a v různé podobě zpřístupňují média; jako ukázka může posloužit průběžné volební zpravodajství v roce 2021. Právě díky novinářům začal svá data šířeji (bez zpoplatnění) zpřístupňovat i Český hydrometeorologický ústav; jako příklad zpracovaných dat může posloužit článek Data meteorologů: Česko se za posledních šedesát let ohřálo o dva stupně Celsia, v zimě a létě téměř o tři. Z oblasti zdravotnictví jsou k dispozici nejenom data o covidu-19, ale i o dalších onemocněních; díky nim vznikl např. článek Od moru ke covidu: unikátní data, jak se měnily příčiny úmrtí Čechů od císaře pána do dneška. Zpracovávají se i např. data o koncentraci prachu v ovzduší nebo data vztahující se k justici (např. její rychlosti). Pokud potřebná data nejsou dostupná, novináři se jich umějí domoci i soudní cestou. Český rozhlas je navíc sám subjektem, který publikuje otevřená data, viz i Národní katalog otevřených dat nebo GitHub, kde jsou dostupné zdrojové kódy článků.

Mgr. Lenka Maixnerová z Národní knihovny ČR představila aktuální stav zpřístupňování dat produkovaných touto knihovnou a plány v této oblasti do budoucna. V Národní knihovně ČR vzniká přibližně dvacet různých databází různého charakteru – od bibliografických přes autoritní po faktografické. V roce 2021 byla za účelem vytvoření pravidel pro bezproblémové užití databází Národní knihovny ČR externími subjekty, na jejichž základě bude možné databáze knihovny zpřístupnit pod vhodnou veřejnou licencí a poskytovat je jako otevřená data, zřízena speciální pracovní skupina. Při analýze situace v oblasti zpřístupňování dat bylo zjištěno, že situace se u různých databází liší; některé databáze také vznikají ve spolupráci s dalšími subjekty – pořizovatelem databáze je v tomto případě nicméně vždy Národní knihovna ČR. Různá byla také praxe vztahující se přímo k poskytování dat externím subjektům; např. většině komerčních subjektů data nebyla poskytnuta, ale byla poskytnuta např. do systému VIAF, který provozuje OCLC, nebo portálu Europeana. Na základě srovnání forem zpřístupňování dat zahraničních národních knihoven je vyvíjena snaha o zpřístupnění databází pod licencí (resp. pomocí nástroje) CC0 (to se na jaře 2022 u několika databází již úspěšně podařilo, pozn. aut.).

Obsah webináře shrnuli sami přednášející, konkrétně J. Malina, O. Svoboda a L. Maixnerová, když se v závěrečné diskusi vyjádřili ke třem otázkám:

  • Proč jsou pro Vás otevřená data jako téma důležitá?

  • Které nástroje (zákony, doporučení, návody apod.) jsou při otevírání dat podle Vašich zkušeností nejužitečnější?

  • Proč by se instituce financované z veřejných prostředků měly snažit svá data zpřístupňovat jako otevřená?

Pokud se týká odpovědi na první otázku, tedy proč jsou otevřená data důležitá, J. Malina podtrhl velký potenciál, který otevřená data skýtají a který může přispět ke zlepšení kvality života společnosti. O. Svoboda připomněl, že motivací ke zveřejňování otevřených dat může být právě to, že budou moci být dále využita, a že zpřístupňování dat je výhodné jak pro instituce, tak pro uživatele. L. Maixnerová zmínila, že co vzniká z peněz daňových poplatníků, by také daňoví poplatníci měli mít možnost v plné míře využívat.

V případě druhé otázky, tedy které nástroje jsou při otevírání dat nejužitečnější, J. Malina zdůraznil roli Portálu otevřených dat. O. Svoboda vyzdvihl důležitost metodické podpory z Ministerstva vnitra, klíčovou úlohu konkrétních jednotlivců při otevírání dat a využívání možností připojovat se v roli partnerů k různým projektům. L. Maixnerová rovněž ocenila podporu ze strany Ministerstva vnitra, ale i Ministerstva kultury a v neposlední řadě spolupráci s Wikidaty, kdy je díky získané zpětné vazbě možné v datech odhalovat skryté chyby, opravovat je a tím svá data dále zkvalitňovat.

V rámci odpovědi na třetí otázku, tj. proč by se instituce financované z veřejných prostředků měly snažit svá data zpřístupňovat jako data otevřená, J. Malina využil termín „multiplikační efekt”, který zazněl v chatu, a užitečnost motivace příklady z praxe. Zmínil rovněž, že otevřená data se v souvislosti s novelizacemi zákona o svobodném přístupu k informacím postupně stávají nejenom možností, ale i povinností. Podle O. Svobody otevírání dat může institucím pomoci k určité obrodě, k zakořenění nové myšlenky, že data nejsou vlastnictvím jednotlivců. L. Maixnerová uvedla, že otevřená data slouží i jako podpora vědy, výzkumu, vzdělávání a průmyslu. Skutečnost, že o digitální data obecně (nejenom ta skutečně otevřená) je ze strany veřejnosti velký zájem, názorně doložilo i významné rozšíření přístupu k Národní digitální knihovně v souvislosti s uzávěrami z důvodu pandemie.

Nezbývá tedy než doufat, že webinář zástupce knihoven a dalších paměťových institucí přesvědčil, že otevřená data jsou důležitým prvkem informačního prostředí a že stojí za to být nejenom tím, kdo je využívá (např. zprostředkovaně čtením článků datových novinářů), ale i tím, kdo je sám poskytuje.

Záznam z webináře je k dispozici na youtubovém kanálu SKIP:

Odkazy na prezentace najdete na webové stránce akce.

V roce 2022 proběhne v rámci cyklu Informační technologie v knihovnách další webinář, který bude zaměřen na přístupnost knihovních dat. Uskuteční se v úterý 8. listopadu a jste na něj srdečně zváni!

Komentáře k článku