Pilotní projekt zpřístupnění TDKIV v podobě propojených dat

V roce 2018 realizovala Národní knihovna ČR s využitím dotace z programu VISK 1 (financovaného z prostředků Ministerstva kultury ČR) Pilotní projekt zpřístupnění TDKIV v podobě propojených dat.

Cílem projektu bylo zvýšit vzdělávací a informační potenciál České terminologické databáze knihovnictví a informační vědy (TDKIV) prostřednictvím propojených dat a zpřesnit vzájemné vazby mezi hesly. Výstupy z projektu rozšíří možnosti využití dat z TDKIV v knihovnicko-informačním prostoru i mimo něj a usnadní orientaci v databázi jako celku jak pro uživatele, tak pro odborníky, kteří se podílejí na zpracování nových hesel.

Databáze TDKIV má za sebou již poměrně dlouhou historii – vznikla v letech 2001 až 2002 v rámci projektu financovaného Ministerstvem kultury ČR. Od počátku ji po obsahové stránce spravuje Knihovnický institut Národní knihovny ČR. Nově přidávaná hesla a úpravy hesel stávajících schvaluje redakční rada TDKIV, která rovněž usměrňuje další rozvoj databáze.

Databáze je hojně využívána odbornou veřejností, je často citována nejen v odborných publikacích, ale také např. ve vysokoškolských kvalifikačních pracích. Stala se jedním ze základních pilířů formálního i neformálního vzdělávání v knihovnicko-informačních oborech v České republice.

V současné době obsahuje cca 3 200 definitivních hesel, z nichž každé obsahuje řadu dílčích údajů – od samotných termínů přes jejich ekvivalenty v češtině a angličtině, výklad a příbuzné termíny až po údaje o zpracovatelích a zpracování.

Vztah příbuznosti však uživatelům neumožňuje orientaci podle sémanticky bohatší (přesnější) vazby. V rámci projektu byly proto zjišťovány a prakticky ověřovány možnosti vytvoření těchto vazeb, a to v úzké návaznosti na prezentaci dat v prostředí sémantického webu, konkrétně v systému Wikidata, který může být stručně charakterizován jako svobodná databáze všeho.

Hlavním výstupem z projektu je Metodika pro zpřesňování vztahů mezi hesly v databázi TDKIV a zpřístupňování údajů v systému Wikidata. Znění této metodiky, která doplňuje druhou verzi Metodického materiálu pro zpracování hesel České terminologické databáze knihovnictví a informační vědy (TDKIV), schválila redakční rada TDKIV.

Při realizaci pilotního projektu byly ověřeny různé pracovní postupy, např. k části navržených zpřesněných vztahů mezi jednotlivými hesly se vyjadřovala širší skupina odborníků, k části výhradně autorka dané skupiny hesel. Jedním z hlavních výsledků, které ovlivní směřování databáze do budoucna, je skutečnost, že s ohledem na srozumitelnost vazeb mezi hesly a na propojitelnost hesel do prostředí sémantického webu je klíčové, aby jedno heslo v databázi vždy představovalo pouze jeden pojem. Členové projektového týmu se proto vyjadřovali také k tomu, jak by se mělo postupovat v případě konkrétních hesel, které obsahují dva nebo více číslovaných výkladů. Jedním z takových hesel je např. analytická anotace.

Do systému Wikidata byly jednak u odpovídajících již existujících položek přidány vazby na hesla TDKIV (takových položek bylo identifikováno cca 1 200), jednak byly podle potřeby vytvářeny a propojovány nové položky ve Wikidatech.

Ukázalo se také, že z velmi bohaté nabídky existujících vztahů v systému Wikidata bude pro účely propojení položek z databáze TDKIV mezi sebou postačovat relativně málo vztahů. Z velmi často používaných vztahů můžeme jmenovat např. vztahy nadtřída nebo část (čeho). Praktické ověřování postupů zároveň prokázalo, že ačkoliv je systém Wikidata naplňován daty z heterogenních zdrojů a přispívají do něj tisíce uživatelů, jsou jednotlivé položky (zejména ty, které obsahují více údajů) většinou velmi dobře a konzistentně zpracovány.

Na uskutečnění projektu se podílelo celkem dvanáct odborníků nejenom z Národní knihovny, ale také z řady dalších institucí, mj. z vysokoškolských pracovišť a z jiných knihoven. Podařilo se tedy zkombinovat teoretický a praktický pohled na odbornou terminologii z knihovnictví, informační vědy i hraničních oborů.

Databáze TDKIV má díky výstupům z pilotního projektu potenciál výrazně zvýšit svou vzdělávací hodnotu a přispět ke kultivaci odborné terminologie v našem oboru a díky prostředkům sémantického webu i jejímu rozšíření mimo něj.

Komentáře k článku