Bulletin SKIP (https://bulletinskip.skipcr.cz)


Pilotní projekt zpřístupnění TDKIV v podobě propojených dat [1]

Autor: 

  • CITOVÁ, Jaroslava [2], JANSOVÁ, Linda [3]

Číslo: 

  • 2018, ročník 27, číslo 4 [4]

Rubrika: 

  • Trendy v knihovnách [5]

Klíčová slova: 

  • propojená data [6], terminologie [7]

V roce 2018 realizovala Národní knihovna ČR s využitím dotace z programu VISK 1 (financovaného z prostředků Ministerstva kultury ČR) Pilotní projekt zpřístupnění TDKIV v podobě propojených dat.

Cílem projektu bylo zvýšit vzdělávací a informační potenciál České terminologické databáze knihovnictví a informační vědy (TDKIV) [8] prostřednictvím propojených dat a zpřesnit vzájemné vazby mezi hesly. Výstupy z projektu rozšíří možnosti využití dat z TDKIV v knihovnicko-informačním prostoru i mimo něj a usnadní orientaci v databázi jako celku jak pro uživatele, tak pro odborníky, kteří se podílejí na zpracování nových hesel.

Databáze TDKIV má za sebou již poměrně dlouhou historii – vznikla v letech 2001 až 2002 v rámci projektu financovaného Ministerstvem kultury ČR. Od počátku ji po obsahové stránce spravuje Knihovnický institut Národní knihovny ČR. Nově přidávaná hesla a úpravy hesel stávajících schvaluje redakční rada TDKIV, která rovněž usměrňuje další rozvoj databáze.

Databáze je hojně využívána odbornou veřejností, je často citována nejen v odborných publikacích, ale také např. ve vysokoškolských kvalifikačních pracích. Stala se jedním ze základních pilířů formálního i neformálního vzdělávání v knihovnicko-informačních oborech v České republice.

V současné době obsahuje cca 3 200 definitivních hesel, z nichž každé obsahuje řadu dílčích údajů – od samotných termínů přes jejich ekvivalenty v češtině a angličtině, výklad a příbuzné termíny až po údaje o zpracovatelích a zpracování.

Vztah příbuznosti však uživatelům neumožňuje orientaci podle sémanticky bohatší (přesnější) vazby. V rámci projektu byly proto zjišťovány a prakticky ověřovány možnosti vytvoření těchto vazeb, a to v úzké návaznosti na prezentaci dat v prostředí sémantického webu, konkrétně v systému Wikidata [9], který může být stručně charakterizován jako svobodná databáze všeho.

Hlavním výstupem z projektu je Metodika pro zpřesňování vztahů mezi hesly v databázi TDKIV a zpřístupňování údajů v systému Wikidata [10]. Znění této metodiky, která doplňuje druhou verzi Metodického materiálu pro zpracování hesel České terminologické databáze knihovnictví a informační vědy (TDKIV) [11], schválila redakční rada TDKIV.

Při realizaci pilotního projektu byly ověřeny různé pracovní postupy, např. k části navržených zpřesněných vztahů mezi jednotlivými hesly se vyjadřovala širší skupina odborníků, k části výhradně autorka dané skupiny hesel. Jedním z hlavních výsledků, které ovlivní směřování databáze do budoucna, je skutečnost, že s ohledem na srozumitelnost vazeb mezi hesly a na propojitelnost hesel do prostředí sémantického webu je klíčové, aby jedno heslo v databázi vždy představovalo pouze jeden pojem. Členové projektového týmu se proto vyjadřovali také k tomu, jak by se mělo postupovat v případě konkrétních hesel, které obsahují dva nebo více číslovaných výkladů. Jedním z takových hesel je např. analytická anotace [12].

Do systému Wikidata byly jednak u odpovídajících již existujících položek přidány vazby na hesla TDKIV (takových položek bylo identifikováno cca 1 200), jednak byly podle potřeby vytvářeny a propojovány nové položky ve Wikidatech.

Ukázalo se také, že z velmi bohaté nabídky existujících vztahů v systému Wikidata bude pro účely propojení položek z databáze TDKIV mezi sebou postačovat relativně málo vztahů. Z velmi často používaných vztahů můžeme jmenovat např. vztahy nadtřída [13] nebo část (čeho) [14]. Praktické ověřování postupů zároveň prokázalo, že ačkoliv je systém Wikidata naplňován daty z heterogenních zdrojů a přispívají do něj tisíce uživatelů, jsou jednotlivé položky (zejména ty, které obsahují více údajů) většinou velmi dobře a konzistentně zpracovány.

Na uskutečnění projektu se podílelo celkem dvanáct odborníků nejenom z Národní knihovny, ale také z řady dalších institucí, mj. z vysokoškolských pracovišť a z jiných knihoven. Podařilo se tedy zkombinovat teoretický a praktický pohled na odbornou terminologii z knihovnictví, informační vědy i hraničních oborů.

Databáze TDKIV má díky výstupům z pilotního projektu potenciál výrazně zvýšit svou vzdělávací hodnotu a přispět ke kultivaci odborné terminologie v našem oboru a díky prostředkům sémantického webu i jejímu rozšíření mimo něj.

© Svaz knihovníků a informačních pracovníků ČR, 2017–2024
ISSN 1213-5828

URL zdroje: https://bulletinskip.skipcr.cz/vsechna-cisla/prohlizet-cisla/2018-rocnik-27-cislo-4/pilotni-projekt-zpristupneni-tdkiv-v-podobe

Odkazy
[1] https://bulletinskip.skipcr.cz/vsechna-cisla/prohlizet-cisla/2018-rocnik-27-cislo-4/pilotni-projekt-zpristupneni-tdkiv-v-podobe
[2] https://bulletinskip.skipcr.cz/vsechna-cisla/autori/citova-jaroslava
[3] https://bulletinskip.skipcr.cz/vsechna-cisla/autori/jansova-linda
[4] https://bulletinskip.skipcr.cz/vsechna-cisla/prohlizet-cisla/2018-rocnik-27-cislo-4
[5] https://bulletinskip.skipcr.cz/vsechna-cisla/rubriky/trendy-v-knihovnach
[6] https://bulletinskip.skipcr.cz/vsechna-cisla/klicova-slova/propojena-data
[7] https://bulletinskip.skipcr.cz/vsechna-cisla/klicova-slova/terminologie
[8] https://tdkiv.nkp.cz/
[9] https://www.wikidata.org/
[10] https://tdkiv.nkp.cz/docs/metodika_propojena_data_verze_1_0
[11] https://tdkiv.nkp.cz/docs/MM2013vv.docx
[12] https://aleph.nkp.cz/F/?func=direct&doc_number=000001784&local_base=KTD
[13] https://www.wikidata.org/wiki/Property:P279
[14] https://www.wikidata.org/wiki/Property:P361