Jak vzniká Bibliographia medica Čechoslovaca – pracovní postupy, metody a nástroje

Úvod

Bibliographia medica Čechoslovaca (BMČ) je národní registrující bibliografie z oboru lékařství a zdravotnictví.1 BMČ je kontinuálně vytvářena již od roku 1947, a to v Národní lékařské knihovně (NLK). Bibliografické záznamy BMČ se od roku 1977 zaznamenávají ve strukturované podobě do databáze, nyní ve formátu MARC 21. K 1. lednu 2017 databáze BMČ obsahovala 900 000 bibliografických záznamů. Je volně dostupná v portálu Medvik a v Centrálním portálu knihoven. 93 % bibliografických záznamů BMČ tvoří záznamy článků.

Excerpční základna

Na analytické úrovni jsou do BMČ v úplnosti excerpovány odborné biomedicínské časopisy a sborníky z konferencí, které vycházejí na území ČR, a práce českých autorů, které byly publikovány v zahraničí. Výběrově jsou do BMČ zařazovány i kapitoly z kolektivních monografií. Snahou NLK je i podchycení populárně-naučných článků z oboru lékařství a zdravotnictví v denících a společenských periodicích, ale nejedná se o systematickou činnost. Do BMČ jsou excerpovány tištěné i elektronické zdroje. Z jiných oborů jsou do BMČ výběrově excerpovány tituly, kde pravidelně publikují články z oboru biomedicína (např. Vesmír, Živa apod.).

Proces zpracování

Analytické zpracování do BMČ se dělí na tři části, které spadají do pracovní činnosti dvou oddělení NLK:

  • jmenný popis (zajišťuje Oddělení zpracování fondů);

  • věcný popis (zajišťuje Oddělení věcného popisu a tezauru MeSH);

  • formálně-logické kontroly, exporty a importy dat (zajišťuje Oddělení zpracování fondů).

Bibliografické záznamy jsou vytvářeny v systému DAWINCI/Medvik ve formátu MARC 21. Jmenné zpracování BMČ probíhá pěti různými způsoby:

  1. přebírání strukturovaných metadat ve formátu XML přímo od nakladatelů nebo správců elektronických verzí publikací (cca 30 odborných periodik);

  2. kopírování z elektronických obsahů nebo plných textů (většina periodik);

  3. ruční přepis (zejména sborníky a kolektivní monografie);

  4. stahování bibliografických záznamů zahraničních bohemik z databáze PubMed prostřednictvím portálu NCBI (National Center for Biotechnology Information, Národní středisko pro biotechnologické informace);

  5. stahování bibliografických záznamů prostřednictvím protokolu Z39.50 (např. Bibliographia medica Slovaca, ANL, OVID Medline).

Používání různých způsobů zpracování článků do BMČ je náročnější na organizaci práce. Nejefektivnější jsou způsoby č. 1 a 4, kdy ze strany NLK dochází pouze k formálně-logickým kontrolám a k provázání personálních autorů s autoritními záznamy. U způsobu č. 1 je nutná ještě věcná indexace, způsob č. 4 je včetně deskriptorů MeSH v českém jazyce.

Pro ruční přepis využíváme skenovací pera, jejichž pomocí se skenují a přímo do databáze ukládají tištěné údaje (název, autor apod.) včetně diakritiky. Pro práci se skenovacím perem je nutná určitá zručnost, ale pokud se s ním pracovník naučí pracovat, stane se užitečným pomocníkem, který zefektivňuje jmenný popis.

Pro zdrojový dokument, který prochází analytickým zpracováním, je v systému DAWINCI/Medvik vytvořen tzv. MUSTR záznam, který se kopíruje pro určité číslo nebo svazek:

Ukázka MUSTR záznamu pro časopis Vox Pediatriae
Ukázka MUSTR záznamu pro časopis Vox Pediatriae

Jmenný popis

Pro jmenný popis článků jsou předpřipravené tzv. šablony, které obsahují pole/podpole, které jsou společné pro určitý typ dokumentu (článek, kapitola v knize, abstrakt ve sborníku apod.). Katalogizátor použije MUSTR záznam v kombinaci s příslušnou šablonou a doplní názvové a autorské údaje, citaci zdrojového dokumentu, další informace a identifikátory.

Názvové údaje zahrnují název, názvy v dalších jazycích, případně jiné vhodné názvy, jména autorů.

U autorských údajů vždy provedeme kontrolu, zda neexistuje personální autorita. Pokud existuje, vzájemně je propojíme, pokud ne, vytváříme návrh autoritního záznamu, do kterého uvedeme příjmení a jméno autora, citaci práce, pro kterou se autorita vytváří, pracoviště, tituly, případně další informace, které jsou vhodné; u každého autora zapíšeme afiliaci, pokud je v dokumentu uvedena; roli vyplňujeme pouze tehdy, je-li jiná než autor (např. dotazovatel, dotazující apod.).

Ukázka návrhu autoritního záznamu
Ukázka návrhu autoritního záznamu

Citaci zdrojového dokumentu zapisujeme do strukturovaného interního pole BMC, z něhož se automaticky generují pole 773 a 008. Pro zdrojový dokument musí vždy existovat záznam na monografické nebo seriálové úrovni (identifikátor zdrojového dokumentu je v podpoli x pole BMC).

Další informace zapisujeme, pokud jsou k dispozici. Jedná se např. o URL plného textu, abstrakt nebo o poznámkové údaje.

Dále zapisujeme nebo přebíráme všechny dostupné identifikátory (DOI, identifikátor PubMed, tj. PMID, identifikátor grantové zprávy atd.).

Ukázka hotového záznamu s využitím MUSTR záznamu a šablony pro zápis článků s věcnou indexací
Ukázka hotového záznamu s využitím MUSTR záznamu a šablony pro zápis článků s věcnou indexací

Pro interní potřeby používáme pole 999, LZP, BMC a BAS. Do pole 999 uvádíme stav záznamu. Může nabývat čtyř hodnot:

  • min = jmenný popis;

  • kom = jmenný popis a věcná indexace;

  • ok = finální verze záznamu;

  • ret = retro záznam.

Pole LZP používáme pro statistické údaje a k jednoznačné identifikaci zpracovatelů jmenného a věcného popisu.

Citaci zdrojového dokumentu zapisujeme do interního pole BMC, které obsahuje čtrnáct podpolí.

Podpole pole BMC
Podpole pole BMC

Při vyplňování podpolí pole BMC vynecháváme zkratky pro ročník, číslo, stránky apod., zkratky zapisujeme do podpole Číslo pouze u mimořádných příloh (např. supl.). Strany a číslo online verze používáme pouze tehdy, liší-li se od tištěného vydání. Do názvu zdrojového dokumentu u časopisů používáme klíčový název seriálu.

Pole BAS používáme pro určení typu dokumentu pro portál Medvik.

Typy dokumentu v poli BAS
Typy dokumentu v poli BAS

Věcné zpracování

Věcné téma v článcích je zachyceno deskriptory tezauru Medical Subject Headings (MeSH) v případné kombinaci s klíčovými slovy. Pro použití tezauru MeSH u článků využíváme metodiku databáze Medline. Každému článku je přiřazen minimálně jeden deskriptor. Publikační typy (např. biografie, přehledy, komentář) a geografické deskriptory používáme pouze tehdy, je-li to vhodné. Věcnou indexaci je vždy možné doplnit klíčovými slovy. Podle metodiky databáze Medline u většiny odborných článků používáme tzv. check tagy (lidé, zvířata, pohlaví, věkové skupiny, těhotenství apod.). Hlavní téma článku označujeme hodnotou 1 (primární) v prvním indikátoru pole 650. Neindexují se pouze abstrakta.

Nástroje

Pro zpracování BMČ používáme řadu softwarových nástrojů, které usnadňují a zefektivňují pořizování dat. Hlavními nástroji jsou MEDVIK API, PubMed-BMČ, Centrum administračních aplikací Medvik a Autoarchivace.

MEDVIK API je softwarový nástroj, který umožňuje výměnu bibliografických metadat a souborů ve formátu PDF a je využíván pro přebírání bibliografických metadat přímo od nakladatelů/vydavatelů.

PubMed-BMČ je nástroj umožňující přebírání bibliografických záznamů z databáze PubMed včetně jejich konverze do formátu MARC 21 a převodu anglických deskriptorů MeSH na jejich české ekvivalenty. V portálu NCBI má NLK pro účely přebírání zahraničních bohemik z databáze PubMed vytvořen uživatelský účet, který umožňuje mít dlouhodobě uložen složitý rešeršní dotaz, pomocí něhož vyfiltrujeme práce českých autorů.

Centrum administračních aplikací Medvik je webová aplikace pro administraci a evidenci přebíraných záznamů a plných textů od českých nakladatelů/vydavatelů.

Ukázka aplikace Centrum administračních aplikací Medvik
Ukázka aplikace Centrum administračních aplikací Medvik

Autoarchivace je webová aplikace, díky které je k bibliografickému záznamu v BMČ možné nahrát plný text a zveřejnit ho pod licencí Creative Commons (CC).

Personální zajištění

V roce 2017 se na vytváření BMČ podílí přibližně třináct pracovních úvazků NLK: čtyři úvazky jsou na jmenný popis, další čtyři úvazky na věcný popis a zbylých pět úvazků na další činnosti (organizace práce, vývoj aplikací, práce s daty, formálně-logické kontroly, supervize návrhů personálních autorit, retrospektivní doplňování, analýzy, konzultační a poradenská činnost apod.). Norma NLK na jmenný popis je patnáct minut na jeden článek. Pro věcný popis je to třicet minut na článek. Z patnácti minut na jmenný popis zabere nejvíce času ověření personální autority, případně vytvoření jejího návrhu (u odborných článků bývá i více než deset autorů, ověřují se všichni). Norma je samozřejmě pouze orientační a platí pro čistý přepis, u přebíraných záznamů záleží, jak je časově náročné např. provázání s jmennými autoritami apod.

NLK ročně vytvoří přibližně 35 000 40 000 bibliografických záznamů. Vývoj počtu zpracovaných článků v posledních čtyřech letech je zachycen v tab. 1.

Tab. 1: Počet zpracovaných článků za roky 2013–2016

Rok

Počet vytvořených jmenných záznamů

Počet vytvořených jmenných záznamů s věcným zpracováním

Počet importovaných záznamů

Počet záznamů z retrospektivní konverze

Počet záznamů stažených přes Z39.50

Celkem

Celkem s věcnou indexací

2016

21 802

12 985

7 515

7 567

2

36 886

18 019

2015

27 843

14 184

8 409

4 267

49

40 568

19 355

2014

24 852

15 276

9 239

5 261

415

39 767

18 308

2013

25 353

14 384

6 283

7 236

644

39 516

17 679

Z tabulky je patrný velký rozdíl mezi jmenným a věcným zpracováním. Ten je způsobem zejména tím, že v posledních letech došlo díky novým softwarovým nástrojům k urychlení jmenného zápisu. V roce 2017 přibližně 150 000 záznamů článků nemá věcnou indexaci. Do budoucna je nutné vyřešit rozdíl mezi jmenným a věcným zpracováním posílením věcného popisu.

Důležitou činností při zpracování BMČ je evidence a organizace práce, je nutné zajistit nová čísla pro zpracování (tištěně nebo elektronicky), případně urgovat chybějící čísla (nebo zajistit jejich náhradu kopií, skenem apod.). Vzhledem k tomu, že zpracování BMČ probíhá ve dvou odděleních NLK, je nutná koordinace činností mezi odděleními. Časově a personálně náročná je supervize návrhů jmenných autorit, které vznikají při zpracování BMČ. V roce 2017 je to přibližně 33 000 nezpracovaných návrhů. Po přechodu z katalogizačních pravidel AACR2 na RDA je supervize návrhů jmenných autorit časově ještě náročnější (vyplňuje se více údajů). Pro katalogizátora je při zpracování článků často obtížné autora správně identifikovat, zejména pokud není uvedeno jeho celé jméno a pracoviště (na některých pracovištích pracují i dva lidé stejného jména i příjmení).

Plné texty

V NLK se dlouhodobě snažíme, aby z bibliografické citace článku byl snadný bezbariérový přístup k plnému textu. Uvádění URL ze stránek nakladatele se ukázalo jako neefektivní (častá změna adres, nefunkční odkazy apod.). NLK s řadou českých nakladatelů/vydavatelů uzavřela smlouvu o poskytování elektronických zdrojů a tím zajistila možnost uložení plného textu článku nebo čísla do Digitální knihovny NLK. Odkaz na plný text do Digitální knihovny NLK je vytvářen virtuálně z metadat plného textu a pole BMC článku. Uživatel tak má přímo v bibliografickém záznamu informaci o tom, zda existuje plný text v Digitální knihovně NLK. Obdobně to funguje i u dokumentů, které NLK do elektronické podoby převádí digitalizací. Plný text může být k článku připojen i samotným autorem, a to pomocí aplikace Autoarchivace2.

Virtuální odkaz z bibliografického záznamu článku na digitální verzi tištěného časopisu
Virtuální odkaz z bibliografického záznamu článku na digitální verzi tištěného časopisu

Propojení článku se zdrojovým dokumentem

U starších záznamů BMČ byla citace zdrojového dokumentu ve formě zkratky. Bohužel po padesáti letech je někdy velice obtížné určit, co vlastně zkratka znamená (přestože ke každému ročníku existoval seznam zkratek a pro vytváření zkratek existují i pravidla). Nyní je pravidlem, že pro každý zdrojový dokument musí existovat vlastní záznam, přestože ho knihovna nevlastní. Součástí záznamu článku je tak i identifikátor zdrojového dokumentu. Pro tyto účely bylo nutné se rozhodnout, jak budeme postupovat u seriálů, kde většina seriálů měla v databázi NLK jeden záznam pro tištěnou verzi a jeden záznam pro verzi elektronickou. Nakonec jsme se přiklonili k praxi americké Národní lékařské knihovny (National Library of Medicine, NLM), která pro obě verze vytváří pouze jeden záznam. V databázi NLK došlo ke sloučení všech záznamů tištěných verzí periodik se záznamy elektronických verzí. Ve formátu MARC 21 se bohužel nepodařilo zajistit použití národního podpole pro poznámku k ISSN (ve formátu UNIMARC je použití této poznámky ve standardním podpoli pole ISSN) tak, jako to mají např. v NLM. Sloučení záznamů uvítali zejména uživatelé, z jednoho záznamu seriálu mají přístup k tištěné i k elektronické (případně i digitalizované) verzi.

Retrokonverze

V elektronické podobě vytváří NLK záznamy článků již od roku 1977. Přestože záznamy nebyly vytvářeny ve formátu MARC, byly všechny bez jakýchkoliv ztrát převedeny nejdříve do formátu UNIMARC a později do formátu MARC 21. Starší záznamy (od roku 1947) byly postupně různými metodami převedeny do elektronické podoby. Ročníky, které nevyšly tiskem, ale byly v NLK uchovány ve formě lístkové kartotéky, byly převedeny a tagovány metodou Retrokon, ostatní ročníky byly ručně přepsány do databázové strukturované podoby. Přepis BMČ byl částečně financován z programu VISK 5 MK ČR. Od roku 2012 provádí retrokonverzi pracovníci NLK. Podílí se na ni zejména správci fondů, kteří ji mají jako doplňkovou činnost k vlastní práci v depozitářích NLK. Cílem NLK je, aby v BMČ byla odborná biomedicínská periodika zpracována již od prvních čísel, proto i nadále budeme v retrospektivním doplňování pokračovat metodou de visu.

Bibliografická citace v tištěné BMČ
Bibliografická citace v tištěné BMČ

Bibliografická citace přepsaná do formátu MARC 21
Bibliografická citace přepsaná do formátu MARC 21

Záznamy BMČ vytvořené retrokonverzí jsou postupně doplňovány do úplné podoby včetně deskriptorů MeSH a propojení na autoritní záznamy.

Všechny tištěné výstupy BMČ byly v roce 2016 digitalizovány a jsou (jako zaměstnanecká díla NLK) volně dostupné prostřednictvím Digitální knihovny NLK.

Dostupné služby

U každého záznamu článku má uživatel možnost získat tištěnou kopii (případně i kopii elektronickou prostřednictvím Virtuální polytechnické knihovny). Vzhledem k tomu, že databáze je bibliografická, je samozřejmě (zejména u zahraničních bohemik) možné, že NLK nemá zdrojový dokument k dispozici. V těchto případech NLK zajistí kopii prostřednictvím služby MVS, MMVS nebo DDS.

Závěr

Databáze BMČ patří mezi kvalitní informační zdroje z oboru lékařství a zdravotnictví. Nespornou výhodou je nepřerušená kontinuita její tvorby od roku 1947. Organizační a personální zajištění jejího vytváření patří mezi hlavní priority NLK. Různé metody zpracování včetně současného retrospektivního zpracování kladou značné nároky zejména na koordinaci různých pracovních činností. Pro snadnější a efektivnější zpracování je nutné hledat a vyvíjet další softwarové nástroje. Nejnáročnější činností při zpracování BMČ je věcné zpracování s využitím tezauru MeSH podle metodiky databáze Medline. Snahou NLK je minimalizovat subjektivní přístup. V minulosti byl pro tyto účely např. testován nástroj MeSH on Demand, který pro potřeby věcné indexace vyvinula NLM. Aby pro článek mohl být použit tento nástroj, musí článek obsahovat abstrakt v angličtině. Přestože řada českých článků abstrakty v angličtině má, nejsou informativní (tj. s dostatkem informací, aby mohly nahradit originál), ale spíše indikativní (obsahují pouze tolik informací, aby se uživatel mohl rozhodnout, zda pro něj článek má význam). Pro věcné zpracování BMČ byly testovány i další nástroje, ale žádný se neukázal jako efektivní (většinou šlo o softwarové aplikace vzniklé v rámci doktorandských prací).

Obrazový doprovod připravila Lenka Maixnerová z Národní lékařské knihovny.

  • 1. MAIXNEROVÁ, Lenka, Filip KŘÍŽ, Helena BOUZKOVÁ, Eva LESENKOVÁ, Ondřej HORSÁK, Adéla JAROLÍMKOVÁ a Michal ZÁVIŠKA. Databáze Bibliographia medica Čechoslovaca jako zdroj informací o publikačních výstupech vědy a výzkumu ve zdravotnictví. In: MEDSOFT 2013. Praha: Creative Connections, 2013, s. 131–139. ISSN 1803-8115. Dostupné také z: http://www.creativeconnections.cz/medsoft/2013/Medsoft_2013_Maixnerova.pdf
  • 2. MAIXNEROVÁ, Lenka, Filip KŘÍŽ, Helena BOUZKOVÁ, Petr KOCNA, Eva LESENKOVÁ, Ondřej HORSÁK a Adéla JAROLÍMKOVÁ. Vytváření osobních archivů odborných publikací v portálu Medvik Národní lékařské knihovny – případová studie. In: MEDSOFT 2014. Praha: Creative Connections, 2014, s. 154–164. ISSN 1803-8115. Dostupné také z: http://www.creativeconnections.cz/medsoft/2014/Medsoft_2014_Maixnerova.pdf

Komentáře k článku