Významné vědecké časopisy v národní článkové bibliografii – současný stav a výhled do budoucna

Úvod

V roce 2017 Národní knihovna ČR realizuje projekt Analytická bibliografie: koncepce národního systému a příprava vzniku odborného pracoviště v NK ČR podpořený z programu VISK 1 Ministerstva kultury ČR. Jeho cílem – jak napovídá i jeho název – je připravit koncepci nového národního systému analytické bibliografie a návrh nového odborného pracoviště v Národní knihovně ČR jako koordinačního centra nového systému v souladu se stanovenými prioritami Koncepce rozvoje knihoven ČR na léta 2017–20201.

Jedním z výstupů projektu je i vyhodnocení excerpční základny a návrh případných změn. Národní článková bibliografie obsahuje záznamy novinových a časopiseckých článků a záznamy příspěvků ze sborníků. Z časopisů jsou zastoupeny mimo jiné časopisy vědecké. Ve zmiňované Koncepci rozvoje knihoven ČR na léta 2017–2020 je v části 3. Budování knihovních fondů a informačních zdrojů uveden mj. cíl „[z]abezpečit a institucionálně ukotvit procesy systému české centrální analytické bibliografie na všech úrovních jakožto jeden z klíčových rešeršních nástrojů vznikajících přímo v prostředí knihoven a sloužících také k propagaci výstupů české vědy a výzkumu i v českém jazyce“. Aby bibliografie mohla plnit mj. výše uvedenou roli propagace výstupů české vědy i výzkumu, je nezbytné, aby v národní analytické bibliografii byly především dobře zachyceny články z vědeckých časopisů.

Metody a výsledky

V současné době existuje řada informačních zdrojů, které zpřístupňují seznamy nejvýznamnějších vědeckých časopisů. Jedná se především o:

  • citační databáze Web of Science2 a Scopus3,

  • přehled zdrojových dokumentů informačního systému ERIH (European Reference Index for the Humanities and Social Sciences) Plus4,

  • Seznam recenzovaných neimpaktovaných časopisů (periodik) vydávaných v České republice5 (v odborných kruzích i dále v tomto textu zkráceně označovaný jako pozitivní seznam).

Právě z těchto zdrojů byly získány seznamy časopisů a ty byly dále zpracovány a doplněny o další údaje. U časopisů byla zjišťována jednak míra jejich pokrytí v národní analytické bibliografii6, jednak další ukazatele, například dostupnost tištěné a online verze, průměrný počet článků, přítomnost webů časopisů ve Webarchivu7 či přidělování identifikátorů DOI.

Při zjišťování a ověřování údajů o časopisech byly využity především následující zdroje:

  • databáze českého národního střediska systému ISSN8,

  • Souborný katalog ČR – Seriály (báze SKCP)9,

  • Webarchiv,

  • systém Crossref (ten většina vydavatelů vědeckých časopisů využívá při přidělování identifikátorů DOI)10.

Zpracování dat probíhalo v dubnu až červenci 2017, veškeré údaje jsou proto aktuální k tomuto období.

Jak již bylo naznačeno, za vstupní data byly využity seznamy časopisů z citačních databází, ze systému ERIH Plus a z českého pozitivního seznamu. Zatímco pozitivní seznam byl zpracován v úplnosti, ze zbývajících zdrojů byly vždy vybrány pouze časopisy vydávané v České republice. Řada vědeckých časopisů je zařazena do více než jednoho z těchto zdrojů, při zpracování dat bylo proto nutné provést kroky vedoucí k jejich deduplikaci. Jako hlavní údaj byl v tomto směru z pochopitelných důvodů využit identifikátor ISSN (názvové údaje nebyly v jednotlivých zdrojích uváděny ve stejném znění, nicméně dobře posloužily mj. při dodatečném ověřování správnosti údajů).

Významný počet titulů vychází souběžně v tištěné a v online podobě. V těchto případech jsou u titulů obvykle uváděna jak ISSN tištěné verze, tak ISSN online verze – časopis je tedy pokládán za jeden titul (dostupný ve dvou podobách). Výjimkou je pozitivní seznam, v němž jsou tištěné a online verze časopisů zachyceny zvlášť. V předkládané analýze jsou data sjednocena tak, aby časopis vycházející v tištěné i online podobě byl považován za jeden titul. U vědeckých časopisů je totiž obvyklé, že obsah tištěné i online podoby se od sebe neliší, resp. online verze časopisu může obsahovat obsah navíc.

Z dalšího zpracování bylo vyřazeno devět časopisů, které se nepodařilo jednoznačně identifikovat nebo u nich byla ve zdrojích příslušnost k České republice uvedena evidentně chybně. K dalšímu zpracování bylo tedy vybráno celkem 774 časopisů (pokud by byly časopisy s tištěnou i online verzí počítány jako dva tituly, jednalo by se o 1 098 titulů).

Tyto časopisy vycházejí pouze tištěně, tištěně a zároveň online či pouze online. Přehled o zastoupení jednotlivých způsobů vydávání podává graf 1.

Graf 1: Vědecké časopisy podle způsobu vydávání (n = 774)
Graf 1: Vědecké časopisy podle způsobu vydávání (n = 774)

Nejčastěji se tedy vyskytují časopisy, které vycházejí pouze tištěně, nebo souběžně tištěně a online. Pro úplnost uveďme, že sedm titulů navíc vychází i na CD-ROM.

Ze 774 titulů je v národní analytické bibliografii zastoupena pouze necelá polovina, viz graf 2.

Graf 2: Zastoupení titulů v národní analytické bibliografii (n = 774)
Graf 2: Zastoupení titulů v národní analytické bibliografii (n = 774)

Titul je pokládán za přítomný i v případě, že je zastoupen např. pouze jedním záznamem. Případy, kdy jsou z titulů v bibliografii zpracovány pouze jednotlivé záznamy, jsou sice ojedinělé, nicméně je nutné podotknout, že se vyskytují. Z oněch 774 titulů jich celkem sedm bylo zastoupeno pouze jedním záznamem, 27 titulů pak jedním až 30 záznamy.

U titulů, které nejsou zastoupeny v národní článkové bibliografii a zároveň jsou vydávány i online, byl zjištěn počet článků v nejnovějším vydaném čísle. Počet byl zjišťován celkem u 228 titulů a úspěšně zjištěn u 215 titulů. Z české národní databáze ISSN byla u jednotlivých titulů zároveň zjištěna periodicita. Kombinací těchto dvou údajů bylo spočítáno, že v titulech, které nejsou v národní analytické bibliografii a zároveň jsou dostupné online, vychází přibližně necelých 7 400 článků za rok. Na jeden titul tak v průměru připadá cca 34 článků. Existují samozřejmě tituly s vysokým počtem článků (ve zkoumaném souboru se nacházelo patnáct časopisů s dvaceti a více články v čísle), ale i tituly s relativně nízkým počtem článků (ve 145 případech bylo zjištěno deset nebo méně článků na číslo).

U titulů vycházejících online byla dále zjišťována přítomnost jejich webu ve Webarchivu (v případě, že v databázi českého národního centra ISSN bylo uvedeno více URL, bylo pro tento účel vybráno první URL v pořadí). Většina z těchto titulů má svůj web archivován, u nezanedbatelné části z nich jsou však zatím archivované verze webu dostupné pouze na místě samém (v Referenčním centru Národní knihovny ČR), viz graf 3.

Graf 3: Přítomnost webů ve Webarchivu (n = 385)
Graf 3: Přítomnost webů ve Webarchivu (n = 385)

Graf se týká celkem 385 titulů (u tří webů se vyskytly chyby, např. web nebyl v době provádění sklizně dostupný apod.; tyto weby nebyly do hodnot v grafu započítány).

Téměř 40 % z titulů vycházejících online (nebo online a souběžně tištěně) přiděluje vydávaným článkům identifikátory DOI, viz graf 4. (Ke zjištění bylo využito API služby Crossref.)

Graf 4: Počet titulů podle přítomnosti identifikátorů DOI (n = 390)
Graf 4: Počet titulů podle přítomnosti identifikátorů DOI (n = 390)

Je užitečné poznamenat, že nezanedbatelný počet časopisů se nachází ve více zdrojích zároveň, tj. například nejenom v některém z citačních rejstříků, ale také v seznamu ERIH Plus nebo v pozitivním seznamu. Ve všech čtyřech zdrojích zároveň se nenachází žádný ze zkoumaných časopisů, přes tři sta se jich ovšem nachází ve dvou nebo třech zdrojích, viz graf 5.

Graf 5: Počet časopisů podle přítomnosti ve zdrojích významných časopisů (n = 774)
Graf 5: Počet časopisů podle přítomnosti ve zdrojích významných časopisů (n = 774)

Počet zdrojů, do kterých je titul zařazen, může posloužit jako užitečné vodítko při stanovování priorit analytického zpracování titulů.

Diskuse

Výsledky provedené analýzy ukázaly, že v excerpční základně národní analytické bibliografie zcela chybí přibližně polovina významných českých vědeckých časopisů. Některé ze zařazených titulů jsou navíc zpracovány fragmentárně, tj. jsou zastoupeny pouze velmi nízkým počtem záznamů. Vzhledem ke skutečnosti, že některé časopisy vycházejí pouze online nebo souběžně online a v tištěné podobě, je velmi žádoucí, aby národní analytická bibliografie poskytovala spolehlivé propojení na plné texty popsaných článků. K tomu může přispět například využívání odkazů na jejich verze sklizené Webarchivem a uvádění odkazů v podobě URL se zakomponovaným identifikátorem DOI (za funkčnost odkazu má v tomto případě odpovědnost vydavatel titulu).

K prezentovaným výsledkům je zároveň třeba přistupovat jako k výsledkům orientačním. U většiny časopisů totiž dochází v průběhu jejich životního cyklu k řadě změn – od slučování více titulů do jednoho a naopak rozdělování jednoho titulu na více titulů přes návaznost jednoho titulu na druhý (s odlišným ISSN) až po ukončení vydávání v tištěné podobě a pokračování pouze v podobě online. Tyto změny mají pochopitelně určitý vliv i na výše uvedená zjištění. S ohledem na skutečnost, že analýze bylo podrobeno téměř 800 titulů, však tato zjištění mohou být užitečná pro úvahy o dalším směřování národní analytické bibliografie, zejména její excerpční základny a doplňkově i vhodných způsobů propojování záznamů na plné texty.

Grafy zpracovala Linda Jansová z Národní knihovny ČR.

Komentáře k článku