Archivuje web vaší knihovny Webarchiv?

Archivace českého webu

Archivace webových stránek není v dnešní době žádnou novinkou. Problematice shromažďování, uchování, ochrany a zpřístupnění elektronických online zdrojů se paměťové instituce věnují více než dvacet let. Z dnešního pohledu se to může zdát jednoduché, nicméně na přelomu milénia tomu tak nebylo. S narůstajícím objemem dokumentů publikovaných na internetu bylo stále více zřejmé, že se jedná o část národního kulturního dědictví, kterou je třeba trvale uchovat a zpřístupnit nejen současným uživatelům, ale i těm budoucím. Otázka, jak naložit s nově vznikajícími internetovými zdroji, vyvstávala stále palčivěji.

V České republice archivaci webu řeší Webarchiv (oddělení Národní knihovny ČR) od roku 1999. Národní knihovnu ČR lze považovat za jednu z prvních evropských institucí, která tuto problematiku otevřela. Začátky nebyly zcela jednoduché. Nejprve se jednalo o projekt, na němž spolupracovala s Národní knihovnou ČR Moravská zemská knihovna a Ústav výpočetní techniky Masarykovy univerzity. Bylo vytvořeno technické zázemí, pracovní tým se mohl rozrůstat a začal navazovat mezinárodní kontakty. V současné době je Webarchiv součástí organizační struktury Národní knihovny ČR. Hlavními úkoly Oddělení archivace webu jsou vytváření archivních kopií webových stránek, jejich uložení na paměťová média, zpřístupnění těchto kopií, kontrola kvality, výměna poznatků v rámci mezinárodní odborné komunity, vytváření kontinuální sbírky zdrojů aj.  Je však třeba mít stále na paměti, že se jedná o činnost, která je závislá na dostupné technologii a platné legislativě.

Klíčovým krokem pro tvorbu webového archivu je volba strategie sklízení. Tuto činnost lze přirovnat k akviziční politice knihovny. S ohledem na obrovský objem dat zveřejněných na internetu bylo již od počátku webového archivu jasné, že bude nutná kombinace více metodik a přístupů. První z nich je celoplošná sklizeň. Jejím cílem je v daném termínu sklidit pokud možno veškeré webové stránky umístěné na české doméně .cz. Snahou je zachycení elektronických dokumentů české národní provenience v určitém časovém úseku, tedy v době, kdy sklizeň probíhá, což mohou být řádově dny. Celoplošnou sklizní naplňuje  Webarchiv koncepci Národní knihovny ČR o konzervačním poslání knihovny jako instituce odpovědné za uchování úplného národního dědictví pro budoucí generace. Celoplošné sklizně probíhají zpravidla jednou nebo dvakrát do roka. Jedná o proces automatický; nevýhodou je poměrně povrchní sklizeň zdrojů a velmi obtížná kontrola kvality.

Druhým přístupem k archivaci webových stránek je výběrový přístup, který se na rozdíl od výše zmíněného neobejde bez intelektuální práce kurátorů. Zdroje mohou být vybírány a následně sklízeny na základě oborového vymezení; v takovém případě hovoříme o výběrové sklizni, nebo na základě relevance k určité události; pak se jedná o sklizně tematické. Výběrové sklizně zahrnují webové stránky vybrané na základě předem stanovených kritérií. Prioritou je bohemikální určení zdroje; po obsahové stránce jsou upřednostňovány zdroje s významnou kulturní, vědeckou či společenskou hodnotou. Zařazovány jsou například weby vládních organizací, ministerstev, akademických institucí, vědeckých organizací apod. Z hlediska žánrů se soustředíme na odborná periodika, vědecké a výzkumné zprávy, vládní nařízení, specializované weby, blogy aj.  Při budování sbírky se vychází z metody Konspektu, která předpokládá možnost rozdělení oblastí lidského konání  do 26 předmětových kategorií. Každému zdroji je pak přidělena právě jedna kategorie. Dá se říci, že takto vytvořená sbírka kvalitních webových zdrojů představuje reprezentativní soubor zdrojů české internetové produkce. 

Webarchiv a spolupráce s knihovnami

Nezanedbatelnou část webového archivu tvoří rovněž stránky knihoven a oborově spřízněných institucí, programů či projektů. Řadu webových stránek knihoven již archivujeme. Veřejný online přístup k archivním kopim je však umožněn pouze u těch zdrojů, jejichž vydavatelé vyjádřili souhlas se zpřístupněním – uzavřeli licenční smlouvu nebo svůj web vystavili pod licencí Creative Commons. Ostatní jsou dostupné pouze v Referenčním centru Národní knihovny ČR v Klementinu.

Rádi bychom ke spolupráci při tvorbě webového archivu přizvali knihovny a pobídli je nejen k navržení vlastních webů pro dlouhodobou archivaci do Webarchivu, ale i k navrhování dalších hodnotných webů, například místních významných organizací, aby tak napomohly k ochraně kulturního dědictví. Zjistit, zda-li jsou stránky archivované, můžete zadáním URL (popřípadě její části) nebo klíčového slova (např. „knihovna“) do vyhledávacího pole na adrese http://www.webarchiv.cz/. Následně se vám zobrazí seznam archivovaných verzí (viz tutorial). Jinou možností, jak vyhledat požadované stránky, je prohlížení záznamů archivovaných zdrojů z katalogu stránek. Katalog stránek využívá předmětová hesla Konspektu, která jsou využita i při katalogizaci celého fondu Národní knihovny ČR (stránky knihoven spadají do kategorie 12. Knihovnictví, informatika, všeobecné, referenční literatura). A protože pro každý zdroj zařazený do výběrového archivu je vytvářen katalogizační záznam, lze archivované zdroje vyhledat i v katalogu Národní knihovny ČR.

 Příklad záznamu z katalogu Národní knihovny ČR (z báze NKC) (zdroj: https://aleph.nkp.cz/F/?func=direct&doc_number=002576661&local_base=NKC, získáno 2022-08-05)
Příklad záznamu z katalogu Národní knihovny ČR (z báze NKC) (zdroj: https://aleph.nkp.cz/F/?func=direct&doc_number=002576661&local_base=NKC, získáno 2022-08-05)

V případě, že své stránky v archivu nenaleznete můžete nám zaslat své návrhy/tipy k archivaci na emailovou adresu webarchiv@nkp.cz nebo vyplnit formulář.

Komentáře k článku