• Sceariusz
  • Publikacja: 18.11.2015
  • Edycja: 19.11.2015
  • 1 
Prosta digitalizacja dokumentów bibliotecznych - jak pozyskiwać i przetwarzać zasoby
Prosta digitalizacja dokumentów bibliotecznych - jak pozyskiwać i przetwarzać zasoby

  • Budżet działania: 5150 zł
  • Czas przygotowania: 60 dni
  • Czas trwania: 5 lat
  • Liczba organizatorów: 1
  • Liczba uczestników: 1
Pomysł na działanie

Na czym polegało przedsięwzięcie?

Jednym ze sposobów na poszerzenie działań bibliotecznych jest rozpoczecie prostej digitalizacji dokumentów bibliotecznych. Digitalizacja często kojarzy się z bibliotekami cyfrowymi, rozbudowanymi procedurami przetwarzania zasobów oraz bogato wyposażonymi, kosztownymi pracowniami skanowania i obróbki cyfrowych dokumentów. Oczywiście istnieją dobrze wyposażone ośrodki, lecz warto wiedzieć, że duża część utworzonych w Polsce zasobów, została przygotowana z użyciem prostego sprzętu i niedrogiego oprogramowania. O ile koszty rozbudowanych i uniwersalnych pracowni i digitalizacyjnego zaplecza można mnożyc praktycznie w nieskończoność, przygodę z digitalizacją można dobrze rozpocząć i kontynuować za stosunkowo niewielkie pieniądze. W Polsce digitalizację podejmuje wiele średnich i małych instytucji. Aby udostępniać unikatowe i ważne zasoby globalnej publiczności wielkość instytucji nie ma praktycznie znaczenia.

Paradoksalnie nie ma też istotnego znaczenia to, czy w naszej instytucji są "łatwe" do skanowania zbiory. "Łatwe" to takie, które należą do nas i najlepiej takie, które nie sa już objęte majątkowym prawem autorskim i w dobrym stanie fizycznym. Zawsze można nawiązać współpracę z innymi lokalnymi instytucjami oraz osobami prywatnymi. Szczególnie kolekcjonerskie kolekcje kryją wiele cennych dokumentów.

 

Tu też pewne zastrzeżenie : w dalszej części opisu padną nazwy konkretego oprogramowania i sprzętu. Nie mają one charakteru reklamy tych rozwiazań, lecz w zamierzeniu są wskazówkami i pomocą, opartymi na wieloletnich doświadczeniach bibliotekarzy cyfrowych, którzy zazwyczaj działają w warunkach znaczego deficytu.

Dlaczego warto?

Digitalizować warto z wielu powodów, przy czym z tych "podręcznikowych" wymienia się dwa:

  1. Digitalizacja stanowi jedną z metod ochrony zbiorów . Oczywiście zeskanowanie dokumentu nie sprawi, że jego papier będzie trwalszy i druk wyraźniejszy. Lecz cyfryzacja pozwala na bardzo wierne zarejestrowanie obrazu dokumentu i zachowanie go na przyszłość środkami nowej technologii. O ile oryginał jest cenny i już nieco nadszarpnięty zębem czasu, może on zostać wycofany z obiegu czytelniczego. W jego miejsce możemy udostępniać bogatszą w możliwości, cyfrową reprezentację dokumentu. Digitalizować także warto ze względu na:

  2. Udostępnianie treści dokumentów w postaci cyfrowej. Cyfrowy dokument ma wiele zalet: łatwo go rozpowszechniać, zapisywac na kolejnych nośnikach, umieścić w Internecie, przesłać mailem, a nawet .... wydrukować na papierze. Jeśli to dokument tekstowy, przeprowadzone rozpoznanie tekstu pozwala na jego zindeksowanie, przeszukiwanie i kopiowanie do innych programów. Jednym słowem digitalizacja zwiększa potencjał komunikacyjny dokumentu .

Warto dodać, ze digitalizacja ma ogromny potencjał promocyjny , zarówno dla instytucji ją prowadzącej, jak i udostępnianych, nieraz rzadkich i lokalnych dokumentów. Jej umiejętne rozwinięcie sprawia, że nawet mała instytucja może być lokalnym ośrodkiem współpracy z innymi instytucjami i osobami prywatnymi nad prezentacją dokumentowego bogactwa regionu. Przykładem może być Miejska i Gminna Biblioteka Publiczna w Głubczycach http://www.glubczyce.e-bp.pl/, która dzięki rozbudowaniu sieci kooperacji utworzyła i prezentuje pokaźną (ponad 3 tys.) kolekcję dokumentów w Śląskiej Bibliotece Cyfrowej: http://www.sbc.org.pl/dlibra/collectiondescription?dirids=100 i jest 4. (na 62) instytucją w ŚBC pod względem rozmiaru dokumentów. Mówiąc krótko, koledzy z Głubczyc skonstruowali "cyfrowy odkurzacz" dokumentów swojego regionu, z powodzeniem poszerzając swoją kolekcję w ŚBC.

A dlaczego mielibyśmy w ogóle skanować treści nie należące do nas? Dlatego, że i one stanowią część kulturowego, choć tylko lokalnego dziedzictwa i wiele z nich bez digitalizacji po prostu kiedyś zaginie. Są często unikatami (dokumenty prywatne, rękopisy), publikacjami niskonakładowymi i efemerydami, których szersza publiczność nie ma szans obejrzeć w postaci analogowej. Doświadczenie regionalnych bibliotek cyfrowych pokazuje, że nawet bardzo lokalne dokumenty cieszą się znaczną popularnością w świecie.

I jeszcze powód ostatni i całkiem ważny. Bo digitalizacja fajna jest! W dodatku i trendy i sexy! Przełamuje tradycyjna biblioteczną rutynę (jeśli ktoś na nią cierpi), stawia wyzwania, zmusza do ruszenia głową, przydaje nowych umiejętności, stymuluje nowe kontakty. A nieraz pozwala na pozyskanie środków projektowych lub sponsorskich dla instytucji.

W trakcie przygotowania

Przygotowanie winno iść dwoma torami:

  1. Organizacja stanowiska digitalizacji , które nie zrujnuje budżetu instytucji. W porównaniu do rozwiązań profesjonalnych, będzie miało mniejsze możliwości, ale zapewni nam możliwość zeskanowania większości dokumentów, nawet trudniejszych kodeksów. Poważnym ograniczeniem jest fizyczny format skanowanej strony i w pełni uniwersalne skanery dziełowe, dostosowane do skanowanie do rozmiaru A2 czy A1 to wydatek rzędu 100-150 tys. zł wzwyż. Ale istnieją konstrukcje formatu A4, które pozwalają na stosunkowo wygodne skanowanie połowy rozkładówki dokumentu- kodeksu. (Zatem rozkładówka takiego dokumentu może mieć A3). Skanery takie bez problemu radzą sobie z prostymi dokumentami płaskimi (fotografie, pocztówki). Koszt takiego skanera to ok. 1000 zł i różni się on zwykłego skanera płaskiego (np. za 150 zł) tym, że jest bardzo wygodny i zautomatyzowany w obsłudze, skalibrowany na szybka pracę przy podstawowej rozdzielczości 300 dpi oraz posiada dostosowana krawędź, co umożliwia bezstratne skanowanie połowy składki w rozwarciu kodeksu ok. 90-120 st. Dokumentu nie trzeba "rozpłaszczać". Przykład takiego skanera to Plustek OpticBook 3800 - http://plustek.com/pl/products/opticbook-series/opticbook-3800/ . Potrzebny jest oczywiście komputer, którego współczesny "biurowy" standard (rząd 3000 zł) będzie dostateczny dla skanowanie i obróbki. Można rzecz jasna użyć posiadanego już komputera, wówczas projekt robi się o ponad połowę tańszy. Do tego dysk twardy zewnętrzny na kopii przechowywanie plików archiwalnych (4 TB) - koszt ok. 500 zł. Oprogramowanie to darmowy XnView (http://www.xnview.com/) do obróbki graficznej i np. Finereader (ok. 650zł) do wytwarzania plików prezentacyjnych (PDF). Łącznie w wariancie "0" (gdy nie mamy nic) to 5150 zł. Jeśli użyjemy posiadanego komputera - 2150 zł.

  2. **Rozwinięcie sieci kooperacji ** - na wypadek, gdybyśmy nie dosponowali zbyt dużą ilością własnych zbiorów. Tajemnicą dobrych bibliotekarzy cyfrowych jest to, że najlepszym narzędziem docierania i "gromadzenia" zbiorów jest ... telefon komórkowy. Należy nim zadzwonić do instytucji/osoby, które mogą posiadać lub wydawać interesujące dokumenty. W mniejszej społeczności jest nawet łatwiej, bowiem często można skorzystać z mniej formalnych, prywatnych relacji. Istotna jest zmiana postrzegania problemu zasobu do skanowania z "jakie mamy dokumenty nadające się do digitalizacji" na " gdzie możemy znaleźć dokumenty do digitalizacji". A jest ich zazwyczaj bardzo dużo.

Np. inne instytucje kultury, redakcje lokalnych gazet, szkoły, urzędy (są dużym producentem treści raczej nie na sprzedaż), archiwa organizacji społecznych (np. związków zawodowych), a nawet spółdzielnie i parafie. No i oczywiście zasoby osób prywatnych.

Jest jeszcze trzecia kwestia - gdzie będziemy udostępniać cyfrowe publikacje. Wyjść jest kilka: własna strona (chociaż przy większej liczbie dokumentów staje się niefunkcjonalna), regionalna biblioteka cyfrowa (mocno polecane lecz wymaga trochę zachodu) lub udział w projekcie typu CATL. Zapowiadane są też programy BN jak POLONA CLOUD, umożliwiające utworzenie własnej BC na udostępnionej platformie sprzętowo-programowej.

W przygotowaniach należy także uwzględnić czas na zapoznanie sie dość nowa problematyką - jaką jest kwestia prawa autorskiego (PA). Digitalizacja obejmuje zazwyczaj utwory . Optymalnie jest gdy znajdują się one w tzw. domenie publicznej, tj. nie sa już objęte majątkowymi prawami autorskimi. Dzieje się tak, gdy minęło 70 lat od daty śmierci autora lub ostatniego współtwórcy utworu. Dla utworów zbiorowych (encyklopedie i periodyki) okres ten liczy się od ustalenia wydawniczego (daty wydania). Warto zapoznać się z opinią prawną nt. dokumentów w BC - http://www.ebib.pl/2005/70/stanislawska-kloc.php - tam też na końcu znajdują się przykłady umów licencyjnych dla utworów objętych prawem autorskim. Dzięki nim możemy pozyskać i udostępniać dokumenty bardziej współczesne.

Przykład szerszego ujęcia problematyki PA: http://polona.pl/item/2825048/0/

Co jest potrzebne do realizacji tego etapu?
  •   Stanowisko do digitalizacji z oprogramowaniem, tj. komputer, skaner "książkowy", dysk twardy zewnętrzny do archiwizacji (np. 4 TB), oprogramowanie graficzne (np. darmowy XnView) i kompresyjne (np. FineReader)
  •   Telefon komórkowy (ostatecznie zwykły) ;) i trochę pomysłów.
  •   Rozpoznanie, gdzie będziemy mogli udostępniać cyfrowe zasoby.
Jak krok po kroku przebiega etap przygotowań?
  1. Kupujemy sprzęt. Bezpieczniej jest to zrobic we współpracy z informatykiem, który pomoże wyspecyfikować parametry komputera. Reszta sprzętu i oprogramowania jest dość banalna w zakupie.
  2. Wybieramy własne zbiory do digitalizacji, pamiętając o ograniczeniu formatu oraz kwestii ograniczeń prawnych. Te niekiedy mozemy pokonać podpisując umowę licencyjną z posiadaczem praw. Przy zbiorch lokalnych uzyskanie takiej licencji może być stosunkowo łatwe.
  3. Rozpoznajemy chętnych do współpracy, kontaktujemy sie z osobami prywatnymi, regionalistami-kolekcjonerami, urzędami (gminy, miasta), małymi redakcjami gazet, stowarzyszeniami, związkami zawodowymi, związkami wyznaniowymi, szkołami, chórami, itp., które nam przyjdą do głowy.
  4. Szukamy możliwości udostępniania zbiorów np. w regionalnej BC lub projekcie typu CATL.
W trakcie realizacji

Gdy mamy już stanowisko - rozpoczynamy digitalizację. Digitalizacja biblioteczna to ciąg procesów: wybór dokumentu - skanowanie - korekta graficzna-wykonanie opisu i opublikowanie w Internecie (np. w BC).

Zgodnie z regułami sztuki wytwarza sie dwa rodzaje plików: archiwalne i prezentacyjne. Pliki archiwalne przeznaczone są do długoterminowego zachowania, są to skany w formacie TIFF (to standard), ewentualnie jedynie przycięte. Mają one jak najwierniej odwzorowywać zasób oryginalny i zapisuje się je przeznaczonym do tego nośniku. Z nich wytwarza sie dalej, po wykonaniu operacji ulepszających obraz (filtrowanie, ostrzenie), pliki prezentacyjne - z pomocą np. oprogramowania XnView. Tak poprawione pliki poddaje się kompresji i rozpoznaniu tekstu (najlepiej obecnie) do formatu PDF. Pliki te to materiał gotowy do udostępniania w Internecie. jeśli będą udostępnione w BC, należy użyć udostępnionej aplikacji redaktora, która jednocześnie pozwala na wykonanie opisu metadanymi wytworzonych cyfrowych dokumentów.

Co jest potrzebne do realizacji tego etapu?
  •   Człowiek, który będzie skanował, przetwarzał i publikował. I przyuczenie i praca nad dokumentami to ewidenty koszt pracy. Ale też skoro nie planujemy produkować zasobów masowo, obciążenie to można dawkować. Mozna też spróbować o zorganizowaniu wolontariatu, który może wykonać bardziej czasochłonne czynności.
  •   Uruchomione stanowisko do digitalizacji i w miare płynna jego obsługa. Wdrożenie w obsługę zazwyczaj zajmuje trochę czasu. Jeśli możemy liczyc na wsparcie nauczenie się całej ścieżki digitalnej od skanowania do publikacji w BC - to 2-3 dni (w wariancie "0" - gdy nic nie wiemy).
  •   Pozyskiwanie zasobów od innych osób i instytucji. Wyszukujemy w dalszym ciągu nowe zasoby i namawiamy na digitalizację.
Jak krok po kroku przebiega etap przygotowań?
  1. skanowanie, wytworzenie TIFF-ów archiwalnych
  2. korekta graficzna - przygotowanie zoptymalizowanej wersji (kopii) plików
  3. kompresja i OCR (dla tekstów) - wytworzenie pliku prezentacyjnego, np. typu PDF.
  4. ewentualna publikacja w sieci (w BC)
Po zakończeniu

Optymalna digitalizacja to taka, która się nigdy nie kończy ;).

DZIEL SIĘ WIEDZĄ, MNÓŻ POMYSŁY!

Co mogło być zrobione inaczej?

Jeśli zachowuje się podstawowe reguły tworzenie zasobów, zmienić można wiele. Gdy dysponujemy większymi zasobami (ilość, format) i chcemy mieć własne zaplecze, warto zainwestować np. w skanery większego formatu. Przykład https://www.avision.com/motion.asp?lgid=2&menuid=10075&prodid=121298&cat=13 lub http://plustek.com/pl/products/opticbook-series/opticbook-a300/ . Format A3, bardzo szybki i zautomatyzowany. Lecz ich koszt to ok. 4-6 tys. zł.

Jeśli zbiór do digitalizacji jest znaczny - a nie chcemy inwestować w sprzęt, można rozważyć zakup usługi digitalizacji. Lecz jej kontraktowanie, sposoby kontroli i odbioru cyfrowego zasobu od wykonawcy wykraczają poza tę inspirację.

Informacje dodatkowe

O ile digitalizację realizuje się w sposób ciągły i "na poważnie", trzeba jej przydzielić odpowiednie zasoby. Koszty to sprzęt. praca ludzi, ich przyuczenia, poszukiwanie dokumentów, etc. Ale też nie zawsze taką digitalizację trzeba wykonywać. Może być ona (w tańszym wariancie) możliwością, z której korzystamy, gdy spotkamy ciekawe zasoby, ludzi gotowych pomóc w dotarciu do nich, w ich skanowaniu i obróbce ... Digitalizacja, mimo, że dość inżynierska - ma duży potencjał społeczny. Jedno nawet niewielkie stanowisko do skanowania może wprowadzić ważny wątek do biblioteki i dać wiele radości bibliotekarzom i użytkownikom bibliotek.