Anbytarforum

Metoder & hjälpmedel => Internet => Källor => Övriga hemsidor, databaser och program => Ämnet startat av: Jonas Magnusson skrivet 2011-12-21, 00:10

Titel: Project Runeberg
Skrivet av: Jonas Magnusson skrivet 2011-12-21, 00:10: Som säkert många vet är Project Runeberg ett digitaliseringsprojekt för Nordisk Litteratur som har förlorat sin copyright.

Det finns redan idag en hel del material ho PR som är intressant för oss släktforskare, sedan tidigare t ex Porträttgallerier, Vem är det, Vem är vem. Nu sitter jag och jobbar med att mata in ett ganska stort antal intressanta böcker som jag fått mig tillskickade. Bland annat tre herdaminnen, ett stort antal småskrifter om olika släkter plus ett flertal stora viktiga genealogiska verk.

Om man skall beskriva vägen från vanlig bok till digital bok, ser det ut så här i grova drag:

1. Skanning, bilderna skannas (minst 300dpi men helst 600dpi) och sparas som TIFF-bilder. Tidsödande.

2. Bearbetning av skannade bilder. Bilder rätas upp, snyggas till mm mm för läsbarhetens skull. Relativt snabbt gjort när man väl vet hur det skall gå till. Görs med speciell mjukvara.

3. Publicering av bilder på PR. (Skapa den digitala boken) Ladda upp filerna till PR och komplettera med grundläggande uppgifter om boken. Snabbt gjort.

4. Indexering av bok. Bokens indelning i kapitel och dess namn mm skall kopplas till de uppladdade bilderna. Detta görs via webbläsaren och är relativt enkelt när man vet hur det går till.

5. OCR, gör med speciell mjukvara på den egna datorn. Inte särskilt tidsödande.

6. OCR-text kopplas till publicerade bilder genom att ladda upp textfiler. Snabbt gjort.

7. Korrekturläsning av OCR-text. Ganska enkelt men det kan vara oerhört tidsödande beroende på kvalitén på OCR-texten och bokens omfång. Men det bidrar till en bättre sökbarhet i det publicerade materialet.

När jag nu sitter med den mängd böcker (där punkt 1 ovan redan är avklarad) som jag vill kunna lägga upp så snabbt som möjligt undrar jag om det finns några andra där ute som tycker detta är intressant och viktigt och kan tänka sig att hjälpa till med delar av detta?

Det som är ganska enkelt att hjälpa till med är indexeringen av böckerna när de väl kommit upp på webben. Som exempel tog det mig ca ett par timmar att indexera Skara Stifts herdaminne (Det vill säga skapa den sidindelning ni ser om ni klickar på länken).

Finns det även de som känner sig så pass vana vid denna typ av databearbetning att de kan tänkas hjälpa till med övriga bitar också vore det tacknämligt.

Sen så slänger jag även ut frågan ifall det finns läsare av detta som själva har skannat in böcker, kanske för eget bruk. Om de nu har förlorat sin copyright, varför inte få upp dem på webben under ordnade former. Har ni sådant material, hör gärna av er till mig!

Materialet kommer förr eller senare att landa i Project Runeberg, men det vore väl trevligare om det blev förr snarare än senare?

Mvh Jonas