Hej Runebergare,
Vi i redaktionen har märkt att ett bra sätt att få så mycket arbete som möjligt gjort inom Projekt Runeberg är att vara lat och se till att någon annan gör arbetet. ;-) Från början gjordes all korrekturläsning av redaktionen, och det gick långsamt. Senare kunde andra hjälpa till med jobbet, och skicka felrapporter till redaktionen som i sinom tid tog hand om dem manuellt. Det gick fortare, men bara lite. Sedan ett bra tag nu kan vem som helst korrekturläsa via webben utan att redaktionen är inblandad alls, och så mycket korrekturläsning som nu har aldrig tidigare gjorts.
Det är jättebra, för då kan redaktionen ägna sig åt något annat, som att scanna in nya verk. Innan ni där ute kan korrekturläsa ett nytt verk måste det emellertid köras OCR, dvs automatisk texttolkning, så att sidbilderna konverteras till text. Detta kan också vara en flaskhals, och vi har idag några verk publicerade som saknar OCR-text.
Nu provar vi en ny metod att råda bot på denna brist. Det finns nu en ny funktion införd på prov. Vem som helst kan ladda ner alla bildfilerna för ett verk som en zip-fil (det har gått ett tag, men inte varit länkat någonstans). Sedan kan man i godan ro köra OCR hemma, om man råkar ha ett OCR-program. När man är klar med det packar man ihop alla OCR-filerna i en zip-fil och laddar upp dem till oss, så kommer de att packas upp och visas på webbsidorna, så att de går att korrekturläsa.
På URL:http://runeberg.org/upload.pl?mode=ocrlist finns en lista över de verk vi har som idag saknar OCR-texter. På sidan finns länkar där man kan ladda hem alla bilderna till ett verk och andra länkar man kan använda för att ladda upp OCR-filer för ett verk. Notera att man behöver bredband för att ladda hem bildfilerna, för det är ganska stora filer det handlar om. Det har också tillkommit en länk "(download)" i sidfoten för alla sidor inom ett verk, och via den kan man också hitta motsvarande länkar.
Nu kan vi i redaktionen förhoppningsvis låta er andra sköta en del av OCR-jobbet, och själva scanna ännu fler nya verk eller skriva nya funktioner.
Hans