Den 6 november skrev Holger:
Dansk presse beretter at det kan være billigere at transkribere, end at scanne+OCR+korrekturlæse: http://politiken.dk/VisArtikel.iasp?PageID=406499 Er det dog rigtigt?
I artiklen jämförs kostnaden för att låta kineser transkribera med kostnaden för att scanna och låta danska akademiker korrekturläsa. Scanning kan göras rätt billigt, kanske 1 krona per sida, men att låta danska akademiker korrekturläsa kan kosta 100 gånger mer. Enligt artikeln har det kostat 800.000 danska kronor att få kineserna att transkribera 37.778 spalter, vilket väl är hälften så många sidor, eller alltså 42 kronor per sida. Ekonomiskt är detta en ren vinst, men under vilka villkor arbetar kineserna?
Projekt Runeberg använder inga pengar alls för arbete, utan använder ideellt arbete, vilket på norska heter "dugnad". ("Våren 2004 ble ordet dugnad kåret til Norges nasjonalord", berättar Wikipedia, http://no.wikipedia.org/wiki/Dugnad) Det betyder att det kostar oss 0 kr per sida att scanna och korrekturläsa, men samtidigt kan vi inte garantera någon tidplan för när (eller om!) arbetet ska bli färdigt. Totalt har vi nu 368.000 boksidor i faksimil och om de hade kostat 42 kronor styck, så hade hela projektet kostat 15,4 miljoner kronor. Om vi bara räknar de korrekturlästa 75.000 sidorna, blir det 3,1 miljoner.
Svenska Akademien har låtit scanna de hittills utgivna 33 banden (1893-2002, A - Talkuminera) av sin "Ordbok över svenska språket" men texten har inte korrekturlästs fullständigt. Resultatet är sökbart på www.saob.se och är för det mesta korrekt, men inte alltid. Jag vet inte vad detta har kostat.
Svenskt Biografiskt Lexikon har hittills utkommit i 31 band (1917-2002, Abelin - Segerstedt) och finns scannat och fullständigt korrekturläst att köpa på CDROM. Enligt rykten var det en firma som gjorde korrekturläsningen till fast pris, vilket var en god affär för SBL och en dålig affär för firman. Information om verket finns på www.sblexikon.se