Projekt Runeberg,
Igår fredag 27 augusti hade både Computer Sweden (sidan 4) och
Svensk Bokhandel (sidan 41) korta notiser om Projekt Runeberg med
anledning av vårt pressmeddelande från i somras, om att vi hade
nått 200.000 inscannade boksidor. Båda tidningarna har haft
sommaruppehåll, vilket förklarar att notiserna kom in först nu.
Lars Aronsson.
--
Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/
Projekt Runeberg,
Idag den 24 augusti 2004 uppnådde vi 40.000 korrekturlästa sidor.
Det betyder att en femtedel av våra inscannade 200.000 sidor har
blivit korrekturlästa med rutan "whole page OK" ikryssad.
Det motsvarar två hyllmeter av våra totalt tio. Men tyvärr (?) är
dessa 40.000 korrekturlästa sidor utspridda på många av våra
böcker, så vi kan inte säga att vi har två hyllmeter
korrekturlästa böcker.
Den 40.000:e korrekturlästa sidan var
http://runeberg.org/famijour/1874/0208.html
som korrekturlästes klockan 21:59 (svensk tid) av signaturen
bio2935c.
Sidans text ingår i artikeln "En lejonjagt" som handlar om
storviltjägaren William Charles Baldwin och hans äventyr i
Sydafrika, hämtad ur Svenska Familj-Journalen för år 1874.
Berättelsen är inte helt olik temat i "Elefantjägaren Hans Stark".
På sidan finns också en bild på Kung Jans port i Uppsala, som hör
till den efterföljande artikeln.
Den 40.001:a korrekturlästa sidan är den efterföljande med en nog
så dramatisk illustration av den berömde storviltjägaren.
Lars Aronsson,
projektledare.
--
Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/
Ingemar Olson wrote:
> Jag tycker att det liknar (”), men OCR-programmet har tolkat det som gåsögon
> och jag har sett att andra korrekturläsare låter det stå kvar som gåsögon.
Vad som hänt här är nästan säkert att sätteriet fått slut på riktiga gåsögon,
och har fått improvisera genom att ta en typ som liknar gåsögon, och göra vad
de kan, medan gjuteriet fått en snabb-beställning på litet mer typer.
Samma sak i skotska efternamn: M΄Adam, kommer tidigare skrevs M`Adam, som i sin tur
först skrevs M<litet upphöjt c>Adam. Man tog sedan till ` som det tecken som mest
liknade ett upphöjt c när detta saknades, och sedan missförstods detta som en
förkortningsaccent, och accenten vände rikting från '6' till '9', s.a.s.
Gåsögon är rätt i det här sammanhanget: det är det funktionen som avses, även om
man inte kunnat använda rätt typ för ändamålet.
--
Anders Thulin ath*algonet.se http://www.algonet.se/~ath
Okej, jag skulle nog ha kunnat gissa att det slutliga svaret blev:
>Vi vill ha det som mest liknar förlagan (den inscannade bilden).
Men det hjälper mig bara lite. Vad jag tycker det liknar lär inte vara samma
som vad andra tycker.
Så titta på 3:e och 5:e raden på
http://www.lysator.liu.se/runeberg/famijour/1874/0021.html .
Jag tycker att det liknar (), men OCR-programmet har tolkat det som gåsögon
och jag har sett att andra korrekturläsare låter det stå kvar som gåsögon.
Det är ju klart att det blir lättare för dig om vi alla gör det samma. Så ta
på dig din domarehatt och tala om vad du vill ha. Då kan jag sluta med
frågorna ;-) .
Ingemar
ps: vad tycker du om strecken i dikten på
http://www.lysator.liu.se/runeberg/famijour/1874/0026.html ?
Skall det bli ett minustecken eller två?
_________________________________________________________________
Designer Mail isn't just fun to send, it's fun to receive. Use special
stationery, fonts and colors.
http://join.msn.com/?pgmarket=en-ca&page=byoa/prem&xAPID=1994&DI=1034&SU=ht…
Start enjoying all the benefits of MSN® Premium right now and get the
first two months FREE*.
Projekt Runeberg,
Mycket snart måste vi skaffa mer disk och för det behöver vi
pengar. Jag vill köpa fyra stycken 200 GB diskar som vi kan
arrangera som en Linux Software RAID, vilket skulle ge oss 550 GB
användbart lagringsutrymme. Det kommer att räcka för ett helt års
tillväxt, kanske för två år.
Det kan tyckas märkligt att 4 x 200 = 550, men det beror på att en
av diskarna används för paritet eller kontrollsummor, som gör att
kombinationen kommer att fortsätta fungera även om en av diskarna
falerar, och på att dessa så kallade "200" GB diskar rymmer
200.000.000.000 bytes vilketr bara är 186 x 1024 x 1024 x 1024 bytes
eller 186 GB med filer. Och 3 x 186 = 558.
För att köpa de här diskarna och två nya kontrollerkort och
tillräckligt med backup-band, behöver vi få in 8000 kronor = 900
euro = 1060 dollar.
Gåvor till Projekt Runeberg kan sättas in på svenskt postgiro
nummer 885669-2 eller med internationell banköverföring till "SWIFT"
med BIC = NDEASESS, IBAN = SE59 9500 0099 6042 0885 6692.
Den här informationen finns nu också på vår startsida,
http://runeberg.org/
Lars Aronsson,
projektledare.
--
Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/
Project Runeberg,
(svensk text följer i nästa meddelande)
Very soon we need to buy more disk and for that we need to raise
money. I want to buy four 200 GB disks that we can configure as a
Linux Software RAID cluster that would bring us 550 GB of useful
storage. This should be sufficient for the coming year, perhaps for
two years.
It might seem odd that 4 x 200 = 550, but this is because one of the
disks is used for parity checksums, so that the combination will
continue to work even if one of the disks crashes, and because the so
called "200" GB disks hold 200,000,000,000 bytes and that is merely
186 x 1024 x 1024 x 1024 bytes or 186 GB of files. And 3 x 186 = 558.
To buy these disks and two new controller cards and enough backup
tape, we need to raise 8000 kronor = 900 euro = 1060 US dollars.
Donations to Project Runeberg can be given to Swedish "postgiro"
account 885669-2 or by "SWIFT" international bank transfer to
BIC = NDEASESS, IBAN = SE59 9500 0099 6042 0885 6692.
This information is now available on our front page,
http://runeberg.org/
Lars Aronsson,
coordinator.
--
Project Runeberg - your digital library - http://runeberg.org/
> > Det skulle vara bra om det fanns någonstans där man kunde se, och
> > klippa ut, enstaka problematiska ISO 8859-1 bokstäver som man
>
>När du korrekturläser har du dessa klipp-och-klisterbara tecken till
>höger om den stora inmatningsrutan, precis där de behövs.
Aha! Jag hade inte märkt det. Kanske om jag hade en "19-inch" skärm va?
> > Jag ser att det fins rätt så många (vad jag skulle kalla
> > "quotation marks" på engelska). Alltså det där som ser ut som ett
> > komma, eller snarare två kommor,
>
>Det låter som du talar om gåsögon, som ser ut »så här». De har
>position 187 decimalt eller 273 oktalt i ISO 8859-1. Det finns även
>en ovanligare variant som pekar åt andra hållet « och har nummer
>171 decimalt eller 253 oktalt. Även dessa finns klipp- och
>klisterbara till höger om inmatningsfältet vid korrekturläsning.
Jag kände inte till namnet gåsögon. Men frågan var mer vilket är riktigt.
Originalet ser ut som () fast lite lägre på linjen, men OCR har tolkat det
som (»).
Nu när jag har läst lite mer om gåsögon (t. ex. susning.nu/Citat) ser det ut
som om de skulle vara okej, även om det inte är samma tecken som i
orginalet. Men i originalen så pekar ju alla åt höger, både framför och
bakom ordet i mitten, och jag ser att svenska standarden är att peka inåt.
Det enda jag vill är att inte börja rätta sidor som bara skall bli besvär
för er senare.
Så vad vill ni ha? Om det duger med gåsögon som alla pekar till höger så är
det ju lättast.
Ingemar
_________________________________________________________________
Scan and help eliminate destructive viruses from your inbound and outbound
e-mail and attachments.
http://join.msn.com/?pgmarket=en-ca&page=byoa/prem&xAPID=1994&DI=1034&SU=ht…
Start enjoying all the benefits of MSN® Premium right now and get the
first two months FREE*.
Project Runeberg,
At the end of July, our collections contained 209755 pages in digital
facsimile, of which 37254 were proofread. This is 9436 and 2900
pages, respectively, more than the beginning of the month.
If we are to be able to double our collection in the coming year, as
we did in the last year, we will have to digitize 200,000 pages in 12
months or an average of 16,667 pages per month, so 9436 pages is not
enough. However, 7000 of the pages were scanned in the last two days
of the month, so I think we still have a good chance. The
proofreading is approaching 40,000 pages or 2 linear metres of
shelving, and this calls for some kind of celebration.
Actually, the real threat right now is that our disks are filling up.
I will return to this in another message.
The most recently scanned works are "Djurens lif", the Swedish
translation of the German zoologist A.E. Brehm's "Thierleben" from
around 1880, and 25 year runs of "Fataburen", the yearbook of Nordiska
museum in Stockholm. The latter is still in preparation and has not
yet been OCRed.
http://runeberg.org/brehm/http://runeberg.org/fataburen/
These are still a bit early to announce, and our front page for August
instead features the collected works by Henrik Ibsen (that we scanned
in June). I hope this will help us to attract more Norwegian
proofreaders and volunteers.
During July, a total of 4888 proofreading contributions (edits) were
received from 50 identified volunteers. The following volunteers were
the most active:
Edits Signature
----- ---------
1000 Steen.Roennow
694 farbror.mats (+fm)
619 agneta
602 fh
549 tomi
417 anders.thapper
94 hartwig.alpers
82 janerikz
81 elagerstroem
67 ryde
64 lars
47 christer.romson
38 publ
30 lena.meyer
30 jan.frelin
26 mats
17 klash
Edits were made to 4185 different pages in 102 different works. Most
edits were made to the following works:
Edits Work Title
----- -------- -----
1247 dbl Dansk biografisk Lexikon
893 faltskar Fältskärns berättelser
582 strindbg Samlade skrifter av August Strindberg
435 nf Nordisk familjebok
196 fribyt Fribytaren på Östersjön
117 runeberg Samlade skrifter
101 oxygen Oxygen och Aromasia
88 lenngren Samlade Skaldeförsök
84 vira Handledning i vira
79 hellas Hellas. De gamla grekernas land och folk
74 tidsford Vetenskapliga tidsfördrif
73 sarek Sarekfjällen
66 tiphyche Tidsskrift for Physik og Chemi
65 sqvinnor Anteckningar om svenska qvinnor
62 gudasaga Fädernas gudasaga m.m.
57 hvar8dag Hvar 8 dag
47 norge80 Norge. Uddrag af ældre og nyere Forfatteres Skrifter
47 hagberg Shakspeare's dramatiska arbeten
46 svstsaku Svensk stats- och samhällskunskap: Lärobok
42 aktamaka Äkta makar
--
Lars Aronsson (lars(a)aronsson.se)
Project Runeberg -- your digital library -- http://runeberg.org/