Projekt Runeberg,
Jag har nu scannat 5 årgångar (1899--1903) av Svensk Läraretidning
och hunnit OCR-tolka hälften av dem. Det är en veckotidskrift med
16--24 sidor i varje nummer, eller 800--1100 sidor per årgång. Vi
har fått överta dupletter av årgångarna 1891--1917 från Örebro
universitetsbibliotek och hoppas kunna scanna allt detta.
Jag har nu grovt indexerat var de olika veckonumren börjar (52 rader
i indexet per årgång) och i detalj indexerat de två första
veckorna av 1903.
http://runeberg.org/svlartid/1903/
Med den detaljnivå jag har valt, blir det cirka 50 rader i
innehållförteckningen för varje vecka, eller 2500 rader per
årgång. Är det en rimlig nivå? Man kan gå djupare och indexera
varje annons och smånotis. Eller man kan nöja sig med en grundare
nivå och bara indexera avdelningar som "För dagen" och "Skolnyheter"
utan att förteckna varje rubrik därunder. Vad är lagom? Vad är
användbart? Eller rättare sagt: Finns det någon som orkar engagera
sig i att göra jobbet?
Som jämförelse har varje band av Nordisk familjebok ungefär 800
sidor och 5500 artiklar, som vi indexerar.
Svensk Läraretidning grundades 1882 och heter idag "Lärarnas
tidning", http://www.lararnastidning.net/
Vi hoppas kunna locka många historiskt intresserade lärare till
Projekt Runeberg med det här verket, och hoppas givetvis att de drar
med sig sina elever.
Lars Aronsson.
--
Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/
Har vi någon frivillig i Oslo? Biblioteket i Strømmen, Skedsmo
kommune har äldre norska tidskrifter att skänka bort. Det känns
överflödigt att frakta dessa till Sverige för inscanning. Det vore
bättre om någon i Oslo med omgivning kunde ta hem tidskrifterna för
att kunna scanna dem vid senare tillfälle. Det är alltså inte
nödvändigt med scanner just nu, enbart förvaring.
Svara till vår redaksjon(a)runeberg.org
Lars Aronsson.
--
Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/
Projekt Runeberg,
Igår fredag 27 augusti hade både Computer Sweden (sidan 4) och
Svensk Bokhandel (sidan 41) korta notiser om Projekt Runeberg med
anledning av vårt pressmeddelande från i somras, om att vi hade
nått 200.000 inscannade boksidor. Båda tidningarna har haft
sommaruppehåll, vilket förklarar att notiserna kom in först nu.
Lars Aronsson.
--
Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/
Projekt Runeberg,
Idag den 24 augusti 2004 uppnådde vi 40.000 korrekturlästa sidor.
Det betyder att en femtedel av våra inscannade 200.000 sidor har
blivit korrekturlästa med rutan "whole page OK" ikryssad.
Det motsvarar två hyllmeter av våra totalt tio. Men tyvärr (?) är
dessa 40.000 korrekturlästa sidor utspridda på många av våra
böcker, så vi kan inte säga att vi har två hyllmeter
korrekturlästa böcker.
Den 40.000:e korrekturlästa sidan var
http://runeberg.org/famijour/1874/0208.html
som korrekturlästes klockan 21:59 (svensk tid) av signaturen
bio2935c.
Sidans text ingår i artikeln "En lejonjagt" som handlar om
storviltjägaren William Charles Baldwin och hans äventyr i
Sydafrika, hämtad ur Svenska Familj-Journalen för år 1874.
Berättelsen är inte helt olik temat i "Elefantjägaren Hans Stark".
På sidan finns också en bild på Kung Jans port i Uppsala, som hör
till den efterföljande artikeln.
Den 40.001:a korrekturlästa sidan är den efterföljande med en nog
så dramatisk illustration av den berömde storviltjägaren.
Lars Aronsson,
projektledare.
--
Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/
Ingemar Olson wrote:
> Jag tycker att det liknar (”), men OCR-programmet har tolkat det som gåsögon
> och jag har sett att andra korrekturläsare låter det stå kvar som gåsögon.
Vad som hänt här är nästan säkert att sätteriet fått slut på riktiga gåsögon,
och har fått improvisera genom att ta en typ som liknar gåsögon, och göra vad
de kan, medan gjuteriet fått en snabb-beställning på litet mer typer.
Samma sak i skotska efternamn: M΄Adam, kommer tidigare skrevs M`Adam, som i sin tur
först skrevs M<litet upphöjt c>Adam. Man tog sedan till ` som det tecken som mest
liknade ett upphöjt c när detta saknades, och sedan missförstods detta som en
förkortningsaccent, och accenten vände rikting från '6' till '9', s.a.s.
Gåsögon är rätt i det här sammanhanget: det är det funktionen som avses, även om
man inte kunnat använda rätt typ för ändamålet.
--
Anders Thulin ath*algonet.se http://www.algonet.se/~ath
Okej, jag skulle nog ha kunnat gissa att det slutliga svaret blev:
>Vi vill ha det som mest liknar förlagan (den inscannade bilden).
Men det hjälper mig bara lite. Vad jag tycker det liknar lär inte vara samma
som vad andra tycker.
Så titta på 3:e och 5:e raden på
http://www.lysator.liu.se/runeberg/famijour/1874/0021.html .
Jag tycker att det liknar (), men OCR-programmet har tolkat det som gåsögon
och jag har sett att andra korrekturläsare låter det stå kvar som gåsögon.
Det är ju klart att det blir lättare för dig om vi alla gör det samma. Så ta
på dig din domarehatt och tala om vad du vill ha. Då kan jag sluta med
frågorna ;-) .
Ingemar
ps: vad tycker du om strecken i dikten på
http://www.lysator.liu.se/runeberg/famijour/1874/0026.html ?
Skall det bli ett minustecken eller två?
_________________________________________________________________
Designer Mail isn't just fun to send, it's fun to receive. Use special
stationery, fonts and colors.
http://join.msn.com/?pgmarket=en-ca&page=byoa/prem&xAPID=1994&DI=1034&SU=ht…
Start enjoying all the benefits of MSN® Premium right now and get the
first two months FREE*.
Projekt Runeberg,
Mycket snart måste vi skaffa mer disk och för det behöver vi
pengar. Jag vill köpa fyra stycken 200 GB diskar som vi kan
arrangera som en Linux Software RAID, vilket skulle ge oss 550 GB
användbart lagringsutrymme. Det kommer att räcka för ett helt års
tillväxt, kanske för två år.
Det kan tyckas märkligt att 4 x 200 = 550, men det beror på att en
av diskarna används för paritet eller kontrollsummor, som gör att
kombinationen kommer att fortsätta fungera även om en av diskarna
falerar, och på att dessa så kallade "200" GB diskar rymmer
200.000.000.000 bytes vilketr bara är 186 x 1024 x 1024 x 1024 bytes
eller 186 GB med filer. Och 3 x 186 = 558.
För att köpa de här diskarna och två nya kontrollerkort och
tillräckligt med backup-band, behöver vi få in 8000 kronor = 900
euro = 1060 dollar.
Gåvor till Projekt Runeberg kan sättas in på svenskt postgiro
nummer 885669-2 eller med internationell banköverföring till "SWIFT"
med BIC = NDEASESS, IBAN = SE59 9500 0099 6042 0885 6692.
Den här informationen finns nu också på vår startsida,
http://runeberg.org/
Lars Aronsson,
projektledare.
--
Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/
Project Runeberg,
(svensk text följer i nästa meddelande)
Very soon we need to buy more disk and for that we need to raise
money. I want to buy four 200 GB disks that we can configure as a
Linux Software RAID cluster that would bring us 550 GB of useful
storage. This should be sufficient for the coming year, perhaps for
two years.
It might seem odd that 4 x 200 = 550, but this is because one of the
disks is used for parity checksums, so that the combination will
continue to work even if one of the disks crashes, and because the so
called "200" GB disks hold 200,000,000,000 bytes and that is merely
186 x 1024 x 1024 x 1024 bytes or 186 GB of files. And 3 x 186 = 558.
To buy these disks and two new controller cards and enough backup
tape, we need to raise 8000 kronor = 900 euro = 1060 US dollars.
Donations to Project Runeberg can be given to Swedish "postgiro"
account 885669-2 or by "SWIFT" international bank transfer to
BIC = NDEASESS, IBAN = SE59 9500 0099 6042 0885 6692.
This information is now available on our front page,
http://runeberg.org/
Lars Aronsson,
coordinator.
--
Project Runeberg - your digital library - http://runeberg.org/