Runebergister,
I helgen lyckades jag scanna in ytterligare två band av "ugglan",
nämligen band 9 och 10 (F-H). Nu återstår bara de första åtta banden.
Vi har fått in fler indexeringsbidrag, som ännu inte är omhändertagna,
och även korrekturläsning av Eichhorns konsthistoria och Hofbergs
biografiska handlexikon. Högarna av inkomna bidrag växer och endera
dagen blir redaktionen (vem? jag!?) tvungna att ta hand om dem.
Ugglan - http://runeberg.org/nf/
Hofberg - http://runeberg.org/sbh/
Eichhorn - http://runeberg.org/bildhist/
Nu börjar vi också tigga pengar. En del saker som går långsamt för
oss, skulle underlättas av pengar. Det gäller den maskinella
inscanningen och en del redaktionssysslor. Vi kan aldrig ersätta
våra frivilliga hjältar, men vi kanske kan uppmuntra dem genom att
svara i tid och ge dem någon present emellanåt. För att få medel till
detta, tar vi emot sponsring som knyts till de böcker vi har
digitaliserat. Helt enkelt tio kronor per boksida i utbyte mot
diskret omnämnande på webben. Det är samma pris för alla, men den som
är generös kan sponsra en tjockare bok. På översiktssidan för ugglan
finns nu en "sponsor"-kolumn i tabellen över vem som gjort vad för
varje band. Lite mer om våra sponsorer syns på
http://runeberg.org/admin/sponsors.html
Eichhorn är 194 sidor, Hofberg är 634 + 817 sidor och varje band av
Nordisk familjebok är cirka 800 sidor. Det har tagit oss flera år att
få dessa inscannade och OCR:ade. Att leja ut den maskinella delen av
arbetet kostar idag högst 3 kronor per boksida. Om man ska betala
timlön för de manuella momenten indexering och korrekturläsning,
kostar det däremot 50 kronor per boksida. Genom att begära 10 kronor
per boksida i sponsring kan vi täcka kostnaden för den maskinella
inläsningen, fortsätta att utveckla projektet med våra ideella
medhjälpare, och få lite pengar över till nya projekt. Varje sponsor
väljer givetvis vilket verk de vill stödja.
--
Lars Aronsson (lars(a)aronsson.se)
Projekt Runeberg - ditt digitala bibliotek - http://runeberg.org/
Vänner av Projekt Runeberg,
nedan följer en återutsändning av den allra första utåtriktade
annonseringen av Projekt Runeberg, som gjordes idag för tio år sedan.
Den kommer först på svenska, därunder på engelska. Vi räknar
projektets start från december 1992, men det blev känt i vidare
kretsar först 6 mars 1993. Av de gamla adresserna är det idag bara
min e-postadress som fortfarande fungerar. Mer information om
projektets historia finns på http://runeberg.org/admin/timeline.html
Lars Aronsson.
--
PROJEKT RUNEBERG - Nordisk litteratur på nätet sedan 1992
www.runeberg.org - redaktion(a)runeberg.org
Datum 6 mars 1993
Från Lars Aronsson <aronsson(a)lysator.liu.se>
Datorföreningen Lysator, Universitetet i Linköping
Till swnet.svenska, swnet.general,
Mötet i Lysators KOM: Litteratur och författare
På flera ställen i USA arbetas det på att scanna in skönlitterära verk
för att göra dem allmänt tillgängliga som ASCII-filer via anonym FTP
eller Gopher. Jag tycker det är synd och skam att enbart engelska
texter (som Shakespeare, King James' Bible och Alice i underlandet)
blir tillgängliga på det här viset och därför har jag börjat samla
svenska texter. Som arbetsnamn för denna hobby har jag valt:
-------
P R O J E K T R U N E B E R G
Tillkännagivande
(This announcement is also available in English)
PROJEKT RUNEBERG är ett Lysatorprojekt på initiativ av Lars Aronsson
<aronsson(a)lysator.liu.se>. Lysator är en datorförening för studenter
och anställda vid Universitetet och tekniska högskolan i Linköping.
Postadressen är Lysator, c/o Institutionen för Systemteknik,
Universitetet, 581 83 Linköping. Lysator har postgiro 88 56 69-2.
SYFTET med projektet är att fritt tillhandahålla litterära och
konstnärliga verk på skandinaviska språk i datorläsbar form. Detta
görs efter förebild av det Project Gutenberg som drivs av professor
Michael S Hart vid Illinois Benedictine College i Lisle, Illinois,
USA.
SITT NAMN har projektet lånat av den finlandssvenske författaren Johan
Ludvig Runeberg, vars Fänrik Ståls sägner är det första kompletta verk
projektet ger ut. Namnet är dessutom valt för att skapa associationer
till Project Gutenberg. De båda projekten drivs emellertid helt
oberoende av varandra.
DEN LAGLIGA GRUNDEN för Projekt Runeberg består i att upphovsrätten
aldrig gäller längre än 51 år efter en upphovsmans död. Se 43 och 44
paragraferna i lagen om upphovsrätt till litterära och konstnärliga
verk (Svensk författningssamling 1960:729, 1970:488). Det innebär att
offentliggjorda verk av bland andra August Strindberg och Selma
Lagerlöf är fria för envar att återge. Liknande lagar finns i andra
länder som ingår i Bernunionen.
SPRÅKET för de texter som hittills givits ut är svenska, men projektet
syftar även till att ge ut texter på norska, danska, isländska,
färiska och dialekter av dessa språk. Administrativa texter (som
denna) skrivs vanligen på engelska. Även bildverk, kartor, lagar och
noter kan komma i fråga för utgivning.
TECKENUPPSÄTTNINGEN har hittills varit ISO 8859-1, men om behov visar
sig finnas kan utgivna texter lätt omvandlas till ISO 646 (sju bitar)
och teckenuppsättningar för svenska MS-DOS och Apple Macintosh.
UTGIVNINGEN består hittills av Runebergs Fänrik Ståls sägner, mindre
stycken ur 1917 års översättning av Bibeln, ur den poetiska Eddan,
samt enstaka dikter och sånger av Carl Michael Bellman, Karin Boye,
Gustaf Fröding, Viktor Rydberg med flera.
BIDRAG till projektet mottages tacksamt i form av färdiga textfiler,
inscannade bildfiler eller textsidor, förlagor att scanna eller
korrekturläsning av utgivna texter. Projektet har inget akut behov av
utrustning, programvara eller pengar, men bidrag av dessa slag
mottages tacksamt av datorföreningen Lysator. Medhjälpare kan välja
att vara anonyma eller få sitt eget och/eller företagets namn omnämnt.
Även kommentarer och idéer är naturligtvis välkomna.
ÅTKOMST av projektets utgivning är i dag möjlig genom Gopher och
anonym FTP över SUNET, det svenska universitetsdatornätet. Gopher är
en distribuerad, menybaserad databas som i dag spänner över hela
Internet. Gopher-programvara utvecklas vid Universitetet i Minnesota.
Följande uppgifter kan behövas för åtkomst:
Gopher FTP
--------------------------------------------------------------
Host=gopher.lysator.liu.se HOST ftp.lysator.liu.se
Port=70 USER anonymous
Name=Projekt Runeberg PASS din(a)dator.post.adress
Type=1 DIR pub/texts
Path=1/project-runeberg FILE README
--------------------------------------------------------------
-------
Date 6 March 1993
From Lars Aronsson <aronsson(a)lysator.liu.se>
Lysator (the students' computer club), Linkoping University,
Linkoping, Sweden
To GUTNBERG mailing list, alt.etext, comp.infosystems.gopher,
nordunet.general, soc.culture.nordic
P R O J E C T R U N E B E R G
Announcement
(Detta tillkännagivande finns även på svenska)
PROJECT RUNEBERG is a Lysator project coordinated by Lars Aronsson
<aronsson(a)lysator.liu.se>. Lysator is a students' computer club at
Linkoping University in Linkoping, Sweden. The postal address is
Lysator, c/o Dept of Electrical Engineering, Linkoping University,
S-581 83 Linkoping, Sweden.
THE PURPOSE of this project is the free distribution of literary and
artistic works in Scandinavian languages in machine readable form.
This was inspired by Project Gutenberg, run by Professor Michael S
Hart at the Illinois Benedicte College in Lisle, Illinois, USA.
THE NAME of the project comes from the Finland-Swedish author Johan
Ludvig Runeberg, whose "Fanrik Stals sagner" is the first complete
work published by the project. The name was also chosen for its
similarity to Project Gutenberg. The two projects, however, are run
completely independent of each other.
THE LEGAL FOUNDATION for Project Runeberg is that the copyright to a
book or work of art has expired 51 years after the death of its
creator. See the 43rd and 44th paragraphs of the Swedish copyright
law (SFS 1960:729, 1970:488). This means that published works of
famous authors as August Strindberg and Selma Lagerlof are in the
public domain. Similar laws exist in other countries within the Berne
Union.
THE LANGUAGE of all texts published so far is Swedish, but the project
also intends to publish in Norwegian, Danish, Icelandic, Faroese, and
dialects of these languages. Texts for the project's administration
(as this one) are written in English. The project is not restricted
to literature, but pictures, maps, laws, and printed music might also
be published.
THE CHARACTER SET used so far has been ISO 8859-1, but if need be the
published texts can easily be converted to ISO 646 (seven bits) and
the Swedish character sets for MS-DOS and the Apple Macintosh.
THE PUBLISHED TEXTS so far include Johan Ludvig Runeberg's "Fanrik
Stals sagner", small parts of the 1917 Swedish translation of the
Bible, parts of the Edda Saemundar, and some songs and poems by Carl
Michael Bellman, Karin Boye, Gustaf Froding, Viktor Rydberg, and
others.
CONTRIBUTIONS to the project are graciously accepted in the form of
ready text files, scanned picture files or text images, printed
matters to scan, or by proofreading the published texts. The project
has no immediate need for equipment, software, or money, but these
kinds of contributions are graciously accepted by Lysator, the
students' computer club. Helpers can choose to be anonymous or to
have their own and/or their company's name mentioned. Comments and
suggestions are of course also welcome.
ACCESS to the published texts is possible by Gopher and by anonymous
FTP over the Internet. Gopher is a distributed, menu-oriented
database that today spans the entire Internet. Gopher software is
developed at the University of Minnesota. The following information
will be needed for access:
Gopher FTP
--------------------------------------------------------------
Host=gopher.lysator.liu.se HOST ftp.lysator.liu.se
Port=70 USER anonymous
Name=Project Runeberg PASS your(a)email.address
Type=1 DIR pub/texts
Path=1/project-runeberg FILE README
--------------------------------------------------------------
Runebergianer,
De senaste dagarna har några fler texter dykt upp, eller rättare sagt
faksimilutgåvor. Dels är det några fler band ur Nordisk familjebok,
dels några böcker *av* Ellen Key och *om* Fredrika Bremer, samt Frans
Michael Franzéns samlade dikter i sju band. Jag lade upp lite
information om detta i vår historik på sidan
http://www.lysator.liu.se/runeberg/admin/timeline.html
Det har också strömmat in korrekturlästa avsnitt av "De bildande
konsternas historia" samt "Svenskt biografiskt handlexikon" och mer
indexering av Nordisk familjebok, som jag varit lite dålig på att ta
hand om. Jag hoppas få tid till detta snart, och till dess vilar de
tryggt i Projekt Runebergs brevlåda.
Två delar av vårt projekt som går onödigt långsamt är maskinell
inscanning och texttolkning (OCR) av nya böcker. Det är också saker
som skulle kunna göras effektivt för pengar, om vi hade några, för att
inte tala om att de är långtråkiga. Däremot är korrekturläsning,
indexering, skrivandet av författarpresentationer och liknande av
flera orsaker mera lämpade för ett stort antal frivilliga medarbetare.
För att se om det kan finnas några pengar där ute, börjar vi nu
försöka jaga sponsorer och gåvor. För detta har jag lagt upp en
tacksida, som ännu inte är så lång
http://www.lysator.liu.se/runeberg/admin/sponsors.html
Lars Aronsson,
projektledare.
--
PROJEKT RUNEBERG - Nordisk litteratur på nätet sedan 1992
www.runeberg.org - redaktion(a)runeberg.org
En kort hälsning inför helgen från Projekt Runeberg,
Vårt arbete fortgår i maklig takt. Efter att jag skrev det nya
välkomstbrevet har några nya medlemmar trillat in på listan.
Välkomna!
Några av nyheterna syns på sidan http://runeberg.org/rc.pike
Den sidan behöver vi utveckla mer, och ge en mer central plats på vår
webbplats. Utöver vad som syns på den sidan, har vi uppdaterat några
författarpresentationer, och jag vet inte just nu varför inte de dyker
upp i samma sida.
Den här postlistan har i skrivande stund enbart instruktioner på
engelska, vilket jag tycker är en brist. Samtidigt kan de inte enbart
vara på svenska, för jag hoppas listan kan vända sig även till andra.
Hos Lysator (föreningen där Projekt Runeberg bor) finns även ett antal
andra postlistor, som man också kan gå med på. Ni hittar dem på
http://lists.lysator.liu.se/
Bland annat finns där en lista som heter "bokbinderi", för dem som har
denna syssla som hobby. Programvaran som sköter listorna heter
Mailman och om man går till www.google.com och söker på sitt
favoritämne och lägger till ordet mailman i sökrutan, så kan man hitta
intressanta postlistor på annat håll. Lycka till!
Lars Aronsson.
--
PROJEKT RUNEBERG - Nordisk litteratur & konst på Internet sedan 1992
mailto:runeberg@lysator.liu.se http://www.lysator.liu.se/runeberg/
Projekt Runeberg,
Jag har uppdaterat det välkomstbrev som jag skickar till dem som hör
av sig till Projekt Runebergs redaktion. Så här lyder den nya
texten. Jag vill gärna ha kommentarer. Brevet finns även på vår wiki
på sidan http://runeberg.org/wiki/Frivilliga_medarbetare
Projekt Runeberg är ett öppet och ideellt initiativ för att publicera
nordisk litteratur på Internet. Projektet startade i december 1992.
Vi har en liten redaktion vid Linköpings universitet och hundratals
frivilliga medhjälpare över hela Internet.
== Vill du hjälpa oss? ==
Du är välkommen att delta. Du förbinder dig inte till någonting och
det kostar dig ingenting, men du tjänar heller inga pengar, utan
deltar ideellt som alla andra. Tillsammans bygger vi Internets
största centrum för nordisk litteratur!
Tidvis har vår lilla redaktion haft problem att hinna med att hjälpa
alla medarbetare, med långa fördröjningar som följd. För att avlasta
redaktionen, försöker nu införa mer av "självbetjäning" och göra det
möjligt för medarbetarna att hjälpa varandra. Som medarbetare måste
du vara självgående och kunna samarbeta med andra frivilliga.
== E-postlistan ==
Våra medarbetares viktigaste hjälpmedel är e-postlistan, ett forum för
frågor, diskussioner och nyheter om allt som rör projektet. Listan är
flerspråkig, precis som hela vårt projekt. De flesta inläggen är på
svenska eller engelska. Information om listan finns på
http://lists.lysator.liu.se/mailman/listinfo/runeberghttp://runeberg.org/wiki/Listan
Den första av dessa adresser går direkt till "Mailman", som är
programvaran som driver listan. Det är där man anmäler och avanmäler
sig. Där finns också arkivet över äldre inlägg. Den andra adressen
går till en wiki-sida om listan.
== Wiki ==
Wiki är en teknik för webbsidor som vem som helst kan redigera. Det
låter lite farligt, men fungerar faktiskt väldigt bra. Projekt
Runeberg driver på prov en wiki på http://runeberg.org/wiki
Det fungerar alltså som ett gemensamt anteckningsblock för allt som
rör projektet. Här kan man skriva in saker, som direkt blir läsbara
för övriga medarbetare, utan att invänta redaktionens långsamhet. På
wikin finns en "Senast nytt"-sida som visar vilka sidor som har
uppdaterats nyligen. Wiki är lätt och roligt. Man behöver inte
kunna en massa koder eller konstigheter.
En populär wiki-sida är Önskelistan, som tar upp förslag till nya
funktioner och nytt innehåll i Projekt Runeberg.
== Nordic Authors ==
Nordic Authors är Projekt Runebergs egen samling av presentationer av
nordiska författare. Innan vi påbörjar inscanningen av en ny bok,
skriver vi en presentation av författaren. Den ska rymmas på en sida
och innehåller en levnadsbeskrivning, en förteckning över författarens
verk och hänvisningar till andra webbplatser eller källor om personen.
August Strindberg, http://runeberg.org/authors/strindbg.html
Edith Södergran, http://runeberg.org/authors/sodrgran.html
Kerstin Ekman, http://runeberg.org/authors/ekmanker.html
Sökning, http://runeberg.org/SearchPage.pike
Vi skriver även presentationer av nu levande författare, trots att vi
inte har tänkt scanna in deras böcker. Författarpresentationerna kan
bara uppdateras av redaktionen, så man måste alltså skicka in dem med
e-post. Men varje författarpresentation innehåller nu också en länk
till motsvarande wiki-sida, där alla direkt kan komplettera.
== Upphovsrätt ==
Upphovsrätten (copyright) är en lag som ger författaren ensamrätt att
publicera sina verk under hela livstiden och därefter i 70 år. Om vi
skulle börja scanna Kerstin Ekmans böcker, måste vi alltså ha hennes
tillstånd, och för att få scanna Pär Lagerkvists böcker måste vi ha
tillstånd av hans arvingar.
Men när författaren har varit död i mer än 70 år, tar upphovsrätten
slut och då är det fritt fram för oss. Det gäller till exempel Edith
Södergran (död 1923) och Hjalmar Bergman (död 1931). Dessa
författares verk är alltså "kulturellt allmängods". Därför måste vi
veta vilket år varje författare dog.
== Val av förlaga för inscanning ==
När vi ska scanna en bok och har kollat upphovsrätten, måste vi välja
en lämplig förlaga. För de flesta duger väl vilken upplaga som helst,
men om en forskare vill hänvisa till en bok, ska det helst vara första
upplagan eller en samlingsutgåva, och inte någon billig pocket.
Eftersom det är rätt mycket jobb att digitalisera en bok, så lönar det
sig att välja den bästa förlagan. Skälen för valet dokumenteras i
författarpresentationen. Eller på wikin.
== Digitala faksimilutgåvor ==
Ibland hör läsare av sig med frågor om vi har skrivit av rätt. Ska
det verkligen stå "en kuvert" i sången om Sandels i Fänrik Ståls säger
(http://runeberg.org/fstal/1k.html)? Borde det inte vara "ett"? För
att redaktionen ska slippa springa till biblioteket och kolla boken,
har vi kommit på att vi måste scanna faksimilbilder av varje textsida.
Bilderna läggs upp på webben, så att läsaren själv kan kolla vad det
egentligen stod i den tryckta boken.
Vi kan inte veta om "en kuvert" var ett tryckfel eller med avsikt.
Vårt rättesnöre är att exakt återge det som stod i den tryckta boken.
Våra äldsta elektroniska utgåvor (före 1998) har inga faksimilbilder,
och det ångrar vi idag.
För bästa resultat scannar vi i svartvitt med upplösningen 600 dpi och
sparar i formatet TIFF G4. Varje boksida blir 20 - 200 kilobyte.
Detta fungerar för svartvita böcker. Färgbilder scannas separat.
I tillägg till faksimilbilden körs också ett OCR-program (optical
character recognition) som skapar en rediterbar textfil av boksidan.
Textfilen kan innehålla läsfel och måste korrekturläsas. Eftersom
faksimilbilden finns på webben, kan boken korrekturläsas av en annan
medarbetare på andra sidan jorden.
Förutom inscanning och OCR, måste vi även upprätta ett index eller en
innehållsförteckning över kapitlen eller artiklarna i boken. För en
roman går det på två minuter, men för Nordisk familjebok tar det lite
längre tid. Läs gärna mer om det senare på
http://runeberg.org/wiki/Indexering_av_uggleupplagan
== Korrekturläsning på webben ==
Korrekturläsning direkt på webben är en nyhet under 2002, ytterligare
ett steg mot självbetjäning hos Projekt Runeberg. Vi lägger helt
enkelt upp faksimilbilden och textfilen tillsammans på webben innan
texten är korrekturläst. Under faksimilbilden finns en länk som
uppmanar läsaren att rätta eventuella fel. Direkt i ett webbformulär
kan man sedan redigera och spara texten. Idén påminner faktiskt om
wiki. Det finns även en "recent changes"-sida där man kan hålla ett
öga på vad andra medarbetare har för sig.
Systemet för korrekturläsning på webben är en prototyp och behöver
utvecklas vidare. Vi hoppas få möjlighet till detta under 2003.
Välkommen som medarbetare hos Projekt Runeberg!
Lars Aronsson,
projektledare.
--
PROJEKT RUNEBERG - Nordisk litteratur & konst på Internet sedan 1992
mailto:runeberg@lysator.liu.se http://www.lysator.liu.se/runeberg/
Jag sitter just ock kollar på sidan http://www.lysator.liu.se/runeberg/nf/,
men översikten över hur långt arbetet med de olika delarna av NF kommit.
Från när är den översikten?
Anledningen jag frågar är att band 2 av 1800-talsutgåvan inte har något
i OCR spalten, men en del, kanske all, OCR verkar finnas där när man tittar
efter.
--
Anders Thulin ath(a)algonet.se http://www.algonet.se/~ath
Project Runeberg,
The September 2002 issue of Searcher magazine, a "monthly magazine
aimed at database professionals" (i.e. librarians specializing in
online information databases), has an article titled "The past in your
pocket: digital heritage print collections in Canada and abroad" by
David Mattison. Project Runeberg is mentioned in the section on
what's being done in the Scandinavian countries.
The article,
http://www.findarticles.com/cf_0/m0DPC/8_10/90981969/p1/article.jhtml
Printable version of the article (all in one web page),
http://www.findarticles.com/cf_0/m0DPC/8_10/90981969/print.jhtml
Lars Aronsson,
coordinator.
--
PROJECT RUNEBERG - Nordic literature, art on the Internet since 1992
mailto:runeberg@lysator.liu.se http://www.lysator.liu.se/runeberg/
Lars Aronsson <lars(a)aronsson.se> wrote
> Det är elektroniska faksimilutgåvor, där bara små delar har
> OCR-tolkats. Någon gång borde vi skaffa oss ett fungerande
> OCR-program och köra OCR på allt som är inscannat.
Går det att enkelt ladda ner de inskannade sidorna (dvs. 600 dpi...)
på något sätt? (FTP eller annan bulköverföring?) Jag har grottat runt
en smula på runeberg-siten, men det är svårt att vara säker på att jag
inte missat något.
Jag är smått frestad att se hur väl FineReader klarar denna upplösningen
... blir resultatet hyfsat bra så kan väl vara användbart.
--
Anders Thulin ath(a)algonet.se http://www.algonet.se/~ath
Projekt Runeberg,
Medan jag höll på att städa på min hårddisk i veckan, hittade jag ett
par gamla verk som jag scannat in för flera år sedan, men glömt att
lägga upp i Projekt Runebergs samlingar. Att sådant kan hända!
Det handlar om två gamla Uppsala-professorer: Wilhelm Erik Svedelius
och Carl Rupert Nyblom.
Wilhelm Erik Svedelius,
"Anteckningar om mitt förflutna lif", andra utgåvan, 1894,
http://runeberg.org/svedelif/
Carl Rupert Nyblom (red.),
"Svensk literatur-tidskrift", 1865-1869
årgång 1865, http://runeberg.org/littid65/
årgång 1866, http://runeberg.org/littid66/
årgång 1867, http://runeberg.org/littid67/
årgång 1868, http://runeberg.org/littid68/
årgång 1869, http://runeberg.org/littid69/
Mer om dessa personer och verk kan man läsa i Nordisk familjebok och
skriva på wiki-sajten susning.nu.
Det är elektroniska faksimilutgåvor, där bara små delar har
OCR-tolkats. Någon gång borde vi skaffa oss ett fungerande
OCR-program och köra OCR på allt som är inscannat.
Det här är alltså ett litet avbrott i inläsningen av Nordisk
familjebok.
Lars Aronsson,
projektledare.
--
PROJEKT RUNEBERG - Nordisk litteratur & konst på Internet sedan 1992
mailto:runeberg@lysator.liu.se http://www.lysator.liu.se/runeberg/