Projekt Runeberg,
Vår amerikanska förebild Project Gutenberg (http://promo.net/pg/) är
på god väg mot sitt historiska målsättning 10.000 elektroniska texter!
De vill gärna ha med några svenska / nordiska texter från oss.
Problemet är att jag vet inte vad vi kan skicka. Kravet är nämligen
att formatet ska vara korrekturläst ASCII och upphovrättsfritt. Vi
gjorde ju en massa ASCII-texter före 1996, men mycket av detta
(t.ex. Selma Lagerlöf) är idag skyddat av upphovsrätt, och mycket av
det vi gjort senare är i faksimil med ofullständig korrekturläsning.
Jag tror att exempelvis Ellen Keys och Viktor Rydbergs texter kunde
vara intressanta att sprida på detta sätt, men är det någon av dem som
är fullständigt korrekturlästa? Ge mig några förslag!
--
Lars Aronsson (lars(a)aronsson.se)
Projekt Runeberg - ditt digitala bibliotek - http://runeberg.org/
Project Runeberg,
The last message was about proofreading. This one covers other news
from Project Runeberg during May 2003.
The most important news was that the facsimile scanning of "Nordisk
familjebok" was completed, the huge Swedish encyclopedia. The last
volume was scanned in facsimile on May 11 and OCRed the same day.
Actually, one volume still lacks OCR (supplement to the 1st edition)
and needs to be rescanned before OCR can be run. And the color plates
for some volumes remain to be scanned. But the most important 2nd
edition is fully OCRed and ready for interactive proofreading. For
years to come, this will be the flagship of our collection.
http://runeberg.org/nf/
Creating a complete index of articles in this encyclopedia is still a
very important project. We are receiving more contributions all the
time, but still need more indexers.
Ten years (1869-1885 with some gaps) of the monthly magazine "Svenska
Familj-Journalen" was scanned in facsimile a few years ago, but OCR
and indexing of articles were never completed, until now. At the same
time, the URL structure was redesigned (uh-oh, we promised never to do
this!) to make each year or volume a subdirectory of the work title.
This means an overview can be found on http://runeberg.org/famijour/
and the first year is found on http://runeberg.org/famijour/1869/
where the page header contains a pointer back to the title overview.
Each year contains some 2 megabytes of text -- ready for proofreading.
The page header was slightly redesigned to allow this, replacing the
dotted list to the right with a white-on-black horizontal navigation
bar that connects to our logotype. The nav bar also contains a search
box, that currently leads directly to Google. We hope to develop this
search facility in the future. Right now there is no link to our
author search tool, http://runeberg.org/SearchPage.pike from the works
that use the new page header design.
During the last week of May, a new work was scanned, a few years of
"Personhistorisk tidskrift", a Swedish journal for personal history
and genealogic research. This title is still being published by the
society for personal history (Personhistoriska samfundet) and we will
discuss with them how best to develop this project. You can take a
look already, http://runeberg.org/pht/
--
Lars Aronsson (lars(a)aronsson.se)
Project Runeberg - free Nordic literature - http://runeberg.org/
Project Runeberg,
During May 2003, Project Runeberg's online proofreading function
received 3585 contributions from 52 identified volunteers and an
unknown number of anonymous helpers. The following were the most
active contributors:
Edits Signature
----- ---------
867 georg_galster
841 farbror.mats
479 c.toorell
103 klash
56 bengt
31 lars <-- That's me
20 soluckmann
13 lars.rolander
The daily activity can be followed on http://runeberg.org/rc.pike
and I intend to make a summary like this one after each month.
A total of 2556 pages were edited in May, some as many as 6 times.
These pages belonged to 102 different works. Here, "Nordisk
familjebok" counts as 58 different works, one for each volume. The
"work" column below is part of the URL, e.g.
http://runeberg.org/wiedgust/ Those of us who contribute actively
have come to learn these short codes. :-)
The most edited works during May were:
Edits Work Title
----- --------- ------------------------
921 wiedgust Gustav Wied, Mindeudgave
581 thamstoc Tham, Beskrifning öfver Stockholms Län
263 thamupps Tham, Beskrifning öfver Upsala län
209 fribyt Viktor Rydberg, Fribytaren på Östersjön
182 mhausen Baron Münchhausen
128 nfaa Nordisk familjebok, 1st edition, 1st volume
117 kxvtid Karl XV och hans tid
74 topesang Zacharias Topelius, Sånger
61 fbremer Fredrika Bremer, Sjelfbiografiska anteckningar
60 rydbsagn Viktor Rydberg, Sägner, berättelser och skizzer
59 sbh Hofberg, Svenskt biografiskt handlexikon
53 palmtrip August Palm, Ögonblicksbilder från en tripp...
53 erofring O W Ålund, Amerika, dess upptäckt, eröfring och...
53 doodle Emil Kleen, Ströftåg och irrfärder hos min...
48 djaknar Viktor Rydberg, De vandrande djäknarne
40 rydvaria Viktor Rydberg, Varia
37 cfd Carl Fredrik Dahlgren, Samlade skrifter
35 nfbe Nordisk familjebok, 2nd edition, 5th volume
34 ettarhos Margaret Howitt, Ett år hos Fredrika Bremer
32 thamoreb Tham, Beskrifning öfver Örebro län
32 romerske Viktor Rydberg, Romerske kejsare i marmor
31 svungdom Ellen Key, Tal till Sverges ungdom
Most volumes of Nordisk familjebok has had 5 or 6 pages proofread, but
no systematic effort can be seen yet, except for volume 1.
Some more stats are also published on
http://runeberg.org/wiki/Korrekturl%e4sning
This winter we had problems that the scripts didn't always respond. I
think all these problems are gone, and we got a reliable and stable
system running. It can now be time to develop the function further.
Currently the script doesn't set any web browser cookie, which causes
the system to forget your e-mail address everytime you leave the
proofreading function. I think we should start to offer a
(cookie-based) user registration procedure similar to what other
websites use. Your ideas and input is welcome.
--
Lars Aronsson (lars(a)aronsson.se)
Project Runeberg - free Nordic literature - http://runeberg.org/
Projekt Runeberg,
Den 10-16 november äger "den nordiska biblioteksveckan" rum.
Årets tema är "Havet & Norden". Läs mer på
http://www.bibliotek.org/se_start.asp
Tänk om vi skulle hänga på detta. Vi har ju ett halvår på oss.
Vilka verk borde vi digitalisera på tema "havet"?
Kan vi sammanställa något på http://runeberg.org/wiki/Havet
Detta är en wiki-sida, där alla kan hjälpa till och klottra idéer.
--
Lars Aronsson (lars(a)aronsson.se)
Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/
Projekt Runeberg,
Vårt nyaste tillskott är några riktigt gamla årgångar av
Personhistorisk tidskrift. Ni som släktforskar vet nog vad det
handlar om. Annars framgår det när man ser den. Vi hoppas kunna
komplettera med fler årgångar framöver, men det är lite oklart var
upphovsrätten sätter gränser för oss. Vi kommer därför att avvakta
reaktionerna innan vi går för långt.
http://runeberg.org/pht/
Också inscannat: Vår gamla textutgåva (från före 1996!) av Birger
Sjöbergs "Fridas bok" och "Fridas andra bok" har nu kompletterats med
faksimilbilder. Det är noter och det går att skriva ut som PDF!
http://runeberg.org/fridbok1/http://runeberg.org/fridbok2/
Birger Sjöberg dog 1929 och var därför en av de författare vars verk
hade varit fria, men som åter drabbades av upphovsrätt när lagen
ändrades den 1 januari 1996 (skyddet ökades från 50 till 70 år efter
dödsåret). Den 31 december 1999 blev verket varit fritt igen, men det
är först nu vi har gått vidare och kompletterat vår utgåva. Vi borde
göra detsamma med verk av Hjalmar Bergman (dog 1931) och kanske även
några andra författare.
Slutligen en skoj liten skrift från televerket om hur krångligt det
var att lägga telefonkablar, så kallade "duplexkablar" på 1920-talet.
Kanske något för hembygdsgårdarna att ta upp. Fram med paraffingrytan
och lödkolven!
http://runeberg.org/duplex/
--
Lars Aronsson (lars(a)aronsson.se)
Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/
Projekt Runeberg,
I onsdags sände Östnytt, SVT:s regionala nyheter över Södermanland,
Östergötland och Gotland, ett inslag om vårt arbete med Nordisk
familjebok. I en hel vecka (dvs fram till nästa onsdag) kan man se
inslaget på webben (kräver programmet RealPlayer), och länken till det
hittar ni givetvis på http://runeberg.org/nf/
Det finns en möjlighet att "Landet runt" kl 18.15 imorgon lördag har
med inslaget.
Nu i helgen tänkte jag försöka hinna scanna det sista bandet av
Nordisk familjebok, http://runeberg.org/nf/
Därmed skulle inscanningen vara färdig, åtminstone i svartvitt. En
del färgplanscher återstår och givetvis även det stora arbetet med
indexering och korrekturläsning. Varje vecka strömmar det in ett
eller flera bidrag till indexeringen och korrekturläsning direkt på
webben äger rum dagligen. Jag har nu uppdaterat "förordet" till vår
digitala utgåva, så att det står "har gjort" i stället för "skall
göra" på en del ställen.
I och med detta kan vi gå ut i vårsolen och fira 128-årsjubileet av
att det första häftet skickades ut till subskribenterna i maj 1875!
--
Lars Aronsson (lars(a)aronsson.se)
Projekt Runeberg - ditt digitala bibliotek - http://runeberg.org/
Projekt Runeberg,
Bara fyra band återstår nu att scanna av Nordisk familjebok. Det
första bandet scannades i maj 2000 och det andra i december 2001.
Inte mindre än sex band har scannats under mars och april 2003.
Min förhoppning är att under maj månad kunna annonsera att alla 58
banden från de två första utgåvorna är inscannade, vilket är
128-årsjubileet av utgivningen av det allra första häftet i maj 1875.
Men det som är viktigare är att jag äntligen skaffat mig ett vettigt
OCR-program, som läser ut en redigerbar text ur faksimilsidorna.
Under den senaste månaden har nästan alla band OCR-tolkats och det
betyder att mer än 200 megabyte text (34 miljoner ord) har tillkommit
på vår webbplats, som nu går att korrekturläsa via webbformulär.
Som jämförelse kan nämnas att Bibeln är 5 megabyte (800 tusen ord).
Sökmotorn Google (http://www.google.com/) har satt sina robotar i
arbete och de har tuggat i sig det mesta av detta, så vår "träffyta"
har ökats markant. När man söker hos Google på svenska ord är det
numera vanligt att man får träff i Nordisk familjebok, åtminstone om
orden är någorlunda ovanliga (som "kalospinterokromatokrene"). Vill
man vara säker på att få träff i Nordisk familjebok, kan man lägga
till ordet "familjebok" i sökrutan, för det nämns ju på varje sida.
En som fick sökträff i familjeboken är Marcus Boldemann,
kulturskribent på Dagens Nyheter. Strax före påsk ringde han och
gjorde en telefonintervju med mig, och resultatet publicerades i
onsdags den 23 april, på världsbokdagen. Artikeln finns att läsa på
http://www.dn.se/DNet/jsp/polopoly.jsp?d=1058&a=133282
Fulltextsökning är givetvis bra, men det är ett trubbigt verktyg.
Söker man på Ryssland, så hittar man alla förekomster av det ordet.
Men överst ville man ju hitta *artikeln* om Ryssland. För detta måste
vi få klart indexeringen av artiklarna. Några arbetar redan med detta,
men vi behöver bli fler. Arbetsplanen och framstegen syns i den stora
tabellen på http://runeberg.org/nf/
Kontakta redaktionen på info(a)runeberg.org om du vill hjälpa till.
Korrekturläsning via webbformulär förekommer numera dagligen. De
senaste aktiviteterna syns på sidan http://runeberg.org/rc.pike
Om man klickar "(diff)" i vänsterkanten så får man se vad som
ändrats i just den sparningen. Formatet är lite kryptiskt, och vi
hoppas utveckla den funktionen vidare.
Andra framsteg har den senaste tiden skett inom korrekturläsning av
Hofbergs "Svenskt biografiskt handlexikon" (http://runeberg.org/sbh/)
och Eichhorns "De bildande konsternas historia i kort öfversigt"
(http://runeberg.org/bildhist/). De senaste
--
Lars Aronsson (lars(a)aronsson.se)
Projekt Runeberg - ditt digitala bibliotek - http://runeberg.org/
Runebergister,
I helgen lyckades jag scanna in ytterligare två band av "ugglan",
nämligen band 9 och 10 (F-H). Nu återstår bara de första åtta banden.
Vi har fått in fler indexeringsbidrag, som ännu inte är omhändertagna,
och även korrekturläsning av Eichhorns konsthistoria och Hofbergs
biografiska handlexikon. Högarna av inkomna bidrag växer och endera
dagen blir redaktionen (vem? jag!?) tvungna att ta hand om dem.
Ugglan - http://runeberg.org/nf/
Hofberg - http://runeberg.org/sbh/
Eichhorn - http://runeberg.org/bildhist/
Nu börjar vi också tigga pengar. En del saker som går långsamt för
oss, skulle underlättas av pengar. Det gäller den maskinella
inscanningen och en del redaktionssysslor. Vi kan aldrig ersätta
våra frivilliga hjältar, men vi kanske kan uppmuntra dem genom att
svara i tid och ge dem någon present emellanåt. För att få medel till
detta, tar vi emot sponsring som knyts till de böcker vi har
digitaliserat. Helt enkelt tio kronor per boksida i utbyte mot
diskret omnämnande på webben. Det är samma pris för alla, men den som
är generös kan sponsra en tjockare bok. På översiktssidan för ugglan
finns nu en "sponsor"-kolumn i tabellen över vem som gjort vad för
varje band. Lite mer om våra sponsorer syns på
http://runeberg.org/admin/sponsors.html
Eichhorn är 194 sidor, Hofberg är 634 + 817 sidor och varje band av
Nordisk familjebok är cirka 800 sidor. Det har tagit oss flera år att
få dessa inscannade och OCR:ade. Att leja ut den maskinella delen av
arbetet kostar idag högst 3 kronor per boksida. Om man ska betala
timlön för de manuella momenten indexering och korrekturläsning,
kostar det däremot 50 kronor per boksida. Genom att begära 10 kronor
per boksida i sponsring kan vi täcka kostnaden för den maskinella
inläsningen, fortsätta att utveckla projektet med våra ideella
medhjälpare, och få lite pengar över till nya projekt. Varje sponsor
väljer givetvis vilket verk de vill stödja.
--
Lars Aronsson (lars(a)aronsson.se)
Projekt Runeberg - ditt digitala bibliotek - http://runeberg.org/
Vänner av Projekt Runeberg,
nedan följer en återutsändning av den allra första utåtriktade
annonseringen av Projekt Runeberg, som gjordes idag för tio år sedan.
Den kommer först på svenska, därunder på engelska. Vi räknar
projektets start från december 1992, men det blev känt i vidare
kretsar först 6 mars 1993. Av de gamla adresserna är det idag bara
min e-postadress som fortfarande fungerar. Mer information om
projektets historia finns på http://runeberg.org/admin/timeline.html
Lars Aronsson.
--
PROJEKT RUNEBERG - Nordisk litteratur på nätet sedan 1992
www.runeberg.org - redaktion(a)runeberg.org
Datum 6 mars 1993
Från Lars Aronsson <aronsson(a)lysator.liu.se>
Datorföreningen Lysator, Universitetet i Linköping
Till swnet.svenska, swnet.general,
Mötet i Lysators KOM: Litteratur och författare
På flera ställen i USA arbetas det på att scanna in skönlitterära verk
för att göra dem allmänt tillgängliga som ASCII-filer via anonym FTP
eller Gopher. Jag tycker det är synd och skam att enbart engelska
texter (som Shakespeare, King James' Bible och Alice i underlandet)
blir tillgängliga på det här viset och därför har jag börjat samla
svenska texter. Som arbetsnamn för denna hobby har jag valt:
-------
P R O J E K T R U N E B E R G
Tillkännagivande
(This announcement is also available in English)
PROJEKT RUNEBERG är ett Lysatorprojekt på initiativ av Lars Aronsson
<aronsson(a)lysator.liu.se>. Lysator är en datorförening för studenter
och anställda vid Universitetet och tekniska högskolan i Linköping.
Postadressen är Lysator, c/o Institutionen för Systemteknik,
Universitetet, 581 83 Linköping. Lysator har postgiro 88 56 69-2.
SYFTET med projektet är att fritt tillhandahålla litterära och
konstnärliga verk på skandinaviska språk i datorläsbar form. Detta
görs efter förebild av det Project Gutenberg som drivs av professor
Michael S Hart vid Illinois Benedictine College i Lisle, Illinois,
USA.
SITT NAMN har projektet lånat av den finlandssvenske författaren Johan
Ludvig Runeberg, vars Fänrik Ståls sägner är det första kompletta verk
projektet ger ut. Namnet är dessutom valt för att skapa associationer
till Project Gutenberg. De båda projekten drivs emellertid helt
oberoende av varandra.
DEN LAGLIGA GRUNDEN för Projekt Runeberg består i att upphovsrätten
aldrig gäller längre än 51 år efter en upphovsmans död. Se 43 och 44
paragraferna i lagen om upphovsrätt till litterära och konstnärliga
verk (Svensk författningssamling 1960:729, 1970:488). Det innebär att
offentliggjorda verk av bland andra August Strindberg och Selma
Lagerlöf är fria för envar att återge. Liknande lagar finns i andra
länder som ingår i Bernunionen.
SPRÅKET för de texter som hittills givits ut är svenska, men projektet
syftar även till att ge ut texter på norska, danska, isländska,
färiska och dialekter av dessa språk. Administrativa texter (som
denna) skrivs vanligen på engelska. Även bildverk, kartor, lagar och
noter kan komma i fråga för utgivning.
TECKENUPPSÄTTNINGEN har hittills varit ISO 8859-1, men om behov visar
sig finnas kan utgivna texter lätt omvandlas till ISO 646 (sju bitar)
och teckenuppsättningar för svenska MS-DOS och Apple Macintosh.
UTGIVNINGEN består hittills av Runebergs Fänrik Ståls sägner, mindre
stycken ur 1917 års översättning av Bibeln, ur den poetiska Eddan,
samt enstaka dikter och sånger av Carl Michael Bellman, Karin Boye,
Gustaf Fröding, Viktor Rydberg med flera.
BIDRAG till projektet mottages tacksamt i form av färdiga textfiler,
inscannade bildfiler eller textsidor, förlagor att scanna eller
korrekturläsning av utgivna texter. Projektet har inget akut behov av
utrustning, programvara eller pengar, men bidrag av dessa slag
mottages tacksamt av datorföreningen Lysator. Medhjälpare kan välja
att vara anonyma eller få sitt eget och/eller företagets namn omnämnt.
Även kommentarer och idéer är naturligtvis välkomna.
ÅTKOMST av projektets utgivning är i dag möjlig genom Gopher och
anonym FTP över SUNET, det svenska universitetsdatornätet. Gopher är
en distribuerad, menybaserad databas som i dag spänner över hela
Internet. Gopher-programvara utvecklas vid Universitetet i Minnesota.
Följande uppgifter kan behövas för åtkomst:
Gopher FTP
--------------------------------------------------------------
Host=gopher.lysator.liu.se HOST ftp.lysator.liu.se
Port=70 USER anonymous
Name=Projekt Runeberg PASS din(a)dator.post.adress
Type=1 DIR pub/texts
Path=1/project-runeberg FILE README
--------------------------------------------------------------
-------
Date 6 March 1993
From Lars Aronsson <aronsson(a)lysator.liu.se>
Lysator (the students' computer club), Linkoping University,
Linkoping, Sweden
To GUTNBERG mailing list, alt.etext, comp.infosystems.gopher,
nordunet.general, soc.culture.nordic
P R O J E C T R U N E B E R G
Announcement
(Detta tillkännagivande finns även på svenska)
PROJECT RUNEBERG is a Lysator project coordinated by Lars Aronsson
<aronsson(a)lysator.liu.se>. Lysator is a students' computer club at
Linkoping University in Linkoping, Sweden. The postal address is
Lysator, c/o Dept of Electrical Engineering, Linkoping University,
S-581 83 Linkoping, Sweden.
THE PURPOSE of this project is the free distribution of literary and
artistic works in Scandinavian languages in machine readable form.
This was inspired by Project Gutenberg, run by Professor Michael S
Hart at the Illinois Benedicte College in Lisle, Illinois, USA.
THE NAME of the project comes from the Finland-Swedish author Johan
Ludvig Runeberg, whose "Fanrik Stals sagner" is the first complete
work published by the project. The name was also chosen for its
similarity to Project Gutenberg. The two projects, however, are run
completely independent of each other.
THE LEGAL FOUNDATION for Project Runeberg is that the copyright to a
book or work of art has expired 51 years after the death of its
creator. See the 43rd and 44th paragraphs of the Swedish copyright
law (SFS 1960:729, 1970:488). This means that published works of
famous authors as August Strindberg and Selma Lagerlof are in the
public domain. Similar laws exist in other countries within the Berne
Union.
THE LANGUAGE of all texts published so far is Swedish, but the project
also intends to publish in Norwegian, Danish, Icelandic, Faroese, and
dialects of these languages. Texts for the project's administration
(as this one) are written in English. The project is not restricted
to literature, but pictures, maps, laws, and printed music might also
be published.
THE CHARACTER SET used so far has been ISO 8859-1, but if need be the
published texts can easily be converted to ISO 646 (seven bits) and
the Swedish character sets for MS-DOS and the Apple Macintosh.
THE PUBLISHED TEXTS so far include Johan Ludvig Runeberg's "Fanrik
Stals sagner", small parts of the 1917 Swedish translation of the
Bible, parts of the Edda Saemundar, and some songs and poems by Carl
Michael Bellman, Karin Boye, Gustaf Froding, Viktor Rydberg, and
others.
CONTRIBUTIONS to the project are graciously accepted in the form of
ready text files, scanned picture files or text images, printed
matters to scan, or by proofreading the published texts. The project
has no immediate need for equipment, software, or money, but these
kinds of contributions are graciously accepted by Lysator, the
students' computer club. Helpers can choose to be anonymous or to
have their own and/or their company's name mentioned. Comments and
suggestions are of course also welcome.
ACCESS to the published texts is possible by Gopher and by anonymous
FTP over the Internet. Gopher is a distributed, menu-oriented
database that today spans the entire Internet. Gopher software is
developed at the University of Minnesota. The following information
will be needed for access:
Gopher FTP
--------------------------------------------------------------
Host=gopher.lysator.liu.se HOST ftp.lysator.liu.se
Port=70 USER anonymous
Name=Project Runeberg PASS your(a)email.address
Type=1 DIR pub/texts
Path=1/project-runeberg FILE README
--------------------------------------------------------------
Runebergianer,
De senaste dagarna har några fler texter dykt upp, eller rättare sagt
faksimilutgåvor. Dels är det några fler band ur Nordisk familjebok,
dels några böcker *av* Ellen Key och *om* Fredrika Bremer, samt Frans
Michael Franzéns samlade dikter i sju band. Jag lade upp lite
information om detta i vår historik på sidan
http://www.lysator.liu.se/runeberg/admin/timeline.html
Det har också strömmat in korrekturlästa avsnitt av "De bildande
konsternas historia" samt "Svenskt biografiskt handlexikon" och mer
indexering av Nordisk familjebok, som jag varit lite dålig på att ta
hand om. Jag hoppas få tid till detta snart, och till dess vilar de
tryggt i Projekt Runebergs brevlåda.
Två delar av vårt projekt som går onödigt långsamt är maskinell
inscanning och texttolkning (OCR) av nya böcker. Det är också saker
som skulle kunna göras effektivt för pengar, om vi hade några, för att
inte tala om att de är långtråkiga. Däremot är korrekturläsning,
indexering, skrivandet av författarpresentationer och liknande av
flera orsaker mera lämpade för ett stort antal frivilliga medarbetare.
För att se om det kan finnas några pengar där ute, börjar vi nu
försöka jaga sponsorer och gåvor. För detta har jag lagt upp en
tacksida, som ännu inte är så lång
http://www.lysator.liu.se/runeberg/admin/sponsors.html
Lars Aronsson,
projektledare.
--
PROJEKT RUNEBERG - Nordisk litteratur på nätet sedan 1992
www.runeberg.org - redaktion(a)runeberg.org