Project Runeberg,
I occasionally let my scanner rest and spend some time proofreading
texts online, like a mere mortal. :-) To some degree, I do this
because I need to see that Project Runeberg's proofreading system is
working alright, and it might give me new ideas for improvement. But
it's also a very good way to relax, almost like meditation. One can
focus on getting the text right, with no need to "think". I do it
best when I listen to instrumental music, such as Jean Michel Jarre's
records.
This time, I didn't help Project Runeberg alone, but also our
international friends. Just a few months ago, Project Gutenberg's
Distributed Proofreaders (www.pgdp.net) opened a European branch,
hosted by "Projekat Rastko" (www.rastko.net), a website originally for
Serbian literature. Rastko has been expanding primarily in the Slavic
languages, from Kashubian (spoken by 5000 people in northern Poland)
to Bulgarian, but "Distributed Proofreaders--Europe" or DP-Europe aims
to cover all European languages, including also English, Spanish,
French, Dutch, German, Danish, Swedish, and Finnish.
Rather than competition, I see DP-Europe as a neighbor, and I hope we
can learn from and help each other. I hope you will join me as
volunteers for DP-Europe. At the moment, there is only one Swedish
and one Danish text on the beginners' proofreading list, but I know
you are able to help on books in other languages as well. And more
books are scanned and uploaded as time goes.
Here is how it works:
1. Go to http://dp.rastko.net/
The front page presents some news and statistics, but you cannot
really "see" any books before you register and log in. This is where
DP really differs from Project Runeberg. DP's purpose is to produce
e-texts for Project Gutenberg, while Project Runeberg is a website
where digitized books are displayed both in facsimile and text. DP is
like a factory that outputs e-texts, while Project Runeberg is more
like a shop window with products on display through all phases of
production.
2. Click "Register" in the upper right corner.
Fill in a username and a password of your choice. As always on
Internet websites, do not use the same password that you use at work
or for your most secret information. Keep in mind that the DP website
uses unencrypted HTTP (not HTTPS) and that the site is run by people
you don't know.
3. Welcome as a newbie!
Once you have registered, your newly created identity has a personal
statistics and rank based on how many pages you have proofread. Your
personal statistics is displayed to the right. Starting out at zero,
you are a "newbie". All pages have to be proofread twice, but as a
newbie you can only participate in the "first round" of proofreading.
Once you have completed 50 pages, your status is upgraded and you are
welcome to take part in second round proofreading as well.
4. Join a team
DP-Europe currently have 298 registered volunteers (the original DP
has 11,144 users). Every user can join up to three different teams,
and every time you proofread a page, a point is also given to each of
your teams. I created a team called "Project Runeberg", which I hope
that you will join. But there is also a "Team Sweden", a team for
"Basset Hound Lovers" and a team for "LOTE SF and Fantasy", which is
short for Languages-Other-Than-English Science-Fiction and Fantasy".
The abbreviation LOTE appears in other places on the website.
5. Start proofreading
On your personal starting page is a list of Proofreading Projects
(each project is a book, scroll down to see the list). Find a title
that sounds interesting and give it a try. On the project display,
click "Start proofing" and you will get a split screen with a
facsimile image and a text area with a save button underneath, very
much like Project Runeberg's proofreading function. DP uses a
slightly different markup than Project Runeberg, which is explained in
the "Proofing Guidelines". The main principle is the same: Keep the
spelling, but fix the scanning and OCR errors.
6. Preferences and Forums
Under "Preferences" you can define the size of your screen or whether
you want the screen to split vertically rather than horizontally, you
can even select which language you want for the user interface. Under
"Forums" you find discussion forums on various topics, including one
forum for each of the books being proofread. Each team of users also
have their own forum.
There is much for Project Runeberg to learn from DP and DP-Europe.
There is also much that Project Runeberg's experienced proofreaders
can bring to them, in ideas, experience and differing background. I
think I will personally use DP-Europe mostly for German books, since I
do speak German but don't want to include German literature in Project
Runeberg.
--
Lars Aronsson (lars(a)aronsson.se)
Classic Nordic Literature online since 1992 - http://runeberg.org/
Projekt Runeberg,
De senaste veckorna har scannern gått varm hemma hos undertecknad och
resultatet är att drygt elva tusen sidor av "Samlade skrifter av
August Strindberg" (Bonniers utgåva från 1912-1921) har fogats till
våra samlingar. En del av titlarna (bland annat Fröken Julie och Till
Damaskus) är dubbleringar av sådant som vi hade tidigare, endera som
e-text eller som faksimil av andra förlagor.
Den insatte tycker kanske att det är galet att digitalisera Bonniers
gamla "Samlade skrifter" (1912) nu när "Nationalupplagan" (1981)
finns. Det tycker egentligen jag också, men eftersom Norstedts vägrar
lägga ut Nationalupplagan gratis på nätet, så får man gå framåt där
man kan. Och även om Norstedts skulle ändra sig i morgon, så skadar
det ju inte att ha båda upplagorna sida vid sida.
Redan till påsken för två år sedan scannades band 33, som innehåller
skådespelet Påsk, och nu har band 1-32 och 34 tillkommit. Det
återstår alltså att scanna band 35-55. Några av dessa saknar vi, och
vill gärna ta emot gåvor för att täcka luckorna. Se detaljerna i
förordet på webbsidan. Adressen höll jag på att glömma. Den är
http://runeberg.org/strindbg/
På tal om gåvor, så har vi även behov av pengar. Våra hårddiskar är
snart fulla och vi behöver också en backupserver. Tillsammans blir
det några tusenlappar och vi hoppas få lite hjälp med det.
Datorföreningen LYSATORs svenska postgiro 88 56 69-2 står öppet.
Skriv "gåva till Projekt Runeberg" i meddelandefältet, så att kassören
vet vad det rör sig om. LYSATOR är studentföreningen vid Linköpings
universitet där Projekt Runeberg har sin hemvist.
Både Strindberg och penningbehovet uppmärksammas i aprilversionen av
vår startsida, http://runeberg.org/
Där syns också våra nyheter från mars, som bara är några dagar gamla.
Mycket gott och blandat i årets påskägg!
--
Lars Aronsson (lars(a)aronsson.se)
Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/
Projekt Runeberg,
Jag sitter och läser svenska Kungliga Bibliotekets regler för
rättstavning av författarnamn, eller "auktoriserade namnformer" som
det heter. En bok kan ju vara skriven av Tjeckov, Tjechov eller
Tschechow och hur vet man egentligen att man hittar vad man söker?
Nordisk familjebok (1912) berättar om Karl von Linné med K,
Nationalencyklopedin stavar detta Carl med C, medan engelskspråkiga
källor som Wikipedia talar om Carolus Linnaeus.
För Projekt Runebergs del handlar detta om den förteckning eller
"databas" som ligger till grund för våra författarpresentationer.
Förteckningen är en textfil med namn, levnadsår, nationalitet och yrke
för i dagsläget 25000 författare, konstnärer och andra personer. Den
stavning av författarnamnen som finns i denna förteckning är den som
används i vår katalog och i sidhuvudet på författarens verk.
Nu kunde man tro att Kungliga Biblioteket har det enkelt, eftersom de
bara behöver ansluta sig till nutida svensk standard, och alltså kan
strunta i hur utlänningar brukar göra (tyskarna skriver Michail
Gorbatschow, engelsmännen Mikhail Gorbachev) och hur man gjorde förr
(ingen stavar Carl von Linné med K idag). Men just när det gäller
ryska och slaviska namn, har de svenska forskningsbiblioteken tydligen
som tradition att transkribera bokstavstroget medan folkbiblioteken
oftare använder en försvenskad stavning. Nationalencyklopedin verkar
ligga närmare folkbiblioteken och skriver Pusjkin, medan Kungliga
Biblioteket stavar den ryske nationalpoeten Puskin.
När man går in i KB:s katalog Libris webbsök och tittar på någon av de
senare årens Pusjkin-utgåvor och granskar MARC-posten, så hittar man
massvis med stavningsvarianter i fält 900, se t.ex.
http://websok.libris.kb.se/websearch/search?SEARCH_ONR=9174968
och klicka MARC uppe till höger. Här syns att den engelska tryckta
titeln stavar namnet Alexander Pushkin, men den svenska "författare: "
anger Puskin, Aleksandr Sergeevic, 1799-1837.
Nationalencyklopedin är annars en ofta anlitad referens. När man
går till http://ne.se och söker på engelska stavningen Pushkin kommer
man automatiskt rätt. Men söker man på KB:s stavning Puskin, så
undrar söksystemet om man menade Aleksandr Pusjkin eller Augustus
Pugin. Märk att NE stavar Aleksandr med ks och utan e på slutet.
Denna stavning används också av Nordisk familjebok (1915).
Nu kan det tyckas onödigt att bråka om hur ryska författare stavas.
Projekt Runeberg ska ju syssla med nordisk litteratur. Men ofta har
man nytta av att reda ut hur man ska hantera de jobbiga fallen, för då
skaffar man sig principer som håller för alla andra fall man möter.
Och inget hindrar att vi publicerar nordiska översättningar av
ryska författare. Vi har ju svenska översättningen av Bibeln.
Jag skrev idag en kort presentationssida om Aleksandr Pusjkin på
http://www.lysator.liu.se/runeberg/authors/pusjkale.html
Den säger väldigt lite om författaren, men desto mer om hans namn.
Länkarna till Wikipedia och andra källor visar hur olika hans namn kan
stavas på olika språk.
Jag lämnar frågan öppen om vi borde använda engelska eller svenska
eller kanske danska namnformer i Projekt Runebergs förteckning. För
närvarande är det nog lite blandat.
Kungliga Bibliotekets riktlinjer hittar man hos BUS -- enheten för
bibliografisk utveckling och samordning, http://www.kb.se/bus/
under rubriken "auktoriserade namnformer", http://www.kb.se/bus/namn/
--
Lars Aronsson (lars(a)aronsson.se)
Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/
Projekt Runeberg,
Från ungefär klockan 16 igår (8 februari) till ungefär klockan 16 idag
(9 februari) var vår korrekturläsning ur funktion. Nu är den tillbaks.
Vi beklagar det inträffade och hoppas det ska fungera bra framöver.
--
Lars Aronsson (lars(a)aronsson.se)
Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/
----- Vidarebefordrat meddelande från segfault(a)chello.se -----
Datum: Wed, 4 Feb 2004 14:40:44 +0100
Från: segfault(a)chello.se
Svar till: segfault(a)chello.se
Ämne: Re: Re: [Runeberg] SV: [Runeberg] Vill du hjälpa Projekt
Runeberg programmera?
Till: Ulf Härnhammar <Ulf.Harnhammar.9485(a)student.uu.se>
> \w ska ju vara den typ av tecken som förekommer i ord. Du kanske måste ställa
in
> någon miljövariabel så att \w passar in på rätt tecken? Annars kan man ju
skriva
> [A-Za-zÅÄÖÉÜåäöéü] i stället för \w.
Ursäkta om någon har svarat på detta förut, men i bash skriver du:
export LANG="sv_SE"
och i perl programmet:
use locale;
då komemr åäö att fungera
----- Slut på vidarebefordrat meddelande -----
--
Ulf Härnhammar
student, Uppsala universitet
redaktör, idiosynkratisk ( http://labben.abm.uu.se/~ulha9485/idiosynkratisk/ )
Ett sådant program finns redan, men skulle behöva förbättringar för att fungera bra med svenska regler. Själv använder jag mig utav en kraftigt nerbantad variant
Steves GUI:
http://mywebpages.comcast.net/thundergnat/guiprep.html
Mitt fulhack:
http://bok.nu/~erik/dl/pgdp_hyphen.tar
Jag tror säkert att ni kan förbättra detta mycket och kanske ge Steve förbättringarna så att de kan köras in i programmet, eftersom 200 böcker/månad använder detta program så är ju alla förbättringar varmt välkomna.
Ursäkta att jag inte har mailat här innan, men läser inte ofta här.
MvH Erik Johansson
Project Runeberg,
On Feburary 5, we celebrate the 200th anniversary of the birth of
Johan Ludvig Runeberg. Project Runeberg's front page has been updated
to remind everybody about this, http://runeberg.org/
If you live in Finland, where "J.L." has the status of national poet,
you can buy "Runeberg's cupcakes", a special kind of pastry at cafes.
If you cannot get this, I suggest you try to find the some replacement
cake or cookies, and have a look at the official celebration website
at http://www.runeberg.net/
Or you can bake your own. Here is the recipe in English,
http://www.dlc.fi/~marianna/gourmet/15_21.htm
--
Lars Aronsson (lars(a)aronsson.se)
Project Runeberg - free Nordic literature - http://runeberg.org/
Projekt Runeberg,
Redan nu verkar den nya servern vara igång. Det kan ta några timmar
innan DNS-systemet* hinner uppdateras. Om man inte får något svar på
www.lysator... så kan man prova att ändra i adressfältet till
sherman.lysator... i stället, t.ex.
http://sherman.lysator.liu.se/runeberg/muslex/0017.html
Detta gäller alltså om man nödvändigt måste titta på en sida idag.
Ändra **inte** länkarna till "sherman" i några webbsidor.
Korrekturläsning, "Recent changes" och liknande som drivs av scripts,
fungerar för närvarande inte, men kommer förhoppningsvis igång snart.
*) DNS eller Domain Name System är Internets infrastruktur för
översättning av domännamn (www.lysator.liu.se) till numeriska
IP-adresser (130.236.254.42). Hittills har "www.lysator" översatts
till Lenins adress (...25) och nu ändras detta till Sherman (...42).
Det tar emellertid några timmar (eller dygn) innan en sådan ändring
hinner slå igenom överallt. Varje Internet-operatör har sin egen
kopia av delar av översättningsdatabasen, som uppdateras med en viss
eftersläpning.
Frågan är nu om vi måste bygga ett mausoleum när Lenin dödförklaras...
--
Lars Aronsson (lars(a)aronsson.se)
Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/
Projekt Runeberg,
English summary below.
Idag söndag 1 februari skall Lysator byta webbserver. Detta kan
innebära att Projekt Runeberg (www.lysator.liu.se/runeberg) kan vara
otillgängligt under en tid och att vissa "scripts" (t.ex.
korrekturläsning) kan sluta fungera.
Bytet har varit planerat en längre tid, men fördröjts av olika skäl.
Nu har den gamla servern ("Lenin") emellertid fått hårdvaruproblem,
varför bytet till Lysators nya server ("Sherman") påskyndas.
Projekt Runebergs wiki (http://runeberg.org/wiki/) påverkas inte av
ändringen. Wikin kör nämligen redan på Projekt Runebergs egen server
("Fatabur"), dit vi kommer att flytta hela vårt projekt. Det handlar
alltså om två olika flyttar.
ENGLISH SUMMARY: Project Runeberg expects web server problems today,
Sunday February 1, and possibly the next few days. Scripts such as
the one for proofreading might stop to work, and the whole website
might be unavailable at times. This is because a long planned move
from one webserver ("Lenin") to another ("Sherman") has been speeded
up because of hardware problems. Project Runeberg's wiki
(http://runeberg.org/wiki/) is not affected by this, since it runs on
Project Runeberg's own new server ("Fatabur"), to which we hope to
move our entire project in the near future.
--
Lars Aronsson (lars(a)aronsson.se)
Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/