Projekt Runeberg,
(This messsage is in Swedish only, introducing the Wikisource.org project of the Wikimedia Foundation.)
Den 15 januari är det sju år sedan Wikipedia grundades, vilket firas som den internationella Wikipedia-dagen. Under sin sjuåriga tillvaro har detta försök att skapa en fri encyklopedi hunnit med en enorm utveckling, både i innehåll, deltagarskap och regelverk.
Någon resebyrå brukade annonsera: "Christofer Columbus upptäckte Amerika 1492. Nu är det din tur". Detta är en lek med ordet "upptäckte", som ju även kan ha en subjektiv betydelse. Vi kan alla upptäcka Amerika. Och Columbus var ju inte alls den förste.
Många upptäcker Wikipedia av en slump när de söker något med Google eller andra söktjänster. Nästa steg är att lära sig förstå att Wikipedia är en encyklopedi där man kan hitta all möjlig information. Därefter kommer upptäckten att denna encyklopedi författas av frivilliga som du och jag, och att vi kan hjälpa till. Många kommer dock inte längre än hit, utan tror att en databas som alla kan skriva i måste bli till ett klotterplank, som ingen törs lita på.
Inget kunde vara mer fel. Wikipedia har inte bara många skribenter, utan också många granskare och övervakare. Även om det givetvis förekommer fel, som ibland inte upptäcks i tid, så finns det också många försök till klotter och missbruk som rättas till snabbare än man hinner säga flaska. Men ibland kan det vara svårt att avgöra vad som är klotter och vad som är konstruktivt. Man vill inte att detta ska bli ett subjektivt avgörande, och därför har "wikipedianerna" inte bara skrivit uppslagsartiklar utan även regler för sitt arbete. Dessa regler förfinas över tiden. Den kanske mest "störande" regeln är kravet på notabilitet som säger att artiklarna i Wikipedia inte får handla om alltför perifera begrepp. Även om en idealist anser att "min klasskompis Sven har pallat äpplen på rasten" är en saklig upplysning som borde komma alla till del, så faller detta "bidrag" till encyklopedin på att klasskompisen Sven inte "platsar", hans existens och bravader har inte tillräckligt allmänintresse. Därför avfärdas sådana "bidrag" som klotter.
Men det finns även en rad regler som slår fast vad Wikipedia inte är. Wikipedia är till exempel inte en ordbok. Den som vill bidra med en förklaring om att "skadeglädje" är ett lånord från tyska Schadenfreude får inte göra detta i Wikipedia, eftersom det hör hemma i en ordbok och inte i en encyklopedi. För att nu inte döda entusiasmen, har Wikipedia knoppat av ett projekt som heter Wiktionary, den fria ordboken. Namnet är givetvis en ordlek med Wiki och Dictionary, som ju betyder ordbok. I stället för "det där får du inte skriva", hänvisar man "det där får du skriva i Wiktionary, men inte i Wikipedia". Wiktionary grundades i december 2002, strax innan Wikipedia fyllde två år.
En annan gång ska jag berätta mer om Wiktionary, men inte just nu. Här kan man läsa mer om regelverket för Wikipedia:
Vad Wikipedia inte är, http://sv.wikipedia.org/wiki/WP:INTE
What Wikipedia is not, http://en.wikipedia.org/wiki/WP:NOT
Ännu en regel säger att Wikipedia inte är en samling av källtexter. Wikipedia har en artikel om "Röda rummet" som berättar att romanen skrevs av August Strindberg och utkom 1879 och även kort sammanfattar handlingen. Men själva texten till romanen får man inte lägga in i Wikipedia, trots att den är fri från upphovsrätt, för det går utanför syftet med en encyklopedi.
Nu finns ju diverse projekt för fria e-texter, till exempel Projekt Runeberg för nordiska texter och Project Gutenberg för alla tänkbara språk. Men inte desto mindre hade en del idealister under Wikipedias första år börjat lägga in sådana texter på nytt. Och när man kom på att detta var o-encyklopediskt, var skulle man då göra av innehållet? Wikitekniken erbjöd faktiskt en del fördelar som åtminstone Project Gutenberg inte kunde motsvara. Den logiska konsekvensen var att starta ett eget sidoprojekt för publicering av äldre källtexter, source texts. Detta var i november 2003. Namnet som länge var på förslag var Project Sourceberg, som anspelar på Gutenberg. Logotypen är ett isberg, vilket anspelar på detta äldre namn. Men till slut stannade man för namnet Wikisource. Detta slogs fast i december 2003. Wikisource har alltså nyligen fyllt fyra år, vilket gör det elva år yngre än Projekt Runeberg.
Länge led Wikisource (och även Wiktionary) av att ha startat som en avskrädeshög för material som inte platsade i Wikipedia. De har haft svårt att hitta sin egen profil och kämpar väl fortfarande med detta. Många av barnsjukdomarna från Projekt Runebergs första år upprepas också inom Wikisource, t.ex. att man glatt knappar in en text utan att dokumentera vilken utgåva eller textversion man återger. Värdet som "källtext" minskas av detta. Men den hanteringen blir gradvis bättre och striktare med tiden.
Wikisource har med tiden förgrenat sig till många språk, bland annat finska, svenska, norska (bokmål), danska och färöiska, dock ännu inte nynorska och inte isländska.
På svenska Wikisource hittar man bland annat Röda rummet och Bibeln av år 1917, där texterna har kopierats från Projekt Runeberg. Romanen har en wiki-sida per kapitel (totalt 31 wikisidor) och Bibeln har en wiki-sida per bok (totalt 67 sidor). Men även Karl XII:s Bibel har man börjat lägga in. Och även flera andra böcker som inte finns i Projekt Runeberg.
Totalt består svenska Wikisource av 2311 wikisidor, men jag vet inte hur många böcker eller boksidor detta motsvarar. Om man gissar att böckerna har 30 wikisidor (kapitel) vardera, så skulle det bli 77 böcker. Finska är lite större med 3692 wikisidor, danska och norska har 500 vardera. Tillsammans utgör alltså de nordiska språken inom Wikisource en icke obetydlig samling av fria nordiska e-texter, som bara delvis överlappar med Projekt Runeberg.
Internationell översikt, http://wikisource.org/ Svenska, http://sv.wikisource.org/ Finska, http://fi.wikisource.org/ Norska, http://no.wikisource.org/ Danska, http://da.wikisource.org/
Den avgörande förändringen för Projekt Runeberg var 1998 när vi började scanna bilder av boksidorna, våra så kallade digitala faksimilutgåvor, så att det blev möjligt att korrekturläsa på webben utan att ha den fysiska boken framför sig. Några ledande wikipedianer och wikisource-medhjälpare -- i Tyskland -- hade ögon för detta och beklagade att Projekt Runeberg var begränsat till nordiska språk. Kunde jag tänka mig att frisläppa programvaran?
Jag är förvisso en vän av fri programvara, men ärligt talat består Projekt Runeberg av ett krångligt skatbo av program som vuxit fram under mer än ett decennium. Programkoden är inte skriven för att publiceras, och för att kunna återanvändas av andra skulle det bli tvunget att skriva om stora delar. Jag träffade de tyska wikipedianerna (Jakob Voß, Magnus Manske, Patrick Danowski) på Wikimania 2005, den internationella Wikipedia-konferensen, som hölls i Frankfurt am Main och vi diskuterade problemet. Min slutsats var att det var enklare att ändra programvaran Mediawiki (som används för Wikipedia, och som Magnus Manske har skrivit) än att putsa upp Projekt Runebergs programvara.
Som pilotprojekt gick jag hem och scannade in två uppslagsböcker där upphovsrätten hade gått ut, ett på tyska och ett på engelska. Enligt metodiken från Projekt Runeberg scannade jag bilder av boksidorna och körde sedan OCR på dem. Alltsammans laddade jag sedan upp på tyska respektive engelska Wikisource, där jag efter bästa förmåga utformade sidorna så att det liknade strukturen i Projekt Runeberg. Detta var i oktober 2005, när Wikisource var två år gammalt. Jag skrev även en lista över förslag på hur programvaran Mediawiki kunde utökas och förbättras för att underlätta ett sådant arbete.
Man kan säga att samma omvandling som jag införde i Projekt Runeberg hösten 1998 upprepade jag sju år senare inom Wikisource. Detta är nu två år sedan. Metoden har slagit rot och spritt sig till franska och italienska Wikisource. Tyska Wikisource har nyligen antagit som regel att inget får publiceras utan inscannade bilder av boksidorna. En speciell programmodul "ProofreadPage" till Mediawiki gör att det hela liknar Projekt Runebergs system för korrekturläsning av digitala faksimilutgåvor.
Enligt den tillgängliga statistiken har franska Wikisource blivit ledande i användning av metoden med 40.800 inscannade boksidor, varav 5700 blivit korrekturlästa. God tvåa är tyska Wikisource med 18.000 boksidor och 4200 korrade, men jag misstänker att de i själva verket har gjort mer som dock inte syns i statistiken än. Engelska har 4900 sidor och italienska 900. Inom de nordiska språken av Wikisource har metoden ännu inte börjat tillämpas.
Detta är en imponerande utveckling på två år. Och inget hindrar att metoden sprider sig till ännu fler språk. Min egen insats var minimal: 2516 inscannade sidor på engelska, 443 sidor på tyska och inte en rad programkod. Däremot lite inspiration i rättan tid.
Siffrorna ska jämföras med att Projekt Runeberg sedan 1998 har scannat (och fotograferat) 470.000 boksidor i digital faksimil, varav Nordisk familjebok utgör 45.000 sidor. Men Projekt Runeberg är och förblir begränsat till det nordiska kulturområdet, och vår programvara är fortfarande samma skatbo. Men idéerna har ömsat skinn och lever vidare inom ett växande antal språk på Wikisource.
Statistik över antalet sidor, http://wikisource.org/wiki/Wikisource:ProofreadPage_Statistics
Programmodulen, http://www.mediawiki.org/wiki/Extension:Proofread_Page
Mitt ursprungliga förslag, http://meta.wikimedia.org/wiki/User:LA2/Digitizing_books_with_MediaWiki
Mitt tyska pilotprojekt, Meyers Blitz-Lexikon (1932), http://de.wikisource.org/wiki/Meyers_Blitz-Lexikon
Mitt engelska pilotprojekt, New Student's Reference Work (1914), http://en.wikisource.org/wiki/The_New_Student%27s_Reference_Work
Fortfarande har Projekt Runebergs tekniska lösning en del finesser som Wikisource saknar. Men det fyråriga Wikisource har ju bara hållit på med faksimilutgåvor i två år, så de har väl framtiden för sig. Det vore skoj om fler ville prova på båda projekten, kanske jobba lite i Projekt Runeberg och lite i Wikisource, för att kunna skaffa bredare erfarenheter som med tiden kan komma båda projekten till del.