Hej!
Vad är vitsen att scanna in en massa böcker, när man sedan bara visar fragment?
Då är ju Maksim Mosjkovs bibliotek med böcker på ryska (och en del på engelska) intressantare, eftersom det är ett fulltextarkiv.Adressen dit www.lib.ru
Monika P
Monika Palmgren
SOLNA, Sweden
Mobile +46 709 228551
---------------------------------
Yahoo! FareChase - Search multiple travel sites in one click.
Projekt Runeberg,
På http://runeberg.org/wiki/Google_Print
finns en växande lista över äldre svenska, norska och danska
böcker som finns sökbara i Google Print. Hjälp gärna till att
utöka listan!
Det är snart ett år sedan sökmotorn Google tillkännagav att de
under namnet "Google Print" tänkte börja scanna böcker, både nya
och gamla. Målsättningen var att scanna 15 miljoner böcker på tio
år och göra dem sökbara. Jag har inte sett några siffror på hur
långt de har kommit, men den som provar boksökningen på
http://print.google.com/ kan se att det redan är rätt mycket. En
sökning på "they" ger träff i 67 miljoner boksidor och då måste
det ju finnas minst så många i samlingen, motsvarande flera hundra
tusen böcker. Prova själv, http://google.com/print?q=they
De böcker som vill komma med har två ingångar. Dels kan förlagen
skicka in böcker på frivillig basis, vilket kallas "Publisher
Program". Dels finns ett samarbete med några utvalda bibliotek,
främst University of Michigan, vilket kallas "Library Project".
Om man har en favoritbok som man vill göra sökbar, kan det alltså
löna sig att skicka ett exemplar till University of Michigan.
Den som söker i Google Print efter "Linköping" får träff i 750
boksidor, främst ur doktorsavhandlingar från Linköpings
universitet, http://google.com/print?q=link%C3%B6ping
Men sökning på Linkoping (utan prickar) ger 4100 träffar.
Hanteringen av ÅÄÖ verkar inte helt perfekt.
Enstaka böcker är på svenska och andra nordiska språk. Det beror
inte på att Google har kommit till Sverige, utan på att
biblioteket i Michigan har böcker på många språk. Google Print
verkar scanna det mesta utan urskiljning. Ibland är det ett
enstaka band ur ett flerbandsverk eller en enstaka årgång av någon
tidskrift. Ibland är det en bok på något annat språk eller från
någon annan tid. För att hitta de ovanliga kategorierna, måste
man fundera ut en sökfråga som är unik för dem.
Genom att söka på gammalstafvade eller ålderdomliga ord har jag
börjat sammanställa en lista över äldre svenska, danska och norska
böcker i Google Print, http://runeberg.org/wiki/Google_Print
Listan ligger på Projekt Runebergs wiki, så alla kan hjälpa till
att utvidga den.
Många av dem är fria från upphovsrätt. Men av försiktighet låter
Google oss inte läsa hela böckerna, utan visar bara fragment runt
varje sökträff. Undantaget är böcker som är äldre än 1865. Av
sådana har jag bara hittat fyra på svenska. Av Carl Michael
Bellmans Samlade skrifter har första bandet av en godtköpsupplaga
från 1879 scannats och av denna får man bara se fragment.
Det är ett enormt arbete som Google lägger ner på inscanning och
ännu är man bara på första året. Fokus ligger än så länge på
engelskspråkig litteratur och det nordiska inslaget är obetydligt.
Man får inte en enda träff på "trångboddhet" eller "spiksmide".
--
Lars Aronsson (lars(a)aronsson.se)
Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/
Projekt Runeberg,
Den här helgen pågår Bok- & Biblioteksmässan i Göteborg och en av
de stora händelserna var invigningen av Litteraturbanken. Detta
är en ny webbplats med klassisk svensk litteratur som drivs av en
liten redaktion vid Göteborgs universitet på uppdrag av en
styrelse med folk från Kungliga Biblioteket och Svenska Akademien.
Det var vid Akademiens högtidsdag i december 2003 som planerna
tillkännagavs och man hade då ordnat finansiering från en fond för
två års uppbyggnad. Dessa två år är nu snart till ända och man
har alltså hunnit förbereda sig väl inför den stora invigningen.
Från nyåret 2006 kommer Svenska Akademien att stå för projektet,
tillkännagav ständige sekreteraren Horace Engdahl vid invigningen.
Man hittar Litteraturbanken på http://litteraturbanken.se/
Givetvis har webbplatsen några tekniska barnsjukdomar, som
förhoppningsvis ska åtgärdas inom kort. Det vore förhastat att
avge något slutgiltigt omdöme. Och som alla levande projekt
kommer det väl fortlöpande att vidareutvecklas. Redan nu visar
Litteraturbanken en del avgjorda fördelar framför Projekt
Runeberg, som vi borde passa på att lära oss av. Den närmaste
förebilden för Litteraturbanken kan sägas vara det danska
projektet Arkiv for Dansk Litteratur (www.adl.dk).
En av barnsjukdomarna är att det är lite svårt att länka till en
viss sida. Men om man tittar direkt på en faksimilbild,
http://www.litteraturbanken.se/txtreader/txt/lb2490750/1/0004.jpeg
så ser man att man kan bläddra framåt till 0005.jpeg och om man
byter /1/ i adressen mot /2/ eller /3/ så förstoras bilden.
En elegant finess är numret 2490750 som syns i adressen. Detta är
bokens katalogpost i Libris-databasen hos Kungliga biblioteket,
http://websok.libris.kb.se/websearch/search?SEARCH_ONR=2490750
Jag var själv närvarande i publiken under invigningen i fredags,
där Horace Engdahl, Sven Lindqvist, Mats Malm, Christina Persson
och Johan Svedjedal satt på scenen. Enligt dem var det Sven
Lindqvist som kom med idén och Johan Svedjedal skrev en utredning
under 2003 som man kan läsa under "Bakgrund" på webbplatsen.
Mats Malm är föreståndare för den praktiska verksamheten, medan
övriga är ledamöter av styrelsen.
Det första som nämns på webbplatsen är att Litteraturbanken
erbjuder "svenska klassiker i pålitliga elektroniska versioner".
Ordet "pålitliga" är en halvkväden markering av avstånd mot
Projekt Runeberg. Invigningsceremonin varade i 50 minuter och det
tog 43 minuter innan någon ens vågade ta ordet Runeberg i sin mun.
Det kändes lite överspänt, ungefär som en tonåring som inte vill
kännas vid sina föräldrar. Detta intryck förstärks när man läser
Svedjedals utredning från 2003, där vi - sakligt korrekt, men föga
kärleksfullt - nämns under rubriken "Amatörprojekt".
Johan Svedjedal, som är litteraturprofessor i Uppsala, framförde
redan 1997 synpunkten att Projekt Runebergs texter inte uppfyller
litteraturvetarens strikta krav på källkontroll och textkritik.
Få personer har gjort lika stor nytta för Projekt Runeberg, för
det var hans kritik som fick mig att utveckla modellen med
faksimilbilder som vi tillämpar sedan 1998. Denna utveckling har
han missat att omnämna i utredningen inför Litteraturbanken.
Även om tonen i utredningen lagt en något frostig grund för
samarbetet mellan de båda projekten, så ser jag fram emot ett
varmare klimat och upptinade relationer mellan Litteraturbanken
och Projekt Runeberg. Det finns tillräckligt med principiella
skillnader för att vi ska kunna samexistera utan att trampa
varandra på tårna. Webben lämpar sig inte bara för litteratur,
utan också för samarbete.
Projekt Runeberg är ett folkligt amatörprojekt medan
Litteraturbanken har vetenskapliga krav och offentlig uppbackning.
Vi har uppslagsverk, facklitteratur, tidskrifter, musik och drama
vid sidan av dikter och romaner på alla nordiska språk, medan de
koncentrerar sig på svensk skönlitteratur. Vi hör hemma hos
LYSATOR, en förening grundad 1973 av några datastudenter, och de
hos Svenska Akademien, grundad 1786 av Gustav III. Vi är ett
webbprojekt med litteratur, de är ett litteraturprojekt på webben.
Som vanligt uppmanar jag alla att hålla sig informerade om och
delaktiga i alla tillgängliga projekt.
--
Lars Aronsson (lars(a)aronsson.se)
Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/