Projekt Runeberg,
På http://runeberg.org/wiki/Google_Print finns en växande lista över äldre svenska, norska och danska böcker som finns sökbara i Google Print. Hjälp gärna till att utöka listan!
Det är snart ett år sedan sökmotorn Google tillkännagav att de under namnet "Google Print" tänkte börja scanna böcker, både nya och gamla. Målsättningen var att scanna 15 miljoner böcker på tio år och göra dem sökbara. Jag har inte sett några siffror på hur långt de har kommit, men den som provar boksökningen på http://print.google.com/ kan se att det redan är rätt mycket. En sökning på "they" ger träff i 67 miljoner boksidor och då måste det ju finnas minst så många i samlingen, motsvarande flera hundra tusen böcker. Prova själv, http://google.com/print?q=they
De böcker som vill komma med har två ingångar. Dels kan förlagen skicka in böcker på frivillig basis, vilket kallas "Publisher Program". Dels finns ett samarbete med några utvalda bibliotek, främst University of Michigan, vilket kallas "Library Project". Om man har en favoritbok som man vill göra sökbar, kan det alltså löna sig att skicka ett exemplar till University of Michigan.
Den som söker i Google Print efter "Linköping" får träff i 750 boksidor, främst ur doktorsavhandlingar från Linköpings universitet, http://google.com/print?q=link%C3%B6ping Men sökning på Linkoping (utan prickar) ger 4100 träffar. Hanteringen av ÅÄÖ verkar inte helt perfekt.
Enstaka böcker är på svenska och andra nordiska språk. Det beror inte på att Google har kommit till Sverige, utan på att biblioteket i Michigan har böcker på många språk. Google Print verkar scanna det mesta utan urskiljning. Ibland är det ett enstaka band ur ett flerbandsverk eller en enstaka årgång av någon tidskrift. Ibland är det en bok på något annat språk eller från någon annan tid. För att hitta de ovanliga kategorierna, måste man fundera ut en sökfråga som är unik för dem.
Genom att söka på gammalstafvade eller ålderdomliga ord har jag börjat sammanställa en lista över äldre svenska, danska och norska böcker i Google Print, http://runeberg.org/wiki/Google_Print Listan ligger på Projekt Runebergs wiki, så alla kan hjälpa till att utvidga den.
Många av dem är fria från upphovsrätt. Men av försiktighet låter Google oss inte läsa hela böckerna, utan visar bara fragment runt varje sökträff. Undantaget är böcker som är äldre än 1865. Av sådana har jag bara hittat fyra på svenska. Av Carl Michael Bellmans Samlade skrifter har första bandet av en godtköpsupplaga från 1879 scannats och av denna får man bara se fragment.
Det är ett enormt arbete som Google lägger ner på inscanning och ännu är man bara på första året. Fokus ligger än så länge på engelskspråkig litteratur och det nordiska inslaget är obetydligt. Man får inte en enda träff på "trångboddhet" eller "spiksmide".