Roger Persson skrev:
- På de sidor som inte stödjer Unicode ännu, eller rent generellt, kan man inte göra så att man får specificera vilken kodning man postar i?
Teoretiskt sett skulle detta kanske kunna fungera, men vi kommer inte att göra så, eftersom vi vill begränsa oss till så få standards som möjligt. Så snabbt vi kan, ska vi gå över till Unicode över hela linjen. (Någon erfaren JavaScript-programmerare får gärna hjälpa till att felsöka de "röda bokstäverna", som jag inte får att fungera i MSIE.)
Just nu tjatar folk på mig att fortsätta med inscanningen av den danska uppslagsboken Salmonsens konversationsleksikon, men jag vill ha ordning på Unicode-rutinerna först så att alla specialtecken kan komma med från och med nästa band.
Under tiden går det bra för vem von helst att prova lite OCR. Idag finns ännu fler nyinscannade böcker att OCR-tolka än igår. Dessa har tillkommit (se "Recently published works"):
* "Tomtegubben eller Stockholms barnkalender", 1866 * "Nornan. Svensk kalender", 1891 * "Hjeltekonungen. Historisk roman från 30-åriga kriget", 1906 * "Upphemtad Dukagång", 1893 * "Natur och arbetsliv i svenska bygder", 1908-1910
Följande två är i fraktur:
* "Een kort beskriffning vppå trenne resor och peregrinationer", 1667 * "Hågkomster från Hembygden och Skolan", 1830