Åke Broxvall skrev:
via "Återvänd till originalsidan", där den OCR:ade utskriften återges med en proportionell font (Arial ?) så blir tabellerna snedvridna.
Om din webbläsare visar OCR-texten med proportionell font (dvs där ett m är bredare än ett i), så har du nog råkat göra någon märklig inställning. Vi omringar OCR-texten med HTML-taggen <pre>, vilket brukar återges som skrivmaskinstext (där m och i är lika breda). Tabellen på sidan http://runeberg.org/svkemtid/1889/0003.html ser jättefin ut när jag tittar på den.
Någon gång i framtiden kan det hända att vi utökar våra program till att omfatta uppmärkning av tabeller och matematiska formler, kanske på det vis som Wikipedia gör. Ett komplicerat exempel syns på sidan http://sv.wikipedia.org/wiki/Binomialsatsen Klicka "redigera" för att se hur detta skrivs i Wikipedias språk. Men idag stödjer Projekt Runeberg alltså inte detta avancerade formelspråk.
Att vi hittills har satsat på enkelhet är ett uttryck för filosofin att vi ändå bara levererar ett halvfabrikat, oavsett om det är rå OCR-text eller korrekturläst OCR-text. Det står ju var och en fritt att återanvända och vidareförädla vår produkt i andra sammanhang, t.ex. för tryckning eller användning i artiklar i Wikipedia, och då kan man göra de anpassningar som krävs i typografin.
Kemikontorets skrifter har varit betydligt mer givande än vad jag hade trott: Jag visste t ex inte att odlingen av raps, sockerbetor m m var praktiskt taget obefintlig i Sverige innan deras rekommendationer lades fram.
Intressant!