Lars Aronsson wrote:
Anders Thulin wrote:
Jag är smått frestad att se hur väl FineReader klarar denna upplösningen ... blir resultatet hyfsat bra så kan väl vara användbart.
Det vore mycket intressant att veta. Går det att koppla egna stavningsordlistor till den aktuella versionen av FineReader?
Det verkar som bästa sättet att göra det är att:
a) Definiera ett nytt språk ('Svenska - gammalstafning') baserat på standardsvenska. b) Redigera teckentabellen till detts språk (dvs. inga $ eller #, men med litet fler vokaler med akut och grav accent, t.ex) c) Sedan koppla ordlista till detta
Vi har
ju en hel del "jernvägar" och "hvarför" i våra texter. Vi kan relativt lätt skapa en ordlista om bara formatet är känt.
Har inte gjort några detaljtester men formatet verkar vara .txt (normal eller Unicode). Sedan finns det något .PMD som inte finns beskrivet i dokumentationen (Portable Morphological Dictionary sägs det vara -- verkar vara standardformatet på FRs användarlexikon). Sedan påstås Word .dic fungera också ...
Inga problem heller att få separata .htm-filer för varje sida, verkar det.