Hej!
2005-03-19 kl. 14.43 skrev Lars Aronsson:
Hans skrev:
fre 2005-03-18 klockan 22.11 skrev Lars Aronsson:
Bry sig ska man definitivt och scriptet fungerar när det får rätt sorts filer, men något har blivit fel i versionen du skickade.
Radbrytningarna i OCR-textfilerna (jmf. http://runeberg.org/naturoch/gotaland/0012.html) blev så här:
Ja, det ser onekligen konstigt ut. Den ZIP-fil som du har laddat upp har två filkataloger, "ocr" och "hyphen", där filerna i den senare saknar radbrytningar, och så långt är allt väl. Men filerna under "ocr" har radbrytningarna på konstiga ställen, nämligen precis så som det nu ser ut på webben. Om du själv tittar på ocr/0012.txt så ser du detta.
Nu undrar jag lite vad du pratar om, faktiskt. Vad jag kan se är det bara jag som hackat på upload.pl som tar hand om uppladdade OCR-filer, och jag har aldrig skrivit kod för att hantera mer än en uppsättning filer.
Jag pratar mest om vilka filer Roger hade laddat upp och vad jag möjligen kunde göra av dem, med eller utan script. Det verkar som om hans Omnipage-program uppför sig annorlunda, så jag vet inte vilka råd jag ska ge.
Jag tittade närmare på detta och vände mig till bash-prompten för att lösa det hela... Nu blir det nästa "preussisk" radbrytning. :-) Hursomhelst, min spelar det någon roll hurvida radbrytningen är ett CR (0x0D) eller LF (0x0A) tecken?
När jag laddade upp "Naturbeskrivning Götaland" (http://runeberg.org/naturoch/gotaland/) använde jag CR-tecken.
Eller ska jag testa och ladda upp filer med LF-radbrytning på http://runeberg.org/naturoch/norrland/ för att se om det spelar roll?
Inväntar svar...
Häls Roger
2005-03-23 kl. 20.18 skrev Roger Persson:
Jag tittade närmare på detta och vände mig till bash-prompten för att lösa det hela... Nu blir det nästa "preussisk" radbrytning. :-) Hursomhelst, min spelar det någon roll hurvida radbrytningen är ett CR (0x0D) eller LF (0x0A) tecken?
När jag laddade upp "Naturbeskrivning Götaland" (http://runeberg.org/naturoch/gotaland/) använde jag CR-tecken.
Eller ska jag testa och ladda upp filer med LF-radbrytning på http://runeberg.org/naturoch/norrland/ för att se om det spelar roll?
Inte för att denna diskussion egentligen angår mig, och lite går det över min horisont. Men jag kom att tänka på att man ibland som förinställning i somliga program måste välja mellan de lite kufiska kommandona CR=CR resp CR=CR+LF. Ställer man detta fel så får man antingen oönskade blankrader, eller att rader skrivs ovanpå varandra. Om man nu i ena änden gör si, och i andra änden så, hur går det då? Kan det vara något åt det hållet som spökar i det aktuella problemet? Detta är en fundring, bara.
F ö undrar jag vad som menas med "preussisk" radbrytning. Preussisk precision och dito disciplin vet jag vad det menas med, men vad innebär det i detta sammanhang?
B L Wahlman bo.lennart.wahlman@wah.se
Hej !
2005-03-24 kl. 00.36 skrev Bo Lennart Wahlman:
F ö undrar jag vad som menas med "preussisk" radbrytning. Preussisk precision och dito disciplin vet jag vad det menas med, men vad innebär det i detta sammanhang?
Ungefär "utmärk radbrytning". Det var faktiskt i lumpen för många år sedan som jag lärde mig att marschera "preussiskt", alltså ungefär som synonym till "propert, elegant". Men det kanske bara är en lokal betydelse som används i Stockholm? :-)
/Roger