Jag är intresserad av "Ugglan" och har läst "Hur man korrekturläser" ett antal gånger fram och tillbaka. Ett antal frågor/kommentarer och förslag har utkristalliserats. De är många men titta på dem ändå. De skulle underlätta (utom 4) för redaktionen och ändå inte öka editeringstiden med mer än någon promille.
1. Gåsögon. Längst ner på http://www.lysator.liu.se/runeberg/nfag/0011.html används ett "lågt citat" för dito-symbol. Dito går bara att använda i tabeller och uppräkningar. Vanligtvis skriver man ju nåt i stil med -||- , dvs inte ett speciellt tecken. Kan gåsögon användas för dito? ("citerad text där citerad text inte citeras"?)
2. Tabeller och tabell-liknande text (längst ner på http://www.lysator.liu.se/runeberg/nfag/0011.html). När tabeller flyttas till HTML är det enkelt om tabellen är "förberedd" tex med <tab> mellan varje kolumn (inkl de tomma). Förslag: tabellrad inleds med <tbr> och <tbk> mellan kolumnerna, kanske avslutande </tbr>. tabell-liknande rad med <tlr> och <tlk> etc
Även metrik/läsanvisningar kan betraktas som en tvåspaltig tabell och det synsättet ger inga problem vid konverteringen till HTML. Pre-editerings-HTML skulle kunna presentera som nu: nytt stycke för <Bir.>.
3. Inför införandet av unicode Främmande alfabeten borde inte translitteras då tex grekiska eta och epsilon blir båda e, = förstörelse av data. Märk istället de (ytterst sällsynt förekommande) orden med <grk>grekiska</grk> <heb>hebreiska</heb> <kyr>kyrilliska</kyr> <run>runor</run> etc
Specialtecken som <pund> och <skålpund> skulle kunna få vara sina egna taggar och senare konverteras till tex det kursiverade lb. för skålpund (finns i unicode?). Ett skript skulle kunna samla ihop de sidor som innehåller en viss tagg för en enda unicode-insats: sammanlagda mängden icke-redan-translitterade grekiska ord är bara ett A4.
Kvadrat som speciellt tecken har jag inte sett. Betydelse?
4. Märkning av sakfel. När dumheter i texten beror på att författaren skrivit fel (stavfel, slarvfel - särskilt årtal), eller när sättaren läst fel (slarvfel), "skrivit" fel på kända ord (slarvfel, stavfel) eller satt fel (sättningsfel - gärna årtal), bör slarvfelet rättas till, de talar ju bara om författarens/sättarens/sättningskastens egenheter och problem och kan i bästa fall bara ge kuriösa statistiska data.
Äkta sakfel ska stå kvar men skulle kunna märkas med <kommentar>Sardinien ingick inte i koalitionen förrän 1713</kommentar> som sen inte syns på pre-editeringssidorna men kan vara med i slutresultatet. Hit hör tex INTE idag felaktiska latinska namn eller resultat av nutida upptäckter, bara de uppgifter som inte stämmer med det de visste DÅ. Att hitta äkta sakfel kräver en oerhörd sakkunskap (och vetenskapliga referenser) men ibland editeras ju sidorna av experter (här har jag inga anspråk).
5. "The whole page is OK now" Det skulle kännas bättre om min färdigediterade sida tittas igenom minst en gång till, gärna två. Något fel slinker alltid förbi och det finns säkert de med hökögon som finner ett nöje att rätta texter som både OCR och editeringsproffs misslyckats med. "The whole page is really OK now". "The whole page is really, really OK now".
6. Författarsignatur <sign>P. W.</sign> gör det onödigt att sätta en massa mellanslag mellan textslutet och signaturen. De blir dessutom sökbara (sen). <s> är kortare och bättre?
Förresten, i månadssammanställningar står editör-signaturer. Var kommer de ifrån? Man knappar ju bara in e-postadressen. Skrivs den i Comment? Ett förslag i så fall: en cookie med signaturen (jobbigt för dem för dem med flera alter egon :)
7. Editering i praktiken Jag har brukat kopiera texten-att-editera, (med förnuft) stavningsrätta den i Word, kopiera och klistra in i editeringsrutan.
Bläddraren (the browser) hanterar sin teckentabell och KAN konvertera det kopierade. Operativprogrammet konverterar (ganska säkert) det kopierade. Word konverterar det kopierade (och hittar på en mängd dumheter om de "smarta" funktionerna inte är desarmerade). Operativprogrammet konverterar... Bläddraren konverterar...
Alla dessa konverteringar löper amok med radbrytningarna och de radbrytningar som kommer tillbaka till rutan bör väl inte vara de som startades med? Jag förutser senare problem och föreslår deklaration av den återvändande texten: en hemsida kan ge analyser av dina retursidor och ge dig en cookie som deklarerar dina returer i fortsättningen. Om man byter ascii-tabell, språkkodning och tangentbord varje timme blir det förstås problem :) Observera att problemet för åäö är betydligt större.
Nu kan jag förstås hittat på en lösning till ett problem som inte finns (IT-världens affäridé :) Det kanske bara behövs som en diagnos för väldigt udda hård- & mjukvarukombinationer.
Hur kommer Unicode 8 att påverka detta? Inga (?) operativsystem och få ordbehandlare kan hantera Unicode.
8. Alla nya fina taggar? På varje <skålpund> går det säkert 1000 <i> = liten arbetsinsats, och om man vill byta till skålpund är det OMÖJLIGT att sedan hitta alla nya skålpund som varit ett tecken - utan minskad arbetsinsats. Det är enkelt att senare automatiskt ändra oönskade taggar, tex för pre-editeringssidan, med perl-skript. Nya taggar måste förstås väljas så att de inte krockar med HTML, XML etc.
mvh, bob