Message: 1 Date: Tue, 03 Aug 2004 18:52:18 +0200 From: Anders Thulin ath@algonet.se To: runeberg@lists.lysator.liu.se Subject: [Runeberg] Re: How do I make sure I use ISO 8859-1
"Ingemar Olson" bio2935c@hotmail.com asks:
I would like to start proofreading but I'm stuck on the difference
between
ASCII and ISO 8859-1. For example, I am used to keying <alt-148> to
write an
ö, but the instructions ("Olika streck och andra specialtecken" på //runeberg.org/wiki/Instruktioner_för_korrekturläsare) state clearly to
NOT
use this technique.
As you say 'alt-148', the difference you are worried about is really the one between ISO 8859-1 and the character code used by your Windows system -- which probably is CP1252, which is just a superset of 8859-1. (ASCII is, as far as I understand, a 7-bit character set, related to the 7-bit ISO 646 character sets).
The difference between the two, however, is not in the 0xCO - 0xFF area, where most of the accented letters have been placed. But if you try to produce S/s or Z/z with caron, the OE/oe ligature, and y with diaeresis, and the various left and right single and double quotation marks, the different dashes, and several other special characters in the 0x80-0x9F area, it won't work.
Tack Anders
Det ser ut som om jag kan fortsätta med alt-xxx för åäö i alla fall - bara jag undviker 0x80-0x9F. Jag tänker bara jobba med svenska sidor så jag kan nog undvika de flesta 'konstiga' bokstäverna.
Det skulle vara bra om det fanns någonstans där man kunde se, och klippa ut, enstaka problematiska ISO 8859-1 bokstäver som man senare kunde sätta in i texten.
Men nu har jag en annan fråga (till vem som helst som vill svara):
Jag ser att det fins rätt så många (vad jag skulle kalla "quotation marks" på engelska). Alltså det där som ser ut som ett komma, eller snarare två kommor, och det står tryckt _mitt_ i raden. Om det hade varit lite högre så skulle jag ha kallat det "closing quotation mark" () (på engelska). Men när det står mitt i raden tycks det tolkas av OCR-programmet som ett par V (eller pilspetsar) som pekar till höger (»). Vad ska man göra med det? Ändra det till " eller låta det stå kvar som » ? Det ser ju INTE ut som pilspetsar i orginalet! Vilket är rätt?
Ingemar
_________________________________________________________________ Discover the best of the best at MSN Luxury Living. http://lexus.msn.com/
Ingemar Olson skrev:
Det ser ut som om jag kan fortsätta med alt-X för i alla fall - bara jag undviker 0x80-0x9F.
Jag vet inte att vi någonstans har avrått från användningen av ALT på det här viset. Det vi avråder ifrån är att skriva HTML-koder av typen å eller {
Det skulle vara bra om det fanns någonstans där man kunde se, och klippa ut, enstaka problematiska ISO 8859-1 bokstäver som man
När du korrekturläser har du dessa klipp-och-klisterbara tecken till höger om den stora inmatningsrutan, precis där de behövs.
Jag ser att det fins rätt så många (vad jag skulle kalla "quotation marks" på engelska). Alltså det där som ser ut som ett komma, eller snarare två kommor,
Det låter som du talar om gåsögon, som ser ut »så här». De har position 187 decimalt eller 273 oktalt i ISO 8859-1. Det finns även en ovanligare variant som pekar åt andra hållet « och har nummer 171 decimalt eller 253 oktalt. Även dessa finns klipp- och klisterbara till höger om inmatningsfältet vid korrekturläsning.