Projekt Runeberg,
De av er som haft ögonen på "Recent Changes"-sidan de sista dagarna kan ha sett en del märkliga "skräptecken" susa förbi. I och med inscanningen av ett finskt uppslagsverk, "Pieni Tietosanakirja", finns nämligen ett övervägande skäl att gå utanför den teckenstandard ISO 8859-1 som Projekt Runeberg tillämpat sedan starten 1992.
Lösningen heter Unicode och närmare bestämt dess variant UTF-8. Detta gör att texter kan innehålla grekiska, ryska, arabiska, kinesiska, fonetiska och andra udda skrivtecken. Ett tydligt exempel är uttalsanvisningarna i början av det finska uppslagsverket, http://runeberg.org/pieni/1/0005.html
Övergången från ISO 8859-1 till UTF-8 görs för ett verk i taget. I skrivande stund är det enbart verken /pieni/ och /geodet/ som omfattas, samt sidan "Recent Changes". Hittills kan det betraktas som ett experiment och jag tar gärna emot förslag på ytterligare verk där det finns behov och där vi kan prova ut tekniken innan vi inleder en övergång i större skala.
I och med att UTF-8 förändrar sättet som "ä" lagras internt, så vill jag från nu avråda från att använda markeringen <spärr> för spärrad stil. I stället bör vi använda <sp> för detta. Tills vidare fungerar båda sätten att markera, så lägg ingen energi på att byta ut existerande markeringar. Men använd helst <sp> från nu.
Lars Aronsson:
I och med att UTF-8 förändrar sättet som "ä" lagras internt, så vill jag från nu avråda från att använda markeringen <spärr> för spärrad stil. I stället bör vi använda <sp> för detta.
Aproppå markering av olika textstilar. Hur markerar man kapitäler? Gör vi det över huvud taget? Om vi inte gör det skall de då återges med stora bokstäver eller med en blandnig av stora och små? Jag har i allmänhet varit lat och låtit ocr-igenkänning styra om jag ändrar till bara stora eller en blandning av stora och små bokstäver. Kapitäler är ju en rent grafisk sak. Ett stort "L" är fortfarande ett stort "L" och ett litet "ARS" är ju i någon sorts bokstavssemantisk mening små bokstäver, så man borde ju rätta det till "Lars" och möjligen markera det, så att html-koden kan ange att texten skall visas som kapitäler. (För css har väl stöd för kapitäler?)
Christer
Christer Romson skrev:
Aproppå markering av olika textstilar. Hur markerar man kapitäler?
Jag tror att det redan finns en HTML-markering <smallcaps> för kapitäler, så mycket talar för att man borde använda den. Exakt hur vi borde göra, bör styras av vad som är användbart för den som ska använda texten i nästa steg. Och HTML bör ju vara ett rimligt användningsområde för de texter vi scannar och korrekturläser. Jag inbillar mig att man skriver <smallcaps>Projekt Runeberg</smallcaps>, varvid detta alltså visas som PROJEKT RUNEBERG där P och R är fullstora bokstäver.
P.S. Min slutrad säger nu "fri nordisk litteratur" på finska, precis som rubriken på vår startsida.
-----Ursprungligt meddelande-----
Från: runeberg-bounces@lists.lysator.liu.se [mailto:runeberg-bounces@lists.lysator.liu.se] För Lars Aronsson
Skickat: den 23 februari 2005 04:19
Till: Christer Romson
Kopia: runeberg@lists.lysator.liu.se
Ämne: Re: [Runeberg] Grekiska tecken
Jag inbillar mig att man skriver <smallcaps>Projekt
Runeberg</smallcaps>, varvid detta alltså visas som PROJEKT RUNEBERG
där P och R är fullstora bokstäver.
Jag skriver ofta om fartyg, i en miljö där fartygsnamnet skall skrivas just som anges ovan: PROJEKT RUNEBERG där P och R är fullstora bokstäver, övriga 2 punkter mindre. Jag har provat <smallcaps>Projekt Runeberg</smallcaps> - på min browser, Explorer, blir det bara Projekt Runeberg.
Jag tvingas skriva E<font size="2">NKÖPING</font> (om brödtexten har size="3") eller T<span style="font-variant: small-caps">EST</span>
Någon som vet mera?
Jag:
Hur markerar man kapitäler?
Lars Aronsson:
Jag tror att det redan finns en HTML-markering <smallcaps> för kapitäler. Jag inbillar mig att man skriver <smallcaps>Projekt Runeberg</smallcaps>.
Är alltså ok att använda html generellt (som t.ex. <abbr> för forkortningar och <span lang="..."> för snuttar som är på andra språk, <blockquote> et.c. et.c.)? Så vitt jag kommer ihåg så säger korr-giuden att man bara ska använda de taggar (<i>, <b>, <spärr>, <tab>) som nämns i den och inte några andra.
Christer Romson skrev:
Är alltså ok att använda html generellt (som t.ex. <abbr> för forkortningar och <span lang="..."> för snuttar som är på andra språk, <blockquote> et.c. et.c.)? Så vitt jag kommer ihåg så säger korr-giuden att man bara ska använda de taggar (<i>, <b>, <spärr>, <tab>) som nämns i den och inte några andra.
Nej, nej, nej, nej, stopp och belägg! :-) För det första var det ett misstag av mig att hänvisa till <smallcaps> eftersom någon sådan markering inte finns i HTML. Men jag önskar att det funnes.
Det resonemang jag förde var inte att öppna dörren för HTML. Vi bör fortsätta att vara ytterst återhållsamma med mängden markeringar vi inför. Men om vi verkligen har behov av en ny sorts markering, som vi verkar ha rörande kapitäler, så är HTML ett lämpligt ställe att hämta inspiration ifrån. Om HTML har ett sätt att markera något, så vore det dumt av oss att hitta på ett annat sätt att göra samma sak.
Bilar har gaspedalen till höger, även i länder med vänstertrafik. Det finns inga tekniska krav på denna standardisering, men det gör det enklare för folk. Och det är just sådana förenklingar vi måste eftersträva i alla system och regler vi skapar.