Projekt Runeberg,
De av er som haft ögonen på "Recent Changes"-sidan de sista dagarna kan ha sett en del märkliga "skräptecken" susa förbi. I och med inscanningen av ett finskt uppslagsverk, "Pieni Tietosanakirja", finns nämligen ett övervägande skäl att gå utanför den teckenstandard ISO 8859-1 som Projekt Runeberg tillämpat sedan starten 1992.
Lösningen heter Unicode och närmare bestämt dess variant UTF-8. Detta gör att texter kan innehålla grekiska, ryska, arabiska, kinesiska, fonetiska och andra udda skrivtecken. Ett tydligt exempel är uttalsanvisningarna i början av det finska uppslagsverket, http://runeberg.org/pieni/1/0005.html
Övergången från ISO 8859-1 till UTF-8 görs för ett verk i taget. I skrivande stund är det enbart verken /pieni/ och /geodet/ som omfattas, samt sidan "Recent Changes". Hittills kan det betraktas som ett experiment och jag tar gärna emot förslag på ytterligare verk där det finns behov och där vi kan prova ut tekniken innan vi inleder en övergång i större skala.
I och med att UTF-8 förändrar sättet som "ä" lagras internt, så vill jag från nu avråda från att använda markeringen <spärr> för spärrad stil. I stället bör vi använda <sp> för detta. Tills vidare fungerar båda sätten att markera, så lägg ingen energi på att byta ut existerande markeringar. Men använd helst <sp> från nu.